From 05bd8c431ce5abb7c3e0ad78313573d243c00bb6 Mon Sep 17 00:00:00 2001 From: baochong Date: Tue, 25 Nov 2025 12:58:16 +0000 Subject: [PATCH] update sigs/mindspore_core/sig-info.yaml. Signed-off-by: baochong fix format bug Archive SIGs that are no longer maintained to the archived_sigs dir mv pynative sig and heterogeneous_fusion sig to archived_sigs mv pynative sig and heterogeneous_fusion sig to archived_sigs Add my project case Add my project case Add my project case Add my project case Add my project case --- README.md | 93 +++-- .../README.en.md | 0 .../Computer Vision (CV) Suite SIG/README.md | 0 .../CulturalTourism/README.md | 154 +++---- .../CulturalTourism/docs/design-template.md | 0 .../meetings/meeting-template.md | 0 .../DeviceAdapter/README.md | 0 .../MSAdapter-SIG/README.en.md | 0 .../MSAdapter-SIG/README.md | 0 .../MedicalImaging/README.md | 108 ++--- .../MedicalImaging/docs/design-template.md | 0 .../meetings/meeting-template.md | 0 {sigs => archived_sigs}/OpenGADL/README.en.md | 0 {sigs => archived_sigs}/OpenGADL/README.md | 0 {sigs => archived_sigs}/RobotVision/README.md | 124 +++--- .../RobotVision/docs/design-template.md | 0 .../RobotVision/meetings/meeting-template.md | 0 .../TimeSequence/README.md | 118 +++--- .../TimeSequence/docs/design-template.md | 0 .../TimeSequence/meetings/meeting-template.md | 0 {sigs => archived_sigs}/XAI/README.md | 118 +++--- .../XAI/docs/design-template.md | 0 .../XAI/meetings/meeting-template.md | 0 .../adaptivetraining/README.md | 38 +- .../adaptivetraining/docs/design-template.md | 0 .../meetings/meeting-template.md | 0 {sigs => archived_sigs}/compiler/README.md | 0 {sigs => archived_sigs}/compiler/README_en.md | 0 .../docs/ME-Compiler SIG 20210610.pdf | Bin .../compiler/docs/design-template.md | 0 .../compiler/meetings/001-20200519.md | 0 .../compiler/meetings/002-20200605.md | 0 .../compiler/meetings/003-20210610.md | 114 ++--- .../compiler/meetings/004-20210810.md | 80 ++-- .../create_sig_info_template.py | 0 {sigs => archived_sigs}/data/README.md | 0 {sigs => archived_sigs}/data/README_en.md | 0 .../docs/Auto_augmentation_in_Dataset_CN.pdf | Bin ..._Implementation_of_Dataset_Operator_CN.pdf | Bin .../data/docs/MindData_Overview.pdf | 0 .../data/docs/design-template.md | 0 .../data/docs/official_resource.md | 0 .../data/meetings/001-20200402.md | 0 .../data/meetings/002-20200515.md | 0 .../data/meetings/003-20200603.md | 0 .../data/meetings/004-20200703.md | 0 .../data/meetings/005-20200805.md | 0 .../data/meetings/006-20200806.md | 0 .../data/meetings/007-20200903.md | 0 .../data/meetings/008-20201016.md | 0 .../data/meetings/009-20201104.md | 0 .../data/meetings/010-20201123.md | 0 .../data/meetings/011-20210414.md | 0 {sigs => archived_sigs}/data/sig-info.yaml | 0 .../datacompliance/README.md | 0 .../imgs/AIBOM_edit.png | Bin .../imgs/AIBOM_preview.png | Bin .../imgs/batch_datasets_uploading_1.png | Bin .../imgs/batch_datasets_uploading_2.png | Bin .../imgs/dataset_reviewer_entrance.png | Bin ...dataset_reviewer_logic_architecture_CN.png | Bin ...dataset_reviewer_logic_architecture_EN.png | Bin .../imgs/dataset_reviewer_module_intro.png | Bin .../imgs/initial_result_download.png | Bin .../imgs/initial_result_preview.png | Bin .../imgs/single_dataset_uploading.png | Bin .../user-guide-for-dataset-reviewer-CN.md | 0 .../user-guide-for-dataset-reviewer-EN.md | 0 .../dataset-reviewer/Dockerfile | 0 .../datacompliance/dataset-reviewer/LICENSE | 0 .../datacompliance/dataset-reviewer/README.md | 0 .../datacompliance/dataset-reviewer/app.py | 0 .../dataset-reviewer/k8s/deployment.yaml | 0 .../dataset-reviewer/k8s/service.yaml | 0 .../dataset-reviewer/main/__init__.py | 0 .../dataset-reviewer/main/api.py | 0 .../dataset-reviewer/main/conf/__init__.py | 0 .../main/conf/db_conf_demo.py | 0 .../main/controller/__init__.py | 0 .../main/controller/dataset_review.py | 0 .../main/data_transform_object/__init__.py | 0 .../main/data_transform_object/admin.py | 0 .../main/data_transform_object/dataset.py | 0 .../main/data_transform_object/license.py | 0 .../main/data_transform_object/user.py | 0 .../dataset-reviewer/main/model/__init__.py | 0 .../dataset-reviewer/main/model/db_models.py | 0 .../main/service/dataset_review.py | 0 .../dataset-reviewer/main/util/__init__.py | 0 .../dataset-reviewer/main/util/namespace.py | 0 .../readme_src/API-Document.png | Bin .../dataset-reviewer/readme_src/Database.png | Bin .../readme_src/hierarchical-architecture.png | Bin .../dataset-reviewer/readme_src/werkzeug1.png | Bin .../dataset-reviewer/readme_src/werkzeug2.png | Bin .../readme_src/werkzeug_vlab.png | Bin .../dataset-reviewer/requirements.txt | 0 .../datacompliance/merged_data/.keep | 0 .../datacompliance/merged_data1.json | 392 +++++++++--------- .../datacompliance/merged_data10.json | 202 ++++----- .../datacompliance/merged_data11.json | 202 ++++----- .../datacompliance/merged_data12.json | 202 ++++----- .../datacompliance/merged_data13.json | 202 ++++----- .../datacompliance/merged_data14.json | 202 ++++----- .../datacompliance/merged_data15.json | 202 ++++----- .../datacompliance/merged_data16.json | 202 ++++----- .../datacompliance/merged_data17.json | 202 ++++----- .../datacompliance/merged_data18.json | 202 ++++----- .../datacompliance/merged_data19.json | 202 ++++----- .../datacompliance/merged_data2.json | 0 .../datacompliance/merged_data20.json | 202 ++++----- .../datacompliance/merged_data21.json | 202 ++++----- .../datacompliance/merged_data22.json | 202 ++++----- .../datacompliance/merged_data23.json | 202 ++++----- .../datacompliance/merged_data24.json | 202 ++++----- .../datacompliance/merged_data25.json | 222 +++++----- .../datacompliance/merged_data3.json | 0 .../datacompliance/merged_data4.json | 202 ++++----- .../datacompliance/merged_data5.json | 202 ++++----- .../datacompliance/merged_data6.json | 202 ++++----- .../datacompliance/merged_data7.json | 202 ++++----- .../datacompliance/merged_data8.json | 0 .../datacompliance/merged_data9.json | 202 ++++----- {sigs => archived_sigs}/dx/README.md | 0 .../dx/docs/How to build a SIG or WG_cn.md | 0 .../dx/docs/How to build a SIG or WG_en.md | 0 .../dx/docs/SIG Governance_CN.md | 0 .../dx/docs/SIG Governance_EN.md | 0 .../dx/docs/design-template.md | 0 .../dx/docs/images/add_sig_issue.png | Bin .../dx/docs/images/maillist.png | Bin .../dx/docs/images/real_warrior.jpeg | Bin .../dx/docs/images/sig.jpg | Bin .../dx/docs/issue-workflow.md | 0 {sigs => archived_sigs}/dx/docs/labels.md | 0 .../dx/docs/robot_design_CN.md | 0 .../images/requirements_of_dx-bot_2021H2.png | Bin .../202104_MindSpore_issue_analysis.xlsx | Bin .../202105_MindSpore_issue_analysis.xlsx | Bin .../202106_MindSpore_issue_analysis.xlsx | Bin .../202107_MindSpore_issue_analysis.xlsx | Bin .../202108_MindSpore_issue_analysis.xlsx | Bin .../202109_MindSpore_issue_analysis.xlsx | Bin .../scripts/event_classifier.py | 0 .../scripts/issue_data_analyzer.py | 0 .../dx/meetings/001-20210309.md | 0 .../dx/meetings/002-20210323.md | 0 .../dx/meetings/003-20210407.md | 0 .../dx/meetings/004-20210427.md | 0 .../dx/meetings/005-20210511.md | 0 .../dx/meetings/006-20210624.md | 0 .../dx/meetings/007-20210713.md | 0 .../dx/meetings/008-20210727.md | 0 .../dx/meetings/009-20210907.md | 68 +-- .../dx/meetings/010-20211012.md | 0 .../dx/meetings/011-20211109.md | 0 .../dx/meetings/012-20211123.md | 0 .../dx/meetings/013-20211207.md | 0 ...\345\221\250\344\276\213\344\274\232.pptx" | Bin {sigs => archived_sigs}/dx/paper/README.md | 0 {sigs => archived_sigs}/executor/README.md | 0 {sigs => archived_sigs}/executor/README_en.md | 0 .../executor/docs/design-template.md | 0 .../executor/meetings/001-20200604.md | 0 .../executor/meetings/001-20210805.md | 70 ++-- .../executor/meetings/meeting-template.md | 0 {sigs => archived_sigs}/frontend/README.md | 0 {sigs => archived_sigs}/frontend/README_en.md | 0 .../frontend/docs/design-template.md | 0 .../frontend/meetings/001-20200516.md | 0 .../frontend/meetings/002-20200605.md | 0 .../frontend/meetings/003-20200703.md | 0 .../frontend/meetings/004-20210426.md | 0 .../frontend/meetings/meeting-template.md | 0 {sigs => archived_sigs}/graphengine/README.md | 0 .../graphengine/docs/design-template.md | 0 .../graphengine/meetings/001-20200515.md | 0 .../graphengine/meetings/002-20200731.md | 0 .../graphlearning/README.en.md | 0 .../graphlearning/README.md | 0 .../graphlearning/sig-info.yaml | 64 +-- .../heterogeneous_fusion/README.md | 0 .../heterogeneous_fusion/sig-info.yaml | 0 {sigs => archived_sigs}/mdp/README.md | 40 +- .../mdp/docs/design-template.md | 0 .../mdp/meetings/001-20210525.md | 0 .../mdp/meetings/meeting-template.md | 0 {sigs => archived_sigs}/mdp/roadmap_2021.md | 200 ++++----- {sigs => archived_sigs}/mindelec/README.md | 0 {sigs => archived_sigs}/mindelec/README_en.md | 0 .../mindelec/sig-info.yaml | 0 {sigs => archived_sigs}/mindflow/README.en.md | 0 {sigs => archived_sigs}/mindflow/README.md | 0 .../mindflow/images/mindflow_archi.png | Bin .../mindflow/images/mindflow_archi_CN.png | Bin .../images/\345\255\231\346\265\251.jpeg" | Bin ...\345\274\240\344\274\237\344\274\237.jpeg" | Bin .../images/\350\221\243\345\275\254.jpeg" | Bin .../mindquantfinance/README.en.md | 0 .../mindquantfinance/README.md | 0 .../mindspore_reinforcement/README.en.md | 0 .../mindspore_reinforcement/README.md | 0 .../images/mindspore_rl_architecture.png | Bin .../mindspore_sponge/README.md | 258 ++++++------ .../mindspore_sponge/sig-info.yaml | 0 {sigs => archived_sigs}/modelzoo/README.md | 0 {sigs => archived_sigs}/modelzoo/README_en.md | 0 .../modelzoo/docs/design-template.md | 0 .../modelzoo/meetings/001-20200516.md | 0 {sigs => archived_sigs}/mslite/README.md | 0 {sigs => archived_sigs}/mslite/README_en.md | 0 .../mslite/docs/design-template.md | 0 .../mslite/meetings/meeting-template.md | 0 {sigs => archived_sigs}/mslite/sig-info.yaml | 0 {sigs => archived_sigs}/operators/README.md | 0 .../operators/sig-info.yaml | 56 +-- {sigs => archived_sigs}/pynative/README.md | 0 .../pynative/sig-info.yaml | 0 {sigs => archived_sigs}/serving/README.md | 0 .../serving/docs/design-template.md | 0 .../serving/meetings/001-20210805.md | 0 .../serving/meetings/meeting-template.md | 0 {sigs => archived_sigs}/sig_info.yaml | 10 +- {sigs => archived_sigs}/sig_info_chinese.yaml | 10 +- .../visualization/README.md | 0 .../visualization/README_en.md | 0 .../visualization/docs/design-template.md | 0 .../visualization/meetings/001-20200515.md | 0 .../visualization/meetings/002-20200603.md | 0 .../visualization/meetings/003-20200806.md | 0 .../visualization/meetings/004-20200903.md | 0 .../visualization/meetings/005-20210113.md | 0 .../visualization/meetings/006-20210207.md | 0 .../visualization/meetings/007-20210416.md | 0 .../visualization/meetings/008-20210514.md | 0 .../visualization/meetings/009-20210810.md | 0 sigs/README.md | 62 +-- sigs/README_en.md | 74 +--- sigs/mindspore_core/sig-info.yaml | 19 +- work/README.md | 13 + work/requirements.txt | 5 + work/train_lora.py | 373 +++++++++++++++++ work/web_infer.py | 117 ++++++ 243 files changed, 3748 insertions(+), 3292 deletions(-) rename {sigs => archived_sigs}/Computer Vision (CV) Suite SIG/README.en.md (100%) rename {sigs => archived_sigs}/Computer Vision (CV) Suite SIG/README.md (100%) rename {sigs => archived_sigs}/CulturalTourism/README.md (99%) rename {sigs => archived_sigs}/CulturalTourism/docs/design-template.md (100%) rename {sigs => archived_sigs}/CulturalTourism/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/DeviceAdapter/README.md (100%) rename {sigs => archived_sigs}/MSAdapter-SIG/README.en.md (100%) rename {sigs => archived_sigs}/MSAdapter-SIG/README.md (100%) rename {sigs => archived_sigs}/MedicalImaging/README.md (98%) rename {sigs => archived_sigs}/MedicalImaging/docs/design-template.md (100%) rename {sigs => archived_sigs}/MedicalImaging/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/OpenGADL/README.en.md (100%) rename {sigs => archived_sigs}/OpenGADL/README.md (100%) rename {sigs => archived_sigs}/RobotVision/README.md (99%) rename {sigs => archived_sigs}/RobotVision/docs/design-template.md (100%) rename {sigs => archived_sigs}/RobotVision/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/TimeSequence/README.md (99%) rename {sigs => archived_sigs}/TimeSequence/docs/design-template.md (100%) rename {sigs => archived_sigs}/TimeSequence/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/XAI/README.md (98%) rename {sigs => archived_sigs}/XAI/docs/design-template.md (100%) rename {sigs => archived_sigs}/XAI/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/adaptivetraining/README.md (98%) rename {sigs => archived_sigs}/adaptivetraining/docs/design-template.md (100%) rename {sigs => archived_sigs}/adaptivetraining/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/compiler/README.md (100%) rename {sigs => archived_sigs}/compiler/README_en.md (100%) rename {sigs => archived_sigs}/compiler/docs/ME-Compiler SIG 20210610.pdf (100%) rename {sigs => archived_sigs}/compiler/docs/design-template.md (100%) rename {sigs => archived_sigs}/compiler/meetings/001-20200519.md (100%) rename {sigs => archived_sigs}/compiler/meetings/002-20200605.md (100%) rename {sigs => archived_sigs}/compiler/meetings/003-20210610.md (98%) rename {sigs => archived_sigs}/compiler/meetings/004-20210810.md (94%) rename {sigs => archived_sigs}/create_sig_info_template.py (100%) rename {sigs => archived_sigs}/data/README.md (100%) rename {sigs => archived_sigs}/data/README_en.md (100%) rename {sigs => archived_sigs}/data/docs/Auto_augmentation_in_Dataset_CN.pdf (100%) rename {sigs => archived_sigs}/data/docs/Develop_and_Implementation_of_Dataset_Operator_CN.pdf (100%) rename {sigs => archived_sigs}/data/docs/MindData_Overview.pdf (100%) rename {sigs => archived_sigs}/data/docs/design-template.md (100%) rename {sigs => archived_sigs}/data/docs/official_resource.md (100%) rename {sigs => archived_sigs}/data/meetings/001-20200402.md (100%) rename {sigs => archived_sigs}/data/meetings/002-20200515.md (100%) rename {sigs => archived_sigs}/data/meetings/003-20200603.md (100%) rename {sigs => archived_sigs}/data/meetings/004-20200703.md (100%) rename {sigs => archived_sigs}/data/meetings/005-20200805.md (100%) rename {sigs => archived_sigs}/data/meetings/006-20200806.md (100%) rename {sigs => archived_sigs}/data/meetings/007-20200903.md (100%) rename {sigs => archived_sigs}/data/meetings/008-20201016.md (100%) rename {sigs => archived_sigs}/data/meetings/009-20201104.md (100%) rename {sigs => archived_sigs}/data/meetings/010-20201123.md (100%) rename {sigs => archived_sigs}/data/meetings/011-20210414.md (100%) rename {sigs => archived_sigs}/data/sig-info.yaml (100%) rename {sigs => archived_sigs}/datacompliance/README.md (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/AIBOM_edit.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/AIBOM_preview.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_1.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_2.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/dataset_reviewer_entrance.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_CN.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_EN.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/dataset_reviewer_module_intro.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/initial_result_download.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/initial_result_preview.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/imgs/single_dataset_uploading.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-CN.md (100%) rename {sigs => archived_sigs}/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-EN.md (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/Dockerfile (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/LICENSE (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/README.md (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/app.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/k8s/deployment.yaml (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/k8s/service.yaml (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/api.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/conf/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/controller/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/controller/dataset_review.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/data_transform_object/admin.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/data_transform_object/license.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/data_transform_object/user.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/model/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/model/db_models.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/service/dataset_review.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/util/__init__.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/main/util/namespace.py (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/API-Document.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/Database.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/werkzeug1.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/werkzeug2.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png (100%) rename {sigs => archived_sigs}/datacompliance/dataset-reviewer/requirements.txt (100%) rename {sigs => archived_sigs}/datacompliance/merged_data/.keep (100%) rename {sigs => archived_sigs}/datacompliance/merged_data1.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data10.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data11.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data12.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data13.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data14.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data15.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data16.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data17.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data18.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data19.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data2.json (100%) rename {sigs => archived_sigs}/datacompliance/merged_data20.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data21.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data22.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data23.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data24.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data25.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data3.json (100%) rename {sigs => archived_sigs}/datacompliance/merged_data4.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data5.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data6.json (98%) rename {sigs => archived_sigs}/datacompliance/merged_data7.json (99%) rename {sigs => archived_sigs}/datacompliance/merged_data8.json (100%) rename {sigs => archived_sigs}/datacompliance/merged_data9.json (99%) rename {sigs => archived_sigs}/dx/README.md (100%) rename {sigs => archived_sigs}/dx/docs/How to build a SIG or WG_cn.md (100%) rename {sigs => archived_sigs}/dx/docs/How to build a SIG or WG_en.md (100%) rename {sigs => archived_sigs}/dx/docs/SIG Governance_CN.md (100%) rename {sigs => archived_sigs}/dx/docs/SIG Governance_EN.md (100%) rename {sigs => archived_sigs}/dx/docs/design-template.md (100%) rename {sigs => archived_sigs}/dx/docs/images/add_sig_issue.png (100%) rename {sigs => archived_sigs}/dx/docs/images/maillist.png (100%) rename {sigs => archived_sigs}/dx/docs/images/real_warrior.jpeg (100%) rename {sigs => archived_sigs}/dx/docs/images/sig.jpg (100%) rename {sigs => archived_sigs}/dx/docs/issue-workflow.md (100%) rename {sigs => archived_sigs}/dx/docs/labels.md (100%) rename {sigs => archived_sigs}/dx/docs/robot_design_CN.md (100%) rename {sigs => archived_sigs}/dx/images/requirements_of_dx-bot_2021H2.png (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202104_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202105_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202106_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202107_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202108_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/202109_MindSpore_issue_analysis.xlsx (100%) rename {sigs => archived_sigs}/dx/issue_analysis/scripts/event_classifier.py (100%) rename {sigs => archived_sigs}/dx/issue_analysis/scripts/issue_data_analyzer.py (100%) rename {sigs => archived_sigs}/dx/meetings/001-20210309.md (100%) rename {sigs => archived_sigs}/dx/meetings/002-20210323.md (100%) rename {sigs => archived_sigs}/dx/meetings/003-20210407.md (100%) rename {sigs => archived_sigs}/dx/meetings/004-20210427.md (100%) rename {sigs => archived_sigs}/dx/meetings/005-20210511.md (100%) rename {sigs => archived_sigs}/dx/meetings/006-20210624.md (100%) rename {sigs => archived_sigs}/dx/meetings/007-20210713.md (100%) rename {sigs => archived_sigs}/dx/meetings/008-20210727.md (100%) rename {sigs => archived_sigs}/dx/meetings/009-20210907.md (97%) rename {sigs => archived_sigs}/dx/meetings/010-20211012.md (100%) rename {sigs => archived_sigs}/dx/meetings/011-20211109.md (100%) rename {sigs => archived_sigs}/dx/meetings/012-20211123.md (100%) rename {sigs => archived_sigs}/dx/meetings/013-20211207.md (100%) rename "sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" => "archived_sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" (100%) rename {sigs => archived_sigs}/dx/paper/README.md (100%) rename {sigs => archived_sigs}/executor/README.md (100%) rename {sigs => archived_sigs}/executor/README_en.md (100%) rename {sigs => archived_sigs}/executor/docs/design-template.md (100%) rename {sigs => archived_sigs}/executor/meetings/001-20200604.md (100%) rename {sigs => archived_sigs}/executor/meetings/001-20210805.md (96%) rename {sigs => archived_sigs}/executor/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/frontend/README.md (100%) rename {sigs => archived_sigs}/frontend/README_en.md (100%) rename {sigs => archived_sigs}/frontend/docs/design-template.md (100%) rename {sigs => archived_sigs}/frontend/meetings/001-20200516.md (100%) rename {sigs => archived_sigs}/frontend/meetings/002-20200605.md (100%) rename {sigs => archived_sigs}/frontend/meetings/003-20200703.md (100%) rename {sigs => archived_sigs}/frontend/meetings/004-20210426.md (100%) rename {sigs => archived_sigs}/frontend/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/graphengine/README.md (100%) rename {sigs => archived_sigs}/graphengine/docs/design-template.md (100%) rename {sigs => archived_sigs}/graphengine/meetings/001-20200515.md (100%) rename {sigs => archived_sigs}/graphengine/meetings/002-20200731.md (100%) rename {sigs => archived_sigs}/graphlearning/README.en.md (100%) rename {sigs => archived_sigs}/graphlearning/README.md (100%) rename {sigs => archived_sigs}/graphlearning/sig-info.yaml (96%) rename {sigs => archived_sigs}/heterogeneous_fusion/README.md (100%) rename {sigs => archived_sigs}/heterogeneous_fusion/sig-info.yaml (100%) rename {sigs => archived_sigs}/mdp/README.md (98%) rename {sigs => archived_sigs}/mdp/docs/design-template.md (100%) rename {sigs => archived_sigs}/mdp/meetings/001-20210525.md (100%) rename {sigs => archived_sigs}/mdp/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/mdp/roadmap_2021.md (95%) rename {sigs => archived_sigs}/mindelec/README.md (100%) rename {sigs => archived_sigs}/mindelec/README_en.md (100%) rename {sigs => archived_sigs}/mindelec/sig-info.yaml (100%) rename {sigs => archived_sigs}/mindflow/README.en.md (100%) rename {sigs => archived_sigs}/mindflow/README.md (100%) rename {sigs => archived_sigs}/mindflow/images/mindflow_archi.png (100%) rename {sigs => archived_sigs}/mindflow/images/mindflow_archi_CN.png (100%) rename "sigs/mindflow/images/\345\255\231\346\265\251.jpeg" => "archived_sigs/mindflow/images/\345\255\231\346\265\251.jpeg" (100%) rename "sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" => "archived_sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" (100%) rename "sigs/mindflow/images/\350\221\243\345\275\254.jpeg" => "archived_sigs/mindflow/images/\350\221\243\345\275\254.jpeg" (100%) rename {sigs => archived_sigs}/mindquantfinance/README.en.md (100%) rename {sigs => archived_sigs}/mindquantfinance/README.md (100%) rename {sigs => archived_sigs}/mindspore_reinforcement/README.en.md (100%) rename {sigs => archived_sigs}/mindspore_reinforcement/README.md (100%) rename {sigs => archived_sigs}/mindspore_reinforcement/images/mindspore_rl_architecture.png (100%) rename {sigs => archived_sigs}/mindspore_sponge/README.md (98%) rename {sigs => archived_sigs}/mindspore_sponge/sig-info.yaml (100%) rename {sigs => archived_sigs}/modelzoo/README.md (100%) rename {sigs => archived_sigs}/modelzoo/README_en.md (100%) rename {sigs => archived_sigs}/modelzoo/docs/design-template.md (100%) rename {sigs => archived_sigs}/modelzoo/meetings/001-20200516.md (100%) rename {sigs => archived_sigs}/mslite/README.md (100%) rename {sigs => archived_sigs}/mslite/README_en.md (100%) rename {sigs => archived_sigs}/mslite/docs/design-template.md (100%) rename {sigs => archived_sigs}/mslite/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/mslite/sig-info.yaml (100%) rename {sigs => archived_sigs}/operators/README.md (100%) rename {sigs => archived_sigs}/operators/sig-info.yaml (96%) rename {sigs => archived_sigs}/pynative/README.md (100%) rename {sigs => archived_sigs}/pynative/sig-info.yaml (100%) rename {sigs => archived_sigs}/serving/README.md (100%) rename {sigs => archived_sigs}/serving/docs/design-template.md (100%) rename {sigs => archived_sigs}/serving/meetings/001-20210805.md (100%) rename {sigs => archived_sigs}/serving/meetings/meeting-template.md (100%) rename {sigs => archived_sigs}/sig_info.yaml (94%) rename {sigs => archived_sigs}/sig_info_chinese.yaml (93%) rename {sigs => archived_sigs}/visualization/README.md (100%) rename {sigs => archived_sigs}/visualization/README_en.md (100%) rename {sigs => archived_sigs}/visualization/docs/design-template.md (100%) rename {sigs => archived_sigs}/visualization/meetings/001-20200515.md (100%) rename {sigs => archived_sigs}/visualization/meetings/002-20200603.md (100%) rename {sigs => archived_sigs}/visualization/meetings/003-20200806.md (100%) rename {sigs => archived_sigs}/visualization/meetings/004-20200903.md (100%) rename {sigs => archived_sigs}/visualization/meetings/005-20210113.md (100%) rename {sigs => archived_sigs}/visualization/meetings/006-20210207.md (100%) rename {sigs => archived_sigs}/visualization/meetings/007-20210416.md (100%) rename {sigs => archived_sigs}/visualization/meetings/008-20210514.md (100%) rename {sigs => archived_sigs}/visualization/meetings/009-20210810.md (100%) create mode 100644 work/README.md create mode 100644 work/requirements.txt create mode 100644 work/train_lora.py create mode 100644 work/web_infer.py diff --git a/README.md b/README.md index dfd3d10..02b6701 100644 --- a/README.md +++ b/README.md @@ -3,75 +3,76 @@ -- [MindSpore Community](#mindspore-community) - - [Charter](#charter) - - [Code Of Conduct](#code-of-conduct) - - [Contributor License Agreement](#contributor-license-agreement) - - [Individual contributors](#individual-contributors) - - [Corporation contributors](#corporation-contributors) - - [Useful CI Commands](#useful-ci-commands) - - [Communications](#communications) - - [CVE Report](#cve-report) - - [Slide Template](#slide-template) - - [License](#license) +- [MindSpore社区](#mindspore社区) + - [治理架构](#治理架构) + - [行为准则](#行为准则) + - [贡献者协议](#贡献者协议) + - [个人贡献者](#个人贡献者) + - [企业贡献者](#企业贡献者) + - [CI指令](#ci指令) + - [交流渠道](#交流渠道) + - [CVE上报](#cve上报) + - [材料模板](#材料模板) + - [许可证](#许可证) -English | [查看中文](./README_CN.md) +中文 | [View English](./README.md) -# MindSpore Community +# MindSpore社区 -This is the repo for all the community related materials. You can find the -following information. +该仓库托管了MindSpore社区相关的所有材料,具体信息如下。 -## Charter +## 治理架构 -Community charter is documented in [governance.md](governance.md), this is -an initial draft and will need to be approved and updated by the TSC. We -also have [sig document](sigs/README.md) and [working group document](working-groups/README.md) -charter provided. +社区治理架构的内容详见[governance.md](governance.md),该提案处于初稿阶段,后期可能会在 +技术指导委员会(TSC)的许可下进行刷新。除此之外,社区还提供了特别兴趣小组([SIG](sigs/README.md)) +和工作组([Working Group](working-groups/README.md))的资料介绍。 -## Code Of Conduct +## 行为准则 -One of the most important community document, we provided both the -[Chinese version](code-of-conduct_zh_cn.md) and [English version](code-of-conduct_en.md) -based on CNCF Code Of Conduct. +作为社区运作的核心组成部分,我们在CNCF社区行为准则的基础上,同时提供了[中文版本](code-of-conduct_zh_cn.md) +和[英文版本](code-of-conduct_en.md)的行为准则。 -## Contributor License Agreement +## 贡献者协议 -You can find both the [Individual Contributor License Agreement](ICLA.pdf) -and [Corporate Contributor License Agreement](CCLA.pdf). +MindSpore社区针对个人贡献者和企业贡献者分别提供了[Individual Contributor License Agreement](ICLA.pdf) +和[Corporate Contributor License Agreement](CCLA.pdf)。 -### Individual contributors +### 个人贡献者 -For individual contributor, please click [CLA online sign page](https://clasign.osinfra.cn/sign/Z2l0ZWUlMkZtaW5kc3BvcmU=) -and choose the `Sign Individual CLA` button to sign Contributor License Agreement. +针对想要参与社区的个人贡献者,请打开[CLA在线签署平台](https://clasign.osinfra.cn/sign/Z2l0ZWUlMkZtaW5kc3BvcmU=) +并点击`Sign Individual CLA`按钮,然后根据系统提示完成协议签署。 -### Corporation contributors +### 企业贡献者 -Corporation employee would not be permitted to sign the CLA until the corporation -has signed CCLA document, and he(she) can click [CLA online sign page](https://clasign.osinfra.cn/sign/Z2l0ZWUlMkZtaW5kc3BvcmU=) -and choose the `Sign Employee CLA` button to sign Contributor License Agreement. +企业签署流程包括`企业主体`和`企业员工`签署两个环节。 -## Useful CI Commands +企业主体签署环节需要该企业联络人打开[CLA在线签署平台](https://clasign.osinfra.cn/sign/Z2l0ZWUlMkZtaW5kc3BvcmU=) +并点击`Sign Corporation CLA`按钮,然后根据系统提示完成协议签署;线上签署完成之后请打开 +签署所用邮箱获取企业签署协议(`电子版`),打印并交给企业业务负责人签名盖章,最后将企业 +签署协议扫描并通过邮件回传给CLA签署系统。 -Please check out some of the most useful [CI command](command.md) -you could use. +企业员工需要在其所属企业签署CCLA协议之后才准许签署贡献者协议,若其所属公司已签署,请打开 +[CLA在线签署平台](https://clasign.osinfra.cn/sign/Z2l0ZWUlMkZtaW5kc3BvcmU=) +并点击`Sign Employee CLA`按钮,然后根据系统提示完成协议签署。 -## Communications +## CI指令 -Please find all the necessary information regarding how we use `IRC`, `Slack`, -and `mailing-list` for discussions in the community. +请查阅[CI指令手册](command.md)来学习CI机器人的操作命令。 -## CVE Report +## 交流渠道 -If you want to file a CVE report, please refer to information in the `security` -folder. +社区提供了多种交流渠道:包括`IRC`、`Slack`以及`邮件列表`等,详情查阅`communication`目录。 -## Slide Template +## CVE上报 -MindSpore community themed slide templates if you need to make a presentation. +如果您发现社区存在任何安全漏洞,请查阅`security`目录了解CVE上报流程。 -## License +## 材料模板 + +如果您想开展MindSpore相关的主题演讲,请查阅`slides`目录获取社区主题材料模板。 + +## 许可证 [Apache License 2.0](LICENSE) diff --git a/sigs/Computer Vision (CV) Suite SIG/README.en.md b/archived_sigs/Computer Vision (CV) Suite SIG/README.en.md similarity index 100% rename from sigs/Computer Vision (CV) Suite SIG/README.en.md rename to archived_sigs/Computer Vision (CV) Suite SIG/README.en.md diff --git a/sigs/Computer Vision (CV) Suite SIG/README.md b/archived_sigs/Computer Vision (CV) Suite SIG/README.md similarity index 100% rename from sigs/Computer Vision (CV) Suite SIG/README.md rename to archived_sigs/Computer Vision (CV) Suite SIG/README.md diff --git a/sigs/CulturalTourism/README.md b/archived_sigs/CulturalTourism/README.md similarity index 99% rename from sigs/CulturalTourism/README.md rename to archived_sigs/CulturalTourism/README.md index 1206b3d..d1ca3a3 100644 --- a/sigs/CulturalTourism/README.md +++ b/archived_sigs/CulturalTourism/README.md @@ -1,77 +1,77 @@ -# 背景 - -中华优秀传统文化是我国屹立于世界的精神支柱,集中体现了中国精神、中国气质、中国风范。在当今百年变局时代,传承好中华优秀传统文化,必将为国家发展和民族复兴提供强大的精神动力。对于中华优秀传统文化,“坚持创造性转化、创新性发展”,“不断提升国家文化软实力和中华文化影响力”。利用现代科技特别是人工智能技术,赋能文化传承,是实现传统文化创造性转化、创新性发展的有效途径。 -文化与旅游密不可分,文化为旅游行业提供了源源不断的宝贵素材,而旅游则为文化的广泛传播提供了不竭动力。AI技术特别是虚拟现实、增强现实、元宇宙等现代交互式沉浸式技术,可为文旅行业提供线上虚拟体验场景,极大拓展文旅行业的时空限制,有效降低疫情对文旅产业的冲击,因此是实现文化旅游产业的重要技术保障。 - -在此背景下,2021年9月,陕西师范大学与华为技术有限公司共同成立了陕西师范大学-华为技术有限公司MindSpore研究室,依托民歌智能计算与服务技术文化和旅游部重点实验室、现代教学技术教育部重点实验室、西安市文化旅游资源开发利用重点实验室,开展文化科技融合AI应用场景的研究。由此,昇思MindSpore文旅AI专项兴趣小组(简称:文旅AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 - -## 文旅AI SIG的使命 - -文旅AI SIG着眼于优秀传统文化的传承,着眼于文化旅游产业的持续发展,充分利用国产AI框架昇思MindSpore,打造文旅行业的典型应用场景,为AI与文旅行业的深度融合提供基于昇思MindSpore的实现范式。 - -## 小组重点工作方向 - -+ MindSpore缺失算子的开发:研究MindSpore缺失算子的开发,包括数据框架算子、数据预处理算子,以及网络结构算子,从而完善MindSpore框架,更好服务于文化资源的智能开发。 - -+ 小样本条件下书法和绘画的智能生成:应用样本增强、迁移学习等技术,研究小样本条件下书法和绘画等文化形态的智能生成方法,并建立符合实际需求的网络模型和训练方法,为文化资源的智能开发提供更加实际的智能解决方案。 - -+ 古籍古画的智能修复:将书法绘画的智能修复技术,应用于古籍古画修复的具体场景。综合应用目标检测、特征匹配、边缘检测、风格迁移等技术,建立适应于古籍古画的智能修复方案,为文化遗产的传承提供智能方法。 - -+ 陕北民歌的智能生成和旋律创新:利用多媒体技术、音频处理技术与数据存储技术,建立陕北民歌的数据库,实现陕北民歌的数字化重构。利用深度学习技术,由歌词、自然语言自动生成特定旋律的陕北民歌,实现陕北民歌的智能创作、旋律创新与内容创新,从而为陕北民歌在新时代的传承与发展提供智能支撑。 - -+ 基于元宇宙的文旅行业沉浸式场景的建立与应用:融合使用虚拟现实、增强现实、混合现实等技术,在Unity引擎、头显、数据手套等软硬件的支持下,实现真实场景向虚拟场景的映射,创建虚拟、交互、智能的文旅场景全流程沉浸式元宇宙体验模式,并研究在虚拟博物馆、虚拟旅游、文化资源活化等场景的具体应用,为文旅行业提供典型的数字化智能化解决方案和应用示范。 - -## 平台的指导和支持 - -+ 民歌智能计算与服务技术文化和旅游部重点实验室 - -+ 现代教学技术教育部重点实验室 - -+ 西安市文化旅游资源开发利用重点实验室 - -+ 陕西师范大学-华为技术有限公司MindSpore研究室 - -## 文旅AI SIG前期成果积累 - -文旅AI SIG所在的陕西师范大学是教育部直属、国家“211工程”重点建设大学,也是国家教师教育“985”优势学科创新平台建设高校,2017年成为国家一流学科建设大学,中国语言文学学科相继入选第一轮、第二轮“双一流”建设名单,这为文旅AI SIG从事文化与科技的深度融合提供了坚实的学科基础。 -小组筹备前期,陕西师范大学计算机科学学院孙增国副教授带领团队,在实验室主任吴晓军教授、副主任张玉梅教授的指导下,在西安未来人工智能计算中心提供的算力支持下,应用昇思MindSpore框架,在文化资源开发领域,已经获得如下成果,初步彰显本团队在文旅行业场景的开发能力,为本SIG的建立提供了必要的技术积累。 - -+ 智能书法字体生成技术:利用zi2zi、CycleGAN等基础网络模型,融合自注意力机制、密集连接等改进思路,并结合少样本学习及迁移学习框架,构造了书法字体的智能生成模型,能够由印刷体生成对应的书法字体,并能实现不同书法字体的风格迁移。该技术获得华为昇腾技术认证,申请多项软件著作权,并获得2022昇腾AI创新大赛陕西赛区铜奖。 - -+ 智能山水画生成技术:利用pix2pix、CycleGAN等基础网络,构造了山水画的智能生成模型;融合VGG网络和Gram矩阵,构造了山水画智能生成的神经风格迁移模型,能够由风景照片及素描图生成相应风格的山水画,并能实现不同风格山水画的风格迁移。该技术获得华为昇腾技术认证。 - -## 文旅AI SIG工作计划 - -+ 初期:小组前期主要以成员学术交流活动为主,每月组织线上或线下交流活动,围绕AI在文旅行业应用的关键问题展开讨论,如智能生成技术、风格迁移技术、特征检测技术、元宇宙构造技术等,介绍国内外研究工作进展,讨论并解决研究工作中的难点问题。 - -+ 中期:通过合作开发等模式,在国内高校及企业间开展文旅AI问题的校企合作研究,打造若干AI在文旅行业的应用范例。 - -+ 后期:通过任务揭榜、申请项目或参加竞赛等模式,在全球范围内开展文旅AI问题的合作研究,实现典型AI文旅场景的落地,取得显著的社会效应和经济效应,推动AI赋能文旅产业高质量发展,并建立团队在AI+文旅领域的影响力。 - -## 文旅AI SIG构成 - -实验室负责人 - -吴晓军,陕西师范大学计算机科学学院教授、博士生导师,民歌智能计算与服务技术文化和旅游部重点实验室主任,西安市文化旅游资源开发利用重点实验室主任,陕西师范大学智能感知与先进计算研究中心主任,教育部科技委委员,民盟陕西省委员会副主委,民盟西安市委员会主委。 - -张玉梅,陕西师范大学计算机科学学院教授、博士生导师,民歌智能计算与服务技术文化和旅游部重点实验室副主任,西安市文化旅游资源开发利用重点实验室副主任,陕西师范大学智能感知与先进计算研究中心副主任。 - -领衔成员 - -孙增国,陕西师范大学计算机科学学院,民歌智能计算与服务技术文化和旅游部重点实验室,副教授 - -小组成员 - -01、苑玉杰, 昇思MindSpore布道师 - -02、杨瑞,陕西师范大学计算机科学学院,博士生 - -03、毛魏彬,陕西师范大学计算机科学学院,硕士生 - -04、刘佳兴,陕西师范大学计算机科学学院,硕士生 - -05、张志远,陕西师范大学计算机科学学院,硕士生 - -06、董立人,陕西师范大学计算机科学学院,本科生 - -07、郑铃锋,陕西师范大学计算机科学学院,本科生 +# 背景 + +中华优秀传统文化是我国屹立于世界的精神支柱,集中体现了中国精神、中国气质、中国风范。在当今百年变局时代,传承好中华优秀传统文化,必将为国家发展和民族复兴提供强大的精神动力。对于中华优秀传统文化,“坚持创造性转化、创新性发展”,“不断提升国家文化软实力和中华文化影响力”。利用现代科技特别是人工智能技术,赋能文化传承,是实现传统文化创造性转化、创新性发展的有效途径。 +文化与旅游密不可分,文化为旅游行业提供了源源不断的宝贵素材,而旅游则为文化的广泛传播提供了不竭动力。AI技术特别是虚拟现实、增强现实、元宇宙等现代交互式沉浸式技术,可为文旅行业提供线上虚拟体验场景,极大拓展文旅行业的时空限制,有效降低疫情对文旅产业的冲击,因此是实现文化旅游产业的重要技术保障。 + +在此背景下,2021年9月,陕西师范大学与华为技术有限公司共同成立了陕西师范大学-华为技术有限公司MindSpore研究室,依托民歌智能计算与服务技术文化和旅游部重点实验室、现代教学技术教育部重点实验室、西安市文化旅游资源开发利用重点实验室,开展文化科技融合AI应用场景的研究。由此,昇思MindSpore文旅AI专项兴趣小组(简称:文旅AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 + +## 文旅AI SIG的使命 + +文旅AI SIG着眼于优秀传统文化的传承,着眼于文化旅游产业的持续发展,充分利用国产AI框架昇思MindSpore,打造文旅行业的典型应用场景,为AI与文旅行业的深度融合提供基于昇思MindSpore的实现范式。 + +## 小组重点工作方向 + ++ MindSpore缺失算子的开发:研究MindSpore缺失算子的开发,包括数据框架算子、数据预处理算子,以及网络结构算子,从而完善MindSpore框架,更好服务于文化资源的智能开发。 + ++ 小样本条件下书法和绘画的智能生成:应用样本增强、迁移学习等技术,研究小样本条件下书法和绘画等文化形态的智能生成方法,并建立符合实际需求的网络模型和训练方法,为文化资源的智能开发提供更加实际的智能解决方案。 + ++ 古籍古画的智能修复:将书法绘画的智能修复技术,应用于古籍古画修复的具体场景。综合应用目标检测、特征匹配、边缘检测、风格迁移等技术,建立适应于古籍古画的智能修复方案,为文化遗产的传承提供智能方法。 + ++ 陕北民歌的智能生成和旋律创新:利用多媒体技术、音频处理技术与数据存储技术,建立陕北民歌的数据库,实现陕北民歌的数字化重构。利用深度学习技术,由歌词、自然语言自动生成特定旋律的陕北民歌,实现陕北民歌的智能创作、旋律创新与内容创新,从而为陕北民歌在新时代的传承与发展提供智能支撑。 + ++ 基于元宇宙的文旅行业沉浸式场景的建立与应用:融合使用虚拟现实、增强现实、混合现实等技术,在Unity引擎、头显、数据手套等软硬件的支持下,实现真实场景向虚拟场景的映射,创建虚拟、交互、智能的文旅场景全流程沉浸式元宇宙体验模式,并研究在虚拟博物馆、虚拟旅游、文化资源活化等场景的具体应用,为文旅行业提供典型的数字化智能化解决方案和应用示范。 + +## 平台的指导和支持 + ++ 民歌智能计算与服务技术文化和旅游部重点实验室 + ++ 现代教学技术教育部重点实验室 + ++ 西安市文化旅游资源开发利用重点实验室 + ++ 陕西师范大学-华为技术有限公司MindSpore研究室 + +## 文旅AI SIG前期成果积累 + +文旅AI SIG所在的陕西师范大学是教育部直属、国家“211工程”重点建设大学,也是国家教师教育“985”优势学科创新平台建设高校,2017年成为国家一流学科建设大学,中国语言文学学科相继入选第一轮、第二轮“双一流”建设名单,这为文旅AI SIG从事文化与科技的深度融合提供了坚实的学科基础。 +小组筹备前期,陕西师范大学计算机科学学院孙增国副教授带领团队,在实验室主任吴晓军教授、副主任张玉梅教授的指导下,在西安未来人工智能计算中心提供的算力支持下,应用昇思MindSpore框架,在文化资源开发领域,已经获得如下成果,初步彰显本团队在文旅行业场景的开发能力,为本SIG的建立提供了必要的技术积累。 + ++ 智能书法字体生成技术:利用zi2zi、CycleGAN等基础网络模型,融合自注意力机制、密集连接等改进思路,并结合少样本学习及迁移学习框架,构造了书法字体的智能生成模型,能够由印刷体生成对应的书法字体,并能实现不同书法字体的风格迁移。该技术获得华为昇腾技术认证,申请多项软件著作权,并获得2022昇腾AI创新大赛陕西赛区铜奖。 + ++ 智能山水画生成技术:利用pix2pix、CycleGAN等基础网络,构造了山水画的智能生成模型;融合VGG网络和Gram矩阵,构造了山水画智能生成的神经风格迁移模型,能够由风景照片及素描图生成相应风格的山水画,并能实现不同风格山水画的风格迁移。该技术获得华为昇腾技术认证。 + +## 文旅AI SIG工作计划 + ++ 初期:小组前期主要以成员学术交流活动为主,每月组织线上或线下交流活动,围绕AI在文旅行业应用的关键问题展开讨论,如智能生成技术、风格迁移技术、特征检测技术、元宇宙构造技术等,介绍国内外研究工作进展,讨论并解决研究工作中的难点问题。 + ++ 中期:通过合作开发等模式,在国内高校及企业间开展文旅AI问题的校企合作研究,打造若干AI在文旅行业的应用范例。 + ++ 后期:通过任务揭榜、申请项目或参加竞赛等模式,在全球范围内开展文旅AI问题的合作研究,实现典型AI文旅场景的落地,取得显著的社会效应和经济效应,推动AI赋能文旅产业高质量发展,并建立团队在AI+文旅领域的影响力。 + +## 文旅AI SIG构成 + +实验室负责人 + +吴晓军,陕西师范大学计算机科学学院教授、博士生导师,民歌智能计算与服务技术文化和旅游部重点实验室主任,西安市文化旅游资源开发利用重点实验室主任,陕西师范大学智能感知与先进计算研究中心主任,教育部科技委委员,民盟陕西省委员会副主委,民盟西安市委员会主委。 + +张玉梅,陕西师范大学计算机科学学院教授、博士生导师,民歌智能计算与服务技术文化和旅游部重点实验室副主任,西安市文化旅游资源开发利用重点实验室副主任,陕西师范大学智能感知与先进计算研究中心副主任。 + +领衔成员 + +孙增国,陕西师范大学计算机科学学院,民歌智能计算与服务技术文化和旅游部重点实验室,副教授 + +小组成员 + +01、苑玉杰, 昇思MindSpore布道师 + +02、杨瑞,陕西师范大学计算机科学学院,博士生 + +03、毛魏彬,陕西师范大学计算机科学学院,硕士生 + +04、刘佳兴,陕西师范大学计算机科学学院,硕士生 + +05、张志远,陕西师范大学计算机科学学院,硕士生 + +06、董立人,陕西师范大学计算机科学学院,本科生 + +07、郑铃锋,陕西师范大学计算机科学学院,本科生 diff --git a/sigs/CulturalTourism/docs/design-template.md b/archived_sigs/CulturalTourism/docs/design-template.md similarity index 100% rename from sigs/CulturalTourism/docs/design-template.md rename to archived_sigs/CulturalTourism/docs/design-template.md diff --git a/sigs/CulturalTourism/meetings/meeting-template.md b/archived_sigs/CulturalTourism/meetings/meeting-template.md similarity index 100% rename from sigs/CulturalTourism/meetings/meeting-template.md rename to archived_sigs/CulturalTourism/meetings/meeting-template.md diff --git a/sigs/DeviceAdapter/README.md b/archived_sigs/DeviceAdapter/README.md similarity index 100% rename from sigs/DeviceAdapter/README.md rename to archived_sigs/DeviceAdapter/README.md diff --git a/sigs/MSAdapter-SIG/README.en.md b/archived_sigs/MSAdapter-SIG/README.en.md similarity index 100% rename from sigs/MSAdapter-SIG/README.en.md rename to archived_sigs/MSAdapter-SIG/README.en.md diff --git a/sigs/MSAdapter-SIG/README.md b/archived_sigs/MSAdapter-SIG/README.md similarity index 100% rename from sigs/MSAdapter-SIG/README.md rename to archived_sigs/MSAdapter-SIG/README.md diff --git a/sigs/MedicalImaging/README.md b/archived_sigs/MedicalImaging/README.md similarity index 98% rename from sigs/MedicalImaging/README.md rename to archived_sigs/MedicalImaging/README.md index 7e33cd9..6c910c6 100644 --- a/sigs/MedicalImaging/README.md +++ b/archived_sigs/MedicalImaging/README.md @@ -1,54 +1,54 @@ -# 背景 - -随着人们健康意识的逐渐增强,人们对医学诊疗服务的需求也与日俱增。目前,基于AI的医学图像辅助诊断模型日趋成熟,如在皮肤病、眼底视网膜病变等诊断任务中,基于人工智能的辅助诊断算法在精度方面已经能够接近、甚至超越了临床专家。将基于AI影像的辅助诊断模型部署到诊疗服务水平较低的城乡基层卫生单位,可有效降低误诊率,提高城乡医疗诊断质量,缓解我国各地医疗资源分配不均衡的问题。因此,研究基于AI影像的辅助诊断系统具有重要的社会价值。 -在此背景下,昇思MindSpore医疗影像AI专项兴趣小组(简称:医疗影像AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 - -## 医疗影像AI SIG的使命 - -对多数疾病诊断问题而言,受数据采集成本、医师临床经验水平和标注习惯差异等因素影响,可用的带标签医学图像通常只有几千张甚至更少。因此,医疗影像AI SIG成立的目的是针对医学小样本数据,在昇思MindSpore框架下开发高效精确的AI辅助诊断模型,构建高效的高维医学影像分割标注工具,提升疾病诊断的精确性。 - -## 小组的重点工作方向: - -+ 轻量级深度学习模型构建:针对二维医学小样本数据,构建轻量级深度学习模型(包括CNN,GAN及Transformer等模型),降低模型训练难度,提升模型在疾病诊断中的通用性。 - -+ 面向高维医学图像的新型深度学习模型设计:研究高维深度学习模型,通过引入注意力机制等策略,在降低模型复杂度的同时,提升模型的性能。 - -+ 轻量级深度学习模型及高维深度学习模型的高效训练策略研究:研究新的自监督训练策略(如知识蒸馏、元匹配),提升CNN及Transformer等模型在小样本医学数据上的性能。 - -+ 模型的推广:基于全场景AI框架昇思MindSpore,实现模型的落地和推广。 - -+ 面向医学影像诊断可解释性的强化学习框架:基于昇思MindSpore,在医学影像诊断的可解释性领域研发深度强化学习框架。 - -+ 稳健的医学影像深度学习分析模型构建:探索深度学习模型在医学影像分割和诊断任务中对影像质量漂移的稳健性,尤其是探索推动昇思MindSpore对轻量、快速的在线学习的支持。 - -+ 高效的高维医学影像分割标注工具的构建:基于昇思MindSpore,构建通用的、高效的高维医学影像(视频影像和三维影像)的分割标注工具模块,为医生提供简单易用、精确快速的标注支持,减少医生的耗时。 - -## 医疗影像AI SIG工作计划 - -+ 初期:以成员学术交流活动为主,每月组织线上交流活动,围绕医疗AI中涉及的图像分类、图像降噪、图像分割、图像配准、图像降噪及图像融合等问题,介绍研究工作进展,讨论研究工作中的难点。 - -+ 中期:通过合作开发等模式,在国内高校及企业间开展医疗AI问题的合作研究。 - -+ 后期:通过任务揭榜或比赛PK等模式,在全球范围内开展医疗AI问题的合作研究。 - -## 医疗影像AI SIG构成 - -领衔成员: - -张旭明,华中科技大学生命科学与技术学院副教授,研究方向包括手术导航和手术机器人,博士毕业于上海交通大学。近年来,承担国家重点研发计划课题2项,国家自然基金面上项目1项,863子课题1项,中国人工智能学会-华为MindSpore学术奖励基金1项,发表SCI论文60余篇,获得国家授权专利26项,获2021年湖北省科技部进步奖一等奖1项,在华为MindSpore平台支持下,指导本科生获全国生医电子创新大赛二等奖2项。 - -杨鑫,深圳大学医学部助理教授。香港中文大学博士,北卡罗莱纳大学教堂山分校和哈佛大学医学院访问学者,深圳市海外高层次人才。主要从事智能化医学超声影像研究。在顶级期刊和会议发表论文60余篇,三次获得MICCAI大会演讲,学术引用4170余次。带领研发了首款一站式医学影像标注软件Pair,填补领域空白。推动了华为全场景深度学习框架MindSpore在医学影像标注领域的多个智能应用。主持国家自然科学基金1项、深圳市稳定支持A类项目1项,参与国家重点研发计划1项。 - -小组成员: - -成员:苑玉杰,昇思MindSpore布道师 - -成员:朱星星,华中科技大学生命科学与技术学院,博士后 - -成员:王一博,华中科技大学生命科学与技术学院,硕士生 - -成员:闻明伟,华中科技大学生命科学与技术学院,硕士生 - -成员:余斌,华中科技大学生命科学与技术学院,硕士生 - -成员:叶胤妤,深圳大学医学部生物医学工程学院,硕士生 +# 背景 + +随着人们健康意识的逐渐增强,人们对医学诊疗服务的需求也与日俱增。目前,基于AI的医学图像辅助诊断模型日趋成熟,如在皮肤病、眼底视网膜病变等诊断任务中,基于人工智能的辅助诊断算法在精度方面已经能够接近、甚至超越了临床专家。将基于AI影像的辅助诊断模型部署到诊疗服务水平较低的城乡基层卫生单位,可有效降低误诊率,提高城乡医疗诊断质量,缓解我国各地医疗资源分配不均衡的问题。因此,研究基于AI影像的辅助诊断系统具有重要的社会价值。 +在此背景下,昇思MindSpore医疗影像AI专项兴趣小组(简称:医疗影像AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 + +## 医疗影像AI SIG的使命 + +对多数疾病诊断问题而言,受数据采集成本、医师临床经验水平和标注习惯差异等因素影响,可用的带标签医学图像通常只有几千张甚至更少。因此,医疗影像AI SIG成立的目的是针对医学小样本数据,在昇思MindSpore框架下开发高效精确的AI辅助诊断模型,构建高效的高维医学影像分割标注工具,提升疾病诊断的精确性。 + +## 小组的重点工作方向: + ++ 轻量级深度学习模型构建:针对二维医学小样本数据,构建轻量级深度学习模型(包括CNN,GAN及Transformer等模型),降低模型训练难度,提升模型在疾病诊断中的通用性。 + ++ 面向高维医学图像的新型深度学习模型设计:研究高维深度学习模型,通过引入注意力机制等策略,在降低模型复杂度的同时,提升模型的性能。 + ++ 轻量级深度学习模型及高维深度学习模型的高效训练策略研究:研究新的自监督训练策略(如知识蒸馏、元匹配),提升CNN及Transformer等模型在小样本医学数据上的性能。 + ++ 模型的推广:基于全场景AI框架昇思MindSpore,实现模型的落地和推广。 + ++ 面向医学影像诊断可解释性的强化学习框架:基于昇思MindSpore,在医学影像诊断的可解释性领域研发深度强化学习框架。 + ++ 稳健的医学影像深度学习分析模型构建:探索深度学习模型在医学影像分割和诊断任务中对影像质量漂移的稳健性,尤其是探索推动昇思MindSpore对轻量、快速的在线学习的支持。 + ++ 高效的高维医学影像分割标注工具的构建:基于昇思MindSpore,构建通用的、高效的高维医学影像(视频影像和三维影像)的分割标注工具模块,为医生提供简单易用、精确快速的标注支持,减少医生的耗时。 + +## 医疗影像AI SIG工作计划 + ++ 初期:以成员学术交流活动为主,每月组织线上交流活动,围绕医疗AI中涉及的图像分类、图像降噪、图像分割、图像配准、图像降噪及图像融合等问题,介绍研究工作进展,讨论研究工作中的难点。 + ++ 中期:通过合作开发等模式,在国内高校及企业间开展医疗AI问题的合作研究。 + ++ 后期:通过任务揭榜或比赛PK等模式,在全球范围内开展医疗AI问题的合作研究。 + +## 医疗影像AI SIG构成 + +领衔成员: + +张旭明,华中科技大学生命科学与技术学院副教授,研究方向包括手术导航和手术机器人,博士毕业于上海交通大学。近年来,承担国家重点研发计划课题2项,国家自然基金面上项目1项,863子课题1项,中国人工智能学会-华为MindSpore学术奖励基金1项,发表SCI论文60余篇,获得国家授权专利26项,获2021年湖北省科技部进步奖一等奖1项,在华为MindSpore平台支持下,指导本科生获全国生医电子创新大赛二等奖2项。 + +杨鑫,深圳大学医学部助理教授。香港中文大学博士,北卡罗莱纳大学教堂山分校和哈佛大学医学院访问学者,深圳市海外高层次人才。主要从事智能化医学超声影像研究。在顶级期刊和会议发表论文60余篇,三次获得MICCAI大会演讲,学术引用4170余次。带领研发了首款一站式医学影像标注软件Pair,填补领域空白。推动了华为全场景深度学习框架MindSpore在医学影像标注领域的多个智能应用。主持国家自然科学基金1项、深圳市稳定支持A类项目1项,参与国家重点研发计划1项。 + +小组成员: + +成员:苑玉杰,昇思MindSpore布道师 + +成员:朱星星,华中科技大学生命科学与技术学院,博士后 + +成员:王一博,华中科技大学生命科学与技术学院,硕士生 + +成员:闻明伟,华中科技大学生命科学与技术学院,硕士生 + +成员:余斌,华中科技大学生命科学与技术学院,硕士生 + +成员:叶胤妤,深圳大学医学部生物医学工程学院,硕士生 diff --git a/sigs/MedicalImaging/docs/design-template.md b/archived_sigs/MedicalImaging/docs/design-template.md similarity index 100% rename from sigs/MedicalImaging/docs/design-template.md rename to archived_sigs/MedicalImaging/docs/design-template.md diff --git a/sigs/MedicalImaging/meetings/meeting-template.md b/archived_sigs/MedicalImaging/meetings/meeting-template.md similarity index 100% rename from sigs/MedicalImaging/meetings/meeting-template.md rename to archived_sigs/MedicalImaging/meetings/meeting-template.md diff --git a/sigs/OpenGADL/README.en.md b/archived_sigs/OpenGADL/README.en.md similarity index 100% rename from sigs/OpenGADL/README.en.md rename to archived_sigs/OpenGADL/README.en.md diff --git a/sigs/OpenGADL/README.md b/archived_sigs/OpenGADL/README.md similarity index 100% rename from sigs/OpenGADL/README.md rename to archived_sigs/OpenGADL/README.md diff --git a/sigs/RobotVision/README.md b/archived_sigs/RobotVision/README.md similarity index 99% rename from sigs/RobotVision/README.md rename to archived_sigs/RobotVision/README.md index 687f8c1..8f3bfe3 100644 --- a/sigs/RobotVision/README.md +++ b/archived_sigs/RobotVision/README.md @@ -1,62 +1,62 @@ -# 背景 - -近年来,随着机器人技术和人工智能技术的发展,各类智能机器人不断出现,在教育、养老、金融、安防等领域为人类提供多样化服务,市场规模持续高速增长,特别是新冠肺炎疫情进一步激发了服务机器人市场。智能机器人已纳入《新一代人工智能发展规划》等国家科技发展战略,成为我国人工智能产业的重要组成部分和未来发展方向。视觉系统旨在使机器像人一样具备观察和理解事物的能力,是机器人感知外界环境和用户的最重要的信息获取途径,是机器人与用户和环境进行交互,进而完成特定任务的重要基础,成为智能机器人的不可或缺的重要组成部分。 -机器视觉系统可以采集外部图像信息,模拟人脑完成重要信息的提取并加以分析,实现对目标物体的识别、定位以及对工作场景进行理解,提升机器人面对外部变化环境的自适应能力,增强机器人面对复杂环境的感知和决策能力。对机器人视觉关键技术进行研究,有助于实现机器视觉由低层视觉任务到更高层视觉任务的发展,进一步提升机器人的智能化程度,助推我国人工智能产业的升级,具有重要的理论与现实意义。 - -在此背景下,昇思MindSpore机器人视觉专项兴趣小组(简称:机器人视觉SIG)正式成立,并面向开源社区招募志同道合的伙伴。 - -## 机器人视觉 SIG的使命 - -机器人视觉SIG致力于机器人视觉关键技术研究,结合昇思MindSpore框架,开发精准、高效的机器人视觉算法模型。 - -## 小组重点工作方向: - -+ 情感计算:对情感计算关键技术进行研究,主要包括单帧表情图像识别、视频表情识别、情感极性与程度分析、融合语言信息(文本、语音)与非语言信息(面部表情、身体位置、头部姿态)的多模态多维度情感分析等,以实现情感状态的自动分析,提升用户与机器人之间的交互体验,为智能情感化交互机器人开发提供智能解决方案。 - -+ 动作识别:对动作识别关键技术进行研究,主要包括视频动作定位、时序动作检测、在线动作识别、动作预测等,以克服传统人机交互自由度低、操作不灵活等缺陷,使机器人能更加实时理解人的动作意图,提升人机交互的体验和效率,助推机器人智能个性化交互。 - -+ 场景理解:对场景理解关键技术进行研究,主要包括场景分类、目标(人体、人脸等)检测、语义分割、全景分割等,以克服人类情感和表达模糊多样对场景理解的困扰,突破机器人多模态场景认知难题。 - -+ 视觉问答:对视觉问答关键技术进行研究,主要包括多模态特征提取与交互融合、知识推理、图片问答与对话、视频问答与对话等,为视觉问答提供更加高效、智能解决方案,以克服不同模态信息间的高度异质性,推进跨模态人机交互,推动机器人智能化进程。 - -+ 模型压缩:对模型压缩关键技术进行研究,主要包括网络剪枝、知识蒸馏、参数量化、架构设计、动态计算等,以设计轻量化多分支网络结构,实现深度模型的高效压缩与加速,为智能机器人平台提供轻量、高效的算法模型。 - -## 机器人视觉SIG工作计划 - -+ 初期:小组前期主要以成员学术交流活动为主,每月组织线上或线下交流活动,围绕动作识别技术、视觉问答技术、情感计算技术、模型压缩技术、场景理解技术等机器人视觉的关键问题展开讨论,介绍国内外最新研究工作的进展,讨论并解决研究工作中的难点。 - -+ 中期:通过合作开发等模式,在国内高校及企业间开展机器人视觉相关技术研究。 - -+ 后期:通过任务揭榜、申请项目或参加竞赛等模式,在全球范围内开展机器人视觉技术的合作研究,推动机器人产业高质量发展。 - -## 机器人视觉SIG人员构成 - -领衔成员: - -组长、负责人:孙斌 -工学博士,湖南大学电气与信息工程学院副教授,博士生导师,主要研究方向为图像处理、模式识别、人机交互以及智能系统理论与应用,依托机器人视觉感知与控制技术国家工程研究中心,在王耀南院士、李树涛教授团队主要从事机器视觉、多模态信息智能处理、机器人自然交互等方面的教学与科研工作。近年来先后主持国防重点项目课题1项,国家自然科学基金面上和青年项目各1项,湖南省自然科学基金项目2项,作为研究骨干参与国家自然科学基金重大项目、国家重点研发和国际合作重点项目研究工作,研究成果在IEEE TIP,TNNLS,TAFFC,TGRS, Science China: Information Sciences等国内外高水平学术期刊和会议上发表论文30余篇,授权发明专利20项,在AAAI、ACM MM、ACL、ICLR等人工智能领域国内外高水平会议中获得竞赛冠军19项,研究成果在苏州博众机器人、湖南超能机器人、中南大学湘雅医院等企事业单位取得成功应用,取得了良好的社会和经济效益。2019年获得湖南大学首届“杰出博士后”称号,2022获得湖南省自然科学基金优秀青年项目资助。 - -副组长:李庆鹏 -工学博士,湖南大学机器人视觉感知与控制技术国家工程研究中心副研究员、硕士生导师。2018年在德国慕尼黑工业大学信号处理与对地观测中心访问学习。2019 年北京航空航天大学计算机科学与技术专业博士毕业。2019-2021 年在国家烟草专卖局从事全国烟叶信息化主管工作。2021 年工作调动至湖南大学,目前在机器人视觉感知与控制技术国家工程研究中心王耀南院士、李树涛教授团队主要从事计算机视觉、多源融合感知、智能机器人系统等方面的教学科研工作。主持国家自然科学基金青年项目、湖南省自然科学基金青年项目各1项,中央高校基本科研基金项目1项,校企横向课题2项;作为骨干参与国防科技创新特区重点项目1项。参与国家自然科学基金面上项目2 项、国家自然科学基金重点项目1项,参与军工企业和军队横向课题多项。作为第一作者和通信作者在 IEEE TGRS、GRSL、ICASSP等国际期刊会议发表论文多篇,授权发明专利5项。长期担任 IEEE TGRS、TVT、TITS、GRSL、ISPRS Journal 等国际顶级期刊会议审稿人。2022年获评教育部-华为智能基座“栋梁之师”称号。入选湖南大学2022年度优秀青年教师“托举计划”。 - -小组成员: - -01、成员:苑玉杰, 昇思MindSpore布道师 - -02、成员:马付严,湖南大学电气与信息工程学院,博士生 - -03、成员:李 宾,湖南大学电气与信息工程学院,博士生 - -04、成员:郭 虎,湖南大学电气与信息工程学院,博士生 - -05、成员:卢伟清,湖南大学电气与信息工程学院,博士生 - -06、成员:李希亮,湖南大学电气与信息工程学院,博士生 - -07、成员:司素勇,湖南大学电气与信息工程学院,硕士生 - -08、成员:廖美祺,湖南大学电气与信息工程学院,硕士生 - -09、成员:张雨鑫,湖南大学机器人学院,硕士生 - -10、成员:袁冬琴,湖南大学机器人学院,硕士生 +# 背景 + +近年来,随着机器人技术和人工智能技术的发展,各类智能机器人不断出现,在教育、养老、金融、安防等领域为人类提供多样化服务,市场规模持续高速增长,特别是新冠肺炎疫情进一步激发了服务机器人市场。智能机器人已纳入《新一代人工智能发展规划》等国家科技发展战略,成为我国人工智能产业的重要组成部分和未来发展方向。视觉系统旨在使机器像人一样具备观察和理解事物的能力,是机器人感知外界环境和用户的最重要的信息获取途径,是机器人与用户和环境进行交互,进而完成特定任务的重要基础,成为智能机器人的不可或缺的重要组成部分。 +机器视觉系统可以采集外部图像信息,模拟人脑完成重要信息的提取并加以分析,实现对目标物体的识别、定位以及对工作场景进行理解,提升机器人面对外部变化环境的自适应能力,增强机器人面对复杂环境的感知和决策能力。对机器人视觉关键技术进行研究,有助于实现机器视觉由低层视觉任务到更高层视觉任务的发展,进一步提升机器人的智能化程度,助推我国人工智能产业的升级,具有重要的理论与现实意义。 + +在此背景下,昇思MindSpore机器人视觉专项兴趣小组(简称:机器人视觉SIG)正式成立,并面向开源社区招募志同道合的伙伴。 + +## 机器人视觉 SIG的使命 + +机器人视觉SIG致力于机器人视觉关键技术研究,结合昇思MindSpore框架,开发精准、高效的机器人视觉算法模型。 + +## 小组重点工作方向: + ++ 情感计算:对情感计算关键技术进行研究,主要包括单帧表情图像识别、视频表情识别、情感极性与程度分析、融合语言信息(文本、语音)与非语言信息(面部表情、身体位置、头部姿态)的多模态多维度情感分析等,以实现情感状态的自动分析,提升用户与机器人之间的交互体验,为智能情感化交互机器人开发提供智能解决方案。 + ++ 动作识别:对动作识别关键技术进行研究,主要包括视频动作定位、时序动作检测、在线动作识别、动作预测等,以克服传统人机交互自由度低、操作不灵活等缺陷,使机器人能更加实时理解人的动作意图,提升人机交互的体验和效率,助推机器人智能个性化交互。 + ++ 场景理解:对场景理解关键技术进行研究,主要包括场景分类、目标(人体、人脸等)检测、语义分割、全景分割等,以克服人类情感和表达模糊多样对场景理解的困扰,突破机器人多模态场景认知难题。 + ++ 视觉问答:对视觉问答关键技术进行研究,主要包括多模态特征提取与交互融合、知识推理、图片问答与对话、视频问答与对话等,为视觉问答提供更加高效、智能解决方案,以克服不同模态信息间的高度异质性,推进跨模态人机交互,推动机器人智能化进程。 + ++ 模型压缩:对模型压缩关键技术进行研究,主要包括网络剪枝、知识蒸馏、参数量化、架构设计、动态计算等,以设计轻量化多分支网络结构,实现深度模型的高效压缩与加速,为智能机器人平台提供轻量、高效的算法模型。 + +## 机器人视觉SIG工作计划 + ++ 初期:小组前期主要以成员学术交流活动为主,每月组织线上或线下交流活动,围绕动作识别技术、视觉问答技术、情感计算技术、模型压缩技术、场景理解技术等机器人视觉的关键问题展开讨论,介绍国内外最新研究工作的进展,讨论并解决研究工作中的难点。 + ++ 中期:通过合作开发等模式,在国内高校及企业间开展机器人视觉相关技术研究。 + ++ 后期:通过任务揭榜、申请项目或参加竞赛等模式,在全球范围内开展机器人视觉技术的合作研究,推动机器人产业高质量发展。 + +## 机器人视觉SIG人员构成 + +领衔成员: + +组长、负责人:孙斌 +工学博士,湖南大学电气与信息工程学院副教授,博士生导师,主要研究方向为图像处理、模式识别、人机交互以及智能系统理论与应用,依托机器人视觉感知与控制技术国家工程研究中心,在王耀南院士、李树涛教授团队主要从事机器视觉、多模态信息智能处理、机器人自然交互等方面的教学与科研工作。近年来先后主持国防重点项目课题1项,国家自然科学基金面上和青年项目各1项,湖南省自然科学基金项目2项,作为研究骨干参与国家自然科学基金重大项目、国家重点研发和国际合作重点项目研究工作,研究成果在IEEE TIP,TNNLS,TAFFC,TGRS, Science China: Information Sciences等国内外高水平学术期刊和会议上发表论文30余篇,授权发明专利20项,在AAAI、ACM MM、ACL、ICLR等人工智能领域国内外高水平会议中获得竞赛冠军19项,研究成果在苏州博众机器人、湖南超能机器人、中南大学湘雅医院等企事业单位取得成功应用,取得了良好的社会和经济效益。2019年获得湖南大学首届“杰出博士后”称号,2022获得湖南省自然科学基金优秀青年项目资助。 + +副组长:李庆鹏 +工学博士,湖南大学机器人视觉感知与控制技术国家工程研究中心副研究员、硕士生导师。2018年在德国慕尼黑工业大学信号处理与对地观测中心访问学习。2019 年北京航空航天大学计算机科学与技术专业博士毕业。2019-2021 年在国家烟草专卖局从事全国烟叶信息化主管工作。2021 年工作调动至湖南大学,目前在机器人视觉感知与控制技术国家工程研究中心王耀南院士、李树涛教授团队主要从事计算机视觉、多源融合感知、智能机器人系统等方面的教学科研工作。主持国家自然科学基金青年项目、湖南省自然科学基金青年项目各1项,中央高校基本科研基金项目1项,校企横向课题2项;作为骨干参与国防科技创新特区重点项目1项。参与国家自然科学基金面上项目2 项、国家自然科学基金重点项目1项,参与军工企业和军队横向课题多项。作为第一作者和通信作者在 IEEE TGRS、GRSL、ICASSP等国际期刊会议发表论文多篇,授权发明专利5项。长期担任 IEEE TGRS、TVT、TITS、GRSL、ISPRS Journal 等国际顶级期刊会议审稿人。2022年获评教育部-华为智能基座“栋梁之师”称号。入选湖南大学2022年度优秀青年教师“托举计划”。 + +小组成员: + +01、成员:苑玉杰, 昇思MindSpore布道师 + +02、成员:马付严,湖南大学电气与信息工程学院,博士生 + +03、成员:李 宾,湖南大学电气与信息工程学院,博士生 + +04、成员:郭 虎,湖南大学电气与信息工程学院,博士生 + +05、成员:卢伟清,湖南大学电气与信息工程学院,博士生 + +06、成员:李希亮,湖南大学电气与信息工程学院,博士生 + +07、成员:司素勇,湖南大学电气与信息工程学院,硕士生 + +08、成员:廖美祺,湖南大学电气与信息工程学院,硕士生 + +09、成员:张雨鑫,湖南大学机器人学院,硕士生 + +10、成员:袁冬琴,湖南大学机器人学院,硕士生 diff --git a/sigs/RobotVision/docs/design-template.md b/archived_sigs/RobotVision/docs/design-template.md similarity index 100% rename from sigs/RobotVision/docs/design-template.md rename to archived_sigs/RobotVision/docs/design-template.md diff --git a/sigs/RobotVision/meetings/meeting-template.md b/archived_sigs/RobotVision/meetings/meeting-template.md similarity index 100% rename from sigs/RobotVision/meetings/meeting-template.md rename to archived_sigs/RobotVision/meetings/meeting-template.md diff --git a/sigs/TimeSequence/README.md b/archived_sigs/TimeSequence/README.md similarity index 99% rename from sigs/TimeSequence/README.md rename to archived_sigs/TimeSequence/README.md index 467a7e9..bc6e308 100644 --- a/sigs/TimeSequence/README.md +++ b/archived_sigs/TimeSequence/README.md @@ -1,59 +1,59 @@ -# 背景 - -随着信息产业技术的升级,产生了大规模的时间序列数据,长期并广泛存在于工业制造、航空航天、公共卫生、环境保护等关键基础领域。时间序列信息能够被充分理解、计算和利用,实现精准预测并辅助决策,是关系到国家竞争力的重要问题。该类分析的朴素描述是回归问题,在上个世纪60年代,序列数据规模较小、任务相对简单,以线性回归为代表的统计学手段是主流的解决手段,通常要求被分析的序列具有一定统计假设。进入互联网时代后,数据的规模发生了显著的变化,以循环神经网络、时间卷积网络等为代表的深度学习模型被引入,其独特的端到端 (End-to-End) 网络架构可以避免专家知识依赖的领域特征工程,直接建模大规模的序列关联。SIG领衔人在该领域提出了Informer等代表性模型,并推动序列预测往长时序发展。针对海量的数据处理需求和多变的业务需求,序列预测技术持续演进,赋予了这个领域独特的研究热度和生命力。在此背景下,昇思MindSpore时序AI专项兴趣小组(简称:时序AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 - -## 时序AI SIG的使命 - -产业大数据中产生越来越多的长序列预测与决策需求,带来全新的挑战和困难。首先长序列预测的输出显著变长,导致传统模型长期预测性能严重失效、预测效能受制于模型推断复杂度。并且长序列预测中元素关联跨度大,导致输入数据中预测机理不明确、关键元素缺失导致的协同建模困难被明显放大。因此针对产业大数据中,因序列数据的长度和规模持续递增所带来的,长序列预测失效、远期关联语义失真、结构嵌入模型失序等难题,重点解决长序列预测关键科学问题,小组主要开展了如下几个方向的工作: - -+ 长序列高效建模和精准预测:研究长序列场景下序列数据的稀疏建模与单步推断预测,利用序列数据的长尾冗余性假设,建模序列稀疏机制以提升长序列模型的计算效率和准确性,并通过避免迭代递推计算减小预测误差的累积,保证模型计算复杂度与预测精度的有效平衡,解决长序列数据的高效精准预测问题 - -+ 长序列协同预测和持续决策:研究多序列场景下内嵌数理规则的长序列数据预测方法,突破传统预测模型可解释能力不足、预测机理不明确、关键元素缺失的局限性,通过融合数理方程提升模型稳定可解释预测的能力,还原非稳态环境下的环境与策略的复杂依赖关系,解决长序列数据的数理规则协同预测与持续决策问题。 - -+ 长序列结构嵌入和组合预测:研究多任务场景下长序列数据结构关联的嵌入模型框架搭建,针对不同的任务主导因素分布,提出了具有时空分辨颗粒度的多种序列数据建模方式,通过使用网络架构自动搜索方法进行多任务的数据分布长期变迁追踪和组合预测。 - -+ 联合共建MindSpore“长序列智能计算通用套件”:基于全场景AI框架昇思MindSpore,实现一系列序列模型的落地和推广,目标典型产业领域需求,推动构建大规模时序模型预训练任务。研究更为规范和自动化的模型迁移技术以提升AI模型从其他框架迁移到MindSpore的自动化程度,以降低其他框架模型迁移到MindSpore的成本,形成融合生态。 - -## 时序AI SIG工作计划 - -+ 初期:以成员学术交流活动为主,每月组织线上交流活动,围绕时序预测AI中涉及的高效建模、精准预测、协同决策、持续决策、组合预测等问题,介绍研究工作进展,讨论研究工作中的难点。 - -+ 中期:通过合作开发等模式,在国内高校及企业间开展时序预测AI问题的合作研究。 - -+ 后期:通过任务揭榜或比赛PK等模式,在全球范围内开展时序预测AI问题的合作研究。 - -## 时序AI SIG 学习指南 - -+ 前期基础:需要成员对机器学习的基本理论有所掌握,了解经典时序模型(Arema,LSTM,…)的原理并且能够动手复现。另外需要具备一定的文献阅读能力和代码开发能力。 - -+ 进阶路线: - -1. 了解时序常见问题(预测、分类、异常检测等)和对应的常用处理方式。 -2. 按照“统计类模型—树模型—深度学习模型”的顺序逐步学习时序领域经典模型。 -3. 动手实践一些开源项目,或者参加一些时序领域比赛。 - -## 时序AI SIG人员构成 - -领衔成员: - -周号益,北京航空航天大学软件学院助理教授,大数据与脑机智能高精尖创新中心、未来区块链与隐私计算高精尖创新中心成员,人工智能学会CAAI青工委委员,北京青年互联网协会会员。主持参与国家自然科学青基/重点/面上项目、科技部重点研发项目,主持参与华为、国家电网、航天五院、京东方等企业项目。研究成果发表在国际顶级学术会议期刊10余篇,授权专利5项。获人工智能国际顶级会议AAAI 2021最佳论文奖、服务计算顶级会议IEEE IWQoS 2022最佳论文奖;获国家电网大数据中心科技进步一等奖、工信部工业互联网创新成果转化一等奖等;入选ACM China北京优博奖、世界人工智能大会WAIC 2021“云帆奖”、北京市“海英之星”、智源领域新星等。 - -小组成员: - -姓名 单位 任职 邮箱 - -仉尚航 北京大学 助理教授 shanghang@pku.edu.cn - -孙佩源 北京航空航天大学 讲师 sunpy@buaa.edu.cn - -苑玉杰 华为公司 昇思MindSpore布道师 yuanyujie@huawei.com - -朱天晨 北京航空航天大学 博士在读 zhutc@act.buaa.edu.cn - -李岚皓 北京航空航天大学 博士在读 lilanhao@buaa.edu.cn - -高崇涵 北京航空航天大学 硕士在读 gaoch@buaa.edu.cn - -肖思炀 北京航空航天大学 硕士在读 xiaosy@act.buaa.edu.cn - -陈博胆 北京航空航天大学 硕士在读 chenbd@act.buaa.edu.cn +# 背景 + +随着信息产业技术的升级,产生了大规模的时间序列数据,长期并广泛存在于工业制造、航空航天、公共卫生、环境保护等关键基础领域。时间序列信息能够被充分理解、计算和利用,实现精准预测并辅助决策,是关系到国家竞争力的重要问题。该类分析的朴素描述是回归问题,在上个世纪60年代,序列数据规模较小、任务相对简单,以线性回归为代表的统计学手段是主流的解决手段,通常要求被分析的序列具有一定统计假设。进入互联网时代后,数据的规模发生了显著的变化,以循环神经网络、时间卷积网络等为代表的深度学习模型被引入,其独特的端到端 (End-to-End) 网络架构可以避免专家知识依赖的领域特征工程,直接建模大规模的序列关联。SIG领衔人在该领域提出了Informer等代表性模型,并推动序列预测往长时序发展。针对海量的数据处理需求和多变的业务需求,序列预测技术持续演进,赋予了这个领域独特的研究热度和生命力。在此背景下,昇思MindSpore时序AI专项兴趣小组(简称:时序AI SIG)正式成立,并面向开源社区招募志同道合的伙伴。 + +## 时序AI SIG的使命 + +产业大数据中产生越来越多的长序列预测与决策需求,带来全新的挑战和困难。首先长序列预测的输出显著变长,导致传统模型长期预测性能严重失效、预测效能受制于模型推断复杂度。并且长序列预测中元素关联跨度大,导致输入数据中预测机理不明确、关键元素缺失导致的协同建模困难被明显放大。因此针对产业大数据中,因序列数据的长度和规模持续递增所带来的,长序列预测失效、远期关联语义失真、结构嵌入模型失序等难题,重点解决长序列预测关键科学问题,小组主要开展了如下几个方向的工作: + ++ 长序列高效建模和精准预测:研究长序列场景下序列数据的稀疏建模与单步推断预测,利用序列数据的长尾冗余性假设,建模序列稀疏机制以提升长序列模型的计算效率和准确性,并通过避免迭代递推计算减小预测误差的累积,保证模型计算复杂度与预测精度的有效平衡,解决长序列数据的高效精准预测问题 + ++ 长序列协同预测和持续决策:研究多序列场景下内嵌数理规则的长序列数据预测方法,突破传统预测模型可解释能力不足、预测机理不明确、关键元素缺失的局限性,通过融合数理方程提升模型稳定可解释预测的能力,还原非稳态环境下的环境与策略的复杂依赖关系,解决长序列数据的数理规则协同预测与持续决策问题。 + ++ 长序列结构嵌入和组合预测:研究多任务场景下长序列数据结构关联的嵌入模型框架搭建,针对不同的任务主导因素分布,提出了具有时空分辨颗粒度的多种序列数据建模方式,通过使用网络架构自动搜索方法进行多任务的数据分布长期变迁追踪和组合预测。 + ++ 联合共建MindSpore“长序列智能计算通用套件”:基于全场景AI框架昇思MindSpore,实现一系列序列模型的落地和推广,目标典型产业领域需求,推动构建大规模时序模型预训练任务。研究更为规范和自动化的模型迁移技术以提升AI模型从其他框架迁移到MindSpore的自动化程度,以降低其他框架模型迁移到MindSpore的成本,形成融合生态。 + +## 时序AI SIG工作计划 + ++ 初期:以成员学术交流活动为主,每月组织线上交流活动,围绕时序预测AI中涉及的高效建模、精准预测、协同决策、持续决策、组合预测等问题,介绍研究工作进展,讨论研究工作中的难点。 + ++ 中期:通过合作开发等模式,在国内高校及企业间开展时序预测AI问题的合作研究。 + ++ 后期:通过任务揭榜或比赛PK等模式,在全球范围内开展时序预测AI问题的合作研究。 + +## 时序AI SIG 学习指南 + ++ 前期基础:需要成员对机器学习的基本理论有所掌握,了解经典时序模型(Arema,LSTM,…)的原理并且能够动手复现。另外需要具备一定的文献阅读能力和代码开发能力。 + ++ 进阶路线: + +1. 了解时序常见问题(预测、分类、异常检测等)和对应的常用处理方式。 +2. 按照“统计类模型—树模型—深度学习模型”的顺序逐步学习时序领域经典模型。 +3. 动手实践一些开源项目,或者参加一些时序领域比赛。 + +## 时序AI SIG人员构成 + +领衔成员: + +周号益,北京航空航天大学软件学院助理教授,大数据与脑机智能高精尖创新中心、未来区块链与隐私计算高精尖创新中心成员,人工智能学会CAAI青工委委员,北京青年互联网协会会员。主持参与国家自然科学青基/重点/面上项目、科技部重点研发项目,主持参与华为、国家电网、航天五院、京东方等企业项目。研究成果发表在国际顶级学术会议期刊10余篇,授权专利5项。获人工智能国际顶级会议AAAI 2021最佳论文奖、服务计算顶级会议IEEE IWQoS 2022最佳论文奖;获国家电网大数据中心科技进步一等奖、工信部工业互联网创新成果转化一等奖等;入选ACM China北京优博奖、世界人工智能大会WAIC 2021“云帆奖”、北京市“海英之星”、智源领域新星等。 + +小组成员: + +姓名 单位 任职 邮箱 + +仉尚航 北京大学 助理教授 shanghang@pku.edu.cn + +孙佩源 北京航空航天大学 讲师 sunpy@buaa.edu.cn + +苑玉杰 华为公司 昇思MindSpore布道师 yuanyujie@huawei.com + +朱天晨 北京航空航天大学 博士在读 zhutc@act.buaa.edu.cn + +李岚皓 北京航空航天大学 博士在读 lilanhao@buaa.edu.cn + +高崇涵 北京航空航天大学 硕士在读 gaoch@buaa.edu.cn + +肖思炀 北京航空航天大学 硕士在读 xiaosy@act.buaa.edu.cn + +陈博胆 北京航空航天大学 硕士在读 chenbd@act.buaa.edu.cn diff --git a/sigs/TimeSequence/docs/design-template.md b/archived_sigs/TimeSequence/docs/design-template.md similarity index 100% rename from sigs/TimeSequence/docs/design-template.md rename to archived_sigs/TimeSequence/docs/design-template.md diff --git a/sigs/TimeSequence/meetings/meeting-template.md b/archived_sigs/TimeSequence/meetings/meeting-template.md similarity index 100% rename from sigs/TimeSequence/meetings/meeting-template.md rename to archived_sigs/TimeSequence/meetings/meeting-template.md diff --git a/sigs/XAI/README.md b/archived_sigs/XAI/README.md similarity index 98% rename from sigs/XAI/README.md rename to archived_sigs/XAI/README.md index 0768418..a640c85 100644 --- a/sigs/XAI/README.md +++ b/archived_sigs/XAI/README.md @@ -1,59 +1,59 @@ -# Summary - -Explainable AI (also termed transparent AI) is a form of artificial intelligence whose behavior is easily understood by humans. Unlike a "black box" in machine learning, in which the creators of an AI cannot explain how a specific decision was made, it implies the "explainability" of the algorithm's operation. The MindSpore XAI SIG is an initiative designed to build a collaborative environment for innovative research and industrial applications in XAI. - -## Motivation - -Theoretical flaws in machine learning decision-making mechanisms -Due to data samples' general limitations and biases, this association learning will inevitably learn a spurious relationship. A model based on this as a decision-making basis may perform well on most test data, but in fact, the reasoning and decision-making ability based on correct causality has not been learned, and its performance will be greatly reduced when faced with new data with distribution shift from the training samples. - -## Application pitfalls of machine learning - -First, due to the limitations and biases of data sample collection, data-driven AI systems are also biased, tantamount to bias in human society. Entrusting the future and destiny of individuals to such a biased artificial intelligence system damages social justice and causes contradictions among social groups. -Secondly, the "black box" deep neural network often makes low-level mistakes humans do not make, leading to potential security risks. -Lastly, and most importantly, from the point of view of the decision-making mechanism, the current analysis of deep learning algorithms is still in an opaque exploratory stage. Especially for super-large-scale pre-trained neural networks with hundreds of millions of parameters, such as BERT[1], GPT3[2], etc., the decision-making process is still not clearly explained academically. Such "black box" deep neural networks cannot be fully understood and trusted by humans for the time being, and the potential risks of large-scale application of such pre-trained models cannot be ignored. -Traditional AI systems fail to meet regulatory requirements in major fields such as finance, medical care, and law, legislation on the prevention and supervision of the application risks of artificial intelligence systems has been gradually strengthened and implemented. - -## Goals - -The goals of this SIG are as follows: - -1. To develop novel solutions to basic scientific problems such as poor robustness, poor interpretability, and strong dependence on data of artificial intelligence methods represented by deep learning; - -2. To improve the state-of-the-art XAI solutions, such as perturbation, counterfactual, and explainable GNN; - -3. To explore the basic principles of machine learning, develop explainable and general-purpose next-generation artificial intelligence methods; - -4. To promote the innovative application of explainable artificial intelligence methods in the scientific/industrial fields; - -5. To promote academic activities, including academic workshops, conferences, and contests; - -6. To contribute to open-source software for XAI based on MindSpore - -## SIG members - -PolyU: - -Prof. LI Qing qing-prof.li@polyu.edu.hk lead - -Dr. ZHANG Chen jason-c.zhang@polyu.edu.hk co-lead - -Dr. LIN Wanyu wan-yu.lin@polyu.edu.hk approver - -Dr. FAN Wenqi wenqi.fan@polyu.edu.hk approver - -Dr. ZHOU Kai kai.zhou@polyu.edu.hk approver - -Huawei: - -Dr. CAO Chen caleb.cao@huawei.com approver - -Dr. WANG Lunning wangluning2@huawei.com approver - -Dr. Yang Yujie yuanyujie@huawei.com approver - -Dr. Huang Yongxiang huang.yongxiang2@huawei.com coordinator and contactor - -HKUST: - -Prof. CHEN Lei leichen@cse.ust.hk co-lead +# Summary + +Explainable AI (also termed transparent AI) is a form of artificial intelligence whose behavior is easily understood by humans. Unlike a "black box" in machine learning, in which the creators of an AI cannot explain how a specific decision was made, it implies the "explainability" of the algorithm's operation. The MindSpore XAI SIG is an initiative designed to build a collaborative environment for innovative research and industrial applications in XAI. + +## Motivation + +Theoretical flaws in machine learning decision-making mechanisms +Due to data samples' general limitations and biases, this association learning will inevitably learn a spurious relationship. A model based on this as a decision-making basis may perform well on most test data, but in fact, the reasoning and decision-making ability based on correct causality has not been learned, and its performance will be greatly reduced when faced with new data with distribution shift from the training samples. + +## Application pitfalls of machine learning + +First, due to the limitations and biases of data sample collection, data-driven AI systems are also biased, tantamount to bias in human society. Entrusting the future and destiny of individuals to such a biased artificial intelligence system damages social justice and causes contradictions among social groups. +Secondly, the "black box" deep neural network often makes low-level mistakes humans do not make, leading to potential security risks. +Lastly, and most importantly, from the point of view of the decision-making mechanism, the current analysis of deep learning algorithms is still in an opaque exploratory stage. Especially for super-large-scale pre-trained neural networks with hundreds of millions of parameters, such as BERT[1], GPT3[2], etc., the decision-making process is still not clearly explained academically. Such "black box" deep neural networks cannot be fully understood and trusted by humans for the time being, and the potential risks of large-scale application of such pre-trained models cannot be ignored. +Traditional AI systems fail to meet regulatory requirements in major fields such as finance, medical care, and law, legislation on the prevention and supervision of the application risks of artificial intelligence systems has been gradually strengthened and implemented. + +## Goals + +The goals of this SIG are as follows: + +1. To develop novel solutions to basic scientific problems such as poor robustness, poor interpretability, and strong dependence on data of artificial intelligence methods represented by deep learning; + +2. To improve the state-of-the-art XAI solutions, such as perturbation, counterfactual, and explainable GNN; + +3. To explore the basic principles of machine learning, develop explainable and general-purpose next-generation artificial intelligence methods; + +4. To promote the innovative application of explainable artificial intelligence methods in the scientific/industrial fields; + +5. To promote academic activities, including academic workshops, conferences, and contests; + +6. To contribute to open-source software for XAI based on MindSpore + +## SIG members + +PolyU: + +Prof. LI Qing qing-prof.li@polyu.edu.hk lead + +Dr. ZHANG Chen jason-c.zhang@polyu.edu.hk co-lead + +Dr. LIN Wanyu wan-yu.lin@polyu.edu.hk approver + +Dr. FAN Wenqi wenqi.fan@polyu.edu.hk approver + +Dr. ZHOU Kai kai.zhou@polyu.edu.hk approver + +Huawei: + +Dr. CAO Chen caleb.cao@huawei.com approver + +Dr. WANG Lunning wangluning2@huawei.com approver + +Dr. Yang Yujie yuanyujie@huawei.com approver + +Dr. Huang Yongxiang huang.yongxiang2@huawei.com coordinator and contactor + +HKUST: + +Prof. CHEN Lei leichen@cse.ust.hk co-lead diff --git a/sigs/XAI/docs/design-template.md b/archived_sigs/XAI/docs/design-template.md similarity index 100% rename from sigs/XAI/docs/design-template.md rename to archived_sigs/XAI/docs/design-template.md diff --git a/sigs/XAI/meetings/meeting-template.md b/archived_sigs/XAI/meetings/meeting-template.md similarity index 100% rename from sigs/XAI/meetings/meeting-template.md rename to archived_sigs/XAI/meetings/meeting-template.md diff --git a/sigs/adaptivetraining/README.md b/archived_sigs/adaptivetraining/README.md similarity index 98% rename from sigs/adaptivetraining/README.md rename to archived_sigs/adaptivetraining/README.md index 8abecf3..ec9d6bb 100644 --- a/sigs/adaptivetraining/README.md +++ b/archived_sigs/adaptivetraining/README.md @@ -1,19 +1,19 @@ -# MindSpore Adaptive Distributed Training System Special Interest Group (SIG) -The elastic systems allow users to dynamically change the number of GPUs allocated to training jobs. The target of this SIG is to develop an adaptive distributed training system that can train the neural networks in elastic clusters without affecting the convergence. This working repo contains all the artifacts, materials, meeting notes, and proposals regarding **Elastic Training** and **Adaptive Training**. Feedbacks and contributions are welcomed. - -1. **Elastic Training**: the number of GPUs could change without interrupting the training process. -2. **Adaptive Training**: the training jobs could be reconfigured and scheduled adaptively when the training resource changes, so that the convergence speed is not affected. - -## SIG Leads -Luo Mai (University of Edinburgh) - -## Logistics -- SIG leads will drive the meeting. -- Meeting announcement will be posted on our gitee channel: https://gitee.com/mindspore/community/tree/master/sigs/adaptivetraining -- Feedbacks and topic requests are welcomed by all. - -## Discussion -- Slack channel: https://app.slack.com/client/T018BLCMSGL/learning-slack -- Documents and artifacts: https://gitee.com/mindspore/community/tree/master/sigs/adaptivetraining - -## Meeting notes +# MindSpore Adaptive Distributed Training System Special Interest Group (SIG) +The elastic systems allow users to dynamically change the number of GPUs allocated to training jobs. The target of this SIG is to develop an adaptive distributed training system that can train the neural networks in elastic clusters without affecting the convergence. This working repo contains all the artifacts, materials, meeting notes, and proposals regarding **Elastic Training** and **Adaptive Training**. Feedbacks and contributions are welcomed. + +1. **Elastic Training**: the number of GPUs could change without interrupting the training process. +2. **Adaptive Training**: the training jobs could be reconfigured and scheduled adaptively when the training resource changes, so that the convergence speed is not affected. + +## SIG Leads +Luo Mai (University of Edinburgh) + +## Logistics +- SIG leads will drive the meeting. +- Meeting announcement will be posted on our gitee channel: https://gitee.com/mindspore/community/tree/master/sigs/adaptivetraining +- Feedbacks and topic requests are welcomed by all. + +## Discussion +- Slack channel: https://app.slack.com/client/T018BLCMSGL/learning-slack +- Documents and artifacts: https://gitee.com/mindspore/community/tree/master/sigs/adaptivetraining + +## Meeting notes diff --git a/sigs/adaptivetraining/docs/design-template.md b/archived_sigs/adaptivetraining/docs/design-template.md similarity index 100% rename from sigs/adaptivetraining/docs/design-template.md rename to archived_sigs/adaptivetraining/docs/design-template.md diff --git a/sigs/adaptivetraining/meetings/meeting-template.md b/archived_sigs/adaptivetraining/meetings/meeting-template.md similarity index 100% rename from sigs/adaptivetraining/meetings/meeting-template.md rename to archived_sigs/adaptivetraining/meetings/meeting-template.md diff --git a/sigs/compiler/README.md b/archived_sigs/compiler/README.md similarity index 100% rename from sigs/compiler/README.md rename to archived_sigs/compiler/README.md diff --git a/sigs/compiler/README_en.md b/archived_sigs/compiler/README_en.md similarity index 100% rename from sigs/compiler/README_en.md rename to archived_sigs/compiler/README_en.md diff --git a/sigs/compiler/docs/ME-Compiler SIG 20210610.pdf b/archived_sigs/compiler/docs/ME-Compiler SIG 20210610.pdf similarity index 100% rename from sigs/compiler/docs/ME-Compiler SIG 20210610.pdf rename to archived_sigs/compiler/docs/ME-Compiler SIG 20210610.pdf diff --git a/sigs/compiler/docs/design-template.md b/archived_sigs/compiler/docs/design-template.md similarity index 100% rename from sigs/compiler/docs/design-template.md rename to archived_sigs/compiler/docs/design-template.md diff --git a/sigs/compiler/meetings/001-20200519.md b/archived_sigs/compiler/meetings/001-20200519.md similarity index 100% rename from sigs/compiler/meetings/001-20200519.md rename to archived_sigs/compiler/meetings/001-20200519.md diff --git a/sigs/compiler/meetings/002-20200605.md b/archived_sigs/compiler/meetings/002-20200605.md similarity index 100% rename from sigs/compiler/meetings/002-20200605.md rename to archived_sigs/compiler/meetings/002-20200605.md diff --git a/sigs/compiler/meetings/003-20210610.md b/archived_sigs/compiler/meetings/003-20210610.md similarity index 98% rename from sigs/compiler/meetings/003-20210610.md rename to archived_sigs/compiler/meetings/003-20210610.md index f7bdf92..b4e5973 100644 --- a/sigs/compiler/meetings/003-20210610.md +++ b/archived_sigs/compiler/meetings/003-20210610.md @@ -1,57 +1,57 @@ -# Thursday June 10, 2021 at 07:00pm GMT+8 - -## Agenda - -- Give a presentation of changing default run mode of mindspore. - -- The current status and planning of automatic differentiation. - -- Gathering the questions and suggestions of using mindspore. - -## Conference links - -https://welink-meeting.zoom.us/j/459092346 - -## Attendees - -- Yi Yang -- Pengxiang Xu -- huangbingjian(Huawei) -- yujianfeng(Huawei) -- chenfei_mindspore(Huawei) - -## Notes - -议题1: - -- 1.本次修改涉及的ISSUE链接([#I3TKWJ](https://gitee.com/mind_spore/dashboard?issue_id=I3TKWJ)、[#I3UDNB](https://gitee.com/mind_spore/dashboard?issue_id=I3UDNB))。 -- 2.很多时候Pynative模式不报错,切换到图模式就报错了,期望Pynative和图模式支持场景尽量一致。 -- 3.Pynative模式基本上能根据报错信息定位到脚本错误的地方,图模式报错的位置经常是错误的,要加强图模式的DFX能力([#I3VK4Z:[SIG会议遗留问题\]图模式下DFX能力较弱](https://gitee.com/mind_spore/dashboard?issue_id=I3VK4Z))。下一次SIG会议讨论下该议题。 -- 4.图模式对初学者会不会不太友好?--长期来看是友好的,因为最终要应用到实际肯定是图模式。 -- 5.要加强下图模式和Pynative模式各自特性和区别的知识普及,让用户真正理解pynative和图模式的原理差异。 -- 6.本次修改默认执行模式评审通过。 - -议题2: - -- 1.高阶求导很多算子不支持,需要继续补齐更多高阶算子。 -- 2.端到端可微分,PyTorch没有这种能力,MindSpore是否可挑战。 -- 3.高阶自动微分机制是否还能继续加速,Mindspore不加自动微分比Pytorch快,但是加了自动微分性能急速下降,Pytorch加自动微分性能下降没有这么明显。 -- 4.统计下当前高阶微分的性能,基于杨老师的例子做一个分析。对比下和其他框架的差异,后续再对比下当前方式和后续直接提供高阶接口的性能差异。([#I3VK9V:[SIG会议遗留问题\]高阶求导性能分析与优化](https://gitee.com/mind_spore/dashboard?issue_id=I3VK9V)) - -议题3: - -- 1.培育开发者后面能不能有更多的一些设计文档,降低开发者的门槛,这样有利于吸引更多的社区贡献者。 -- 2.讨论问题尽量在社区上讨论,这样遇到的很多问题的讨论过程和解决方案才能够沉淀下来。 -- 3.把numpy等常用库兼容到MindSpore,提升易用性。 -- 4.CPU支持力度不够,有时候需要用笔记本等没有GPU的设备展示Mindspore的效果。Windows版CPU运行的支持。([#I3VKC9:[SIG会议遗留问题\]加强Mindspore对CPU场景的支持](https://gitee.com/mind_spore/dashboard?issue_id=I3VKC9)) -- 5.Mindspore安装对环境要求还是很苛刻,比如python必须要求是python3.7版本。([#I3VKE1:[SIG会议遗留问题\]Mindspore对环境的要求过于苛刻](https://gitee.com/mind_spore/dashboard?issue_id=I3VKE1)) - -## Action items - -- https://gitee.com/mind_spore/dashboard/issues?id=I3VK4Z -- https://gitee.com/mind_spore/dashboard/issues?id=I3VK9V -- https://gitee.com/mind_spore/dashboard/issues?id=I3VKC9 -- https://gitee.com/mind_spore/dashboard/issues?id=I3VKE1 - - - +# Thursday June 10, 2021 at 07:00pm GMT+8 + +## Agenda + +- Give a presentation of changing default run mode of mindspore. + +- The current status and planning of automatic differentiation. + +- Gathering the questions and suggestions of using mindspore. + +## Conference links + +https://welink-meeting.zoom.us/j/459092346 + +## Attendees + +- Yi Yang +- Pengxiang Xu +- huangbingjian(Huawei) +- yujianfeng(Huawei) +- chenfei_mindspore(Huawei) + +## Notes + +议题1: + +- 1.本次修改涉及的ISSUE链接([#I3TKWJ](https://gitee.com/mind_spore/dashboard?issue_id=I3TKWJ)、[#I3UDNB](https://gitee.com/mind_spore/dashboard?issue_id=I3UDNB))。 +- 2.很多时候Pynative模式不报错,切换到图模式就报错了,期望Pynative和图模式支持场景尽量一致。 +- 3.Pynative模式基本上能根据报错信息定位到脚本错误的地方,图模式报错的位置经常是错误的,要加强图模式的DFX能力([#I3VK4Z:[SIG会议遗留问题\]图模式下DFX能力较弱](https://gitee.com/mind_spore/dashboard?issue_id=I3VK4Z))。下一次SIG会议讨论下该议题。 +- 4.图模式对初学者会不会不太友好?--长期来看是友好的,因为最终要应用到实际肯定是图模式。 +- 5.要加强下图模式和Pynative模式各自特性和区别的知识普及,让用户真正理解pynative和图模式的原理差异。 +- 6.本次修改默认执行模式评审通过。 + +议题2: + +- 1.高阶求导很多算子不支持,需要继续补齐更多高阶算子。 +- 2.端到端可微分,PyTorch没有这种能力,MindSpore是否可挑战。 +- 3.高阶自动微分机制是否还能继续加速,Mindspore不加自动微分比Pytorch快,但是加了自动微分性能急速下降,Pytorch加自动微分性能下降没有这么明显。 +- 4.统计下当前高阶微分的性能,基于杨老师的例子做一个分析。对比下和其他框架的差异,后续再对比下当前方式和后续直接提供高阶接口的性能差异。([#I3VK9V:[SIG会议遗留问题\]高阶求导性能分析与优化](https://gitee.com/mind_spore/dashboard?issue_id=I3VK9V)) + +议题3: + +- 1.培育开发者后面能不能有更多的一些设计文档,降低开发者的门槛,这样有利于吸引更多的社区贡献者。 +- 2.讨论问题尽量在社区上讨论,这样遇到的很多问题的讨论过程和解决方案才能够沉淀下来。 +- 3.把numpy等常用库兼容到MindSpore,提升易用性。 +- 4.CPU支持力度不够,有时候需要用笔记本等没有GPU的设备展示Mindspore的效果。Windows版CPU运行的支持。([#I3VKC9:[SIG会议遗留问题\]加强Mindspore对CPU场景的支持](https://gitee.com/mind_spore/dashboard?issue_id=I3VKC9)) +- 5.Mindspore安装对环境要求还是很苛刻,比如python必须要求是python3.7版本。([#I3VKE1:[SIG会议遗留问题\]Mindspore对环境的要求过于苛刻](https://gitee.com/mind_spore/dashboard?issue_id=I3VKE1)) + +## Action items + +- https://gitee.com/mind_spore/dashboard/issues?id=I3VK4Z +- https://gitee.com/mind_spore/dashboard/issues?id=I3VK9V +- https://gitee.com/mind_spore/dashboard/issues?id=I3VKC9 +- https://gitee.com/mind_spore/dashboard/issues?id=I3VKE1 + + + diff --git a/sigs/compiler/meetings/004-20210810.md b/archived_sigs/compiler/meetings/004-20210810.md similarity index 94% rename from sigs/compiler/meetings/004-20210810.md rename to archived_sigs/compiler/meetings/004-20210810.md index b711149..928175d 100644 --- a/sigs/compiler/meetings/004-20210810.md +++ b/archived_sigs/compiler/meetings/004-20210810.md @@ -1,40 +1,40 @@ -# Tuesday August 10, 2021 at 07:00pm GMT+8 - -## Agenda - -- Automatic differentiation and scientific computation. - -- The current status control flow. - -- The optimization of error message in graph compilation. - -## Conference links - -https://welink.zhumu.com/j/135416073 - -## Attendees - -- Jason Zhang(Huawei) -- Felix Chen(Huawei) -- Frank Liang(Huawei) - -## Notes - -议题1: - -- 无遗留问题 - -议题2: - -- 1.需要对控制流的支持现状补充文档和教程。 - -议题3: - -- 1.需要明确编译报错改进策略,找浙大学生沟通,听取建议。 - -## Action items - -- https://gitee.com/mind_spore/dashboard/issues?id=I4CMUP -- https://gitee.com/mind_spore/dashboard/issues?id=I42792 -- https://gitee.com/mind_spore/dashboard/issues?id=I2CXMJ - +# Tuesday August 10, 2021 at 07:00pm GMT+8 + +## Agenda + +- Automatic differentiation and scientific computation. + +- The current status control flow. + +- The optimization of error message in graph compilation. + +## Conference links + +https://welink.zhumu.com/j/135416073 + +## Attendees + +- Jason Zhang(Huawei) +- Felix Chen(Huawei) +- Frank Liang(Huawei) + +## Notes + +议题1: + +- 无遗留问题 + +议题2: + +- 1.需要对控制流的支持现状补充文档和教程。 + +议题3: + +- 1.需要明确编译报错改进策略,找浙大学生沟通,听取建议。 + +## Action items + +- https://gitee.com/mind_spore/dashboard/issues?id=I4CMUP +- https://gitee.com/mind_spore/dashboard/issues?id=I42792 +- https://gitee.com/mind_spore/dashboard/issues?id=I2CXMJ + diff --git a/sigs/create_sig_info_template.py b/archived_sigs/create_sig_info_template.py similarity index 100% rename from sigs/create_sig_info_template.py rename to archived_sigs/create_sig_info_template.py diff --git a/sigs/data/README.md b/archived_sigs/data/README.md similarity index 100% rename from sigs/data/README.md rename to archived_sigs/data/README.md diff --git a/sigs/data/README_en.md b/archived_sigs/data/README_en.md similarity index 100% rename from sigs/data/README_en.md rename to archived_sigs/data/README_en.md diff --git a/sigs/data/docs/Auto_augmentation_in_Dataset_CN.pdf b/archived_sigs/data/docs/Auto_augmentation_in_Dataset_CN.pdf similarity index 100% rename from sigs/data/docs/Auto_augmentation_in_Dataset_CN.pdf rename to archived_sigs/data/docs/Auto_augmentation_in_Dataset_CN.pdf diff --git a/sigs/data/docs/Develop_and_Implementation_of_Dataset_Operator_CN.pdf b/archived_sigs/data/docs/Develop_and_Implementation_of_Dataset_Operator_CN.pdf similarity index 100% rename from sigs/data/docs/Develop_and_Implementation_of_Dataset_Operator_CN.pdf rename to archived_sigs/data/docs/Develop_and_Implementation_of_Dataset_Operator_CN.pdf diff --git a/sigs/data/docs/MindData_Overview.pdf b/archived_sigs/data/docs/MindData_Overview.pdf similarity index 100% rename from sigs/data/docs/MindData_Overview.pdf rename to archived_sigs/data/docs/MindData_Overview.pdf diff --git a/sigs/data/docs/design-template.md b/archived_sigs/data/docs/design-template.md similarity index 100% rename from sigs/data/docs/design-template.md rename to archived_sigs/data/docs/design-template.md diff --git a/sigs/data/docs/official_resource.md b/archived_sigs/data/docs/official_resource.md similarity index 100% rename from sigs/data/docs/official_resource.md rename to archived_sigs/data/docs/official_resource.md diff --git a/sigs/data/meetings/001-20200402.md b/archived_sigs/data/meetings/001-20200402.md similarity index 100% rename from sigs/data/meetings/001-20200402.md rename to archived_sigs/data/meetings/001-20200402.md diff --git a/sigs/data/meetings/002-20200515.md b/archived_sigs/data/meetings/002-20200515.md similarity index 100% rename from sigs/data/meetings/002-20200515.md rename to archived_sigs/data/meetings/002-20200515.md diff --git a/sigs/data/meetings/003-20200603.md b/archived_sigs/data/meetings/003-20200603.md similarity index 100% rename from sigs/data/meetings/003-20200603.md rename to archived_sigs/data/meetings/003-20200603.md diff --git a/sigs/data/meetings/004-20200703.md b/archived_sigs/data/meetings/004-20200703.md similarity index 100% rename from sigs/data/meetings/004-20200703.md rename to archived_sigs/data/meetings/004-20200703.md diff --git a/sigs/data/meetings/005-20200805.md b/archived_sigs/data/meetings/005-20200805.md similarity index 100% rename from sigs/data/meetings/005-20200805.md rename to archived_sigs/data/meetings/005-20200805.md diff --git a/sigs/data/meetings/006-20200806.md b/archived_sigs/data/meetings/006-20200806.md similarity index 100% rename from sigs/data/meetings/006-20200806.md rename to archived_sigs/data/meetings/006-20200806.md diff --git a/sigs/data/meetings/007-20200903.md b/archived_sigs/data/meetings/007-20200903.md similarity index 100% rename from sigs/data/meetings/007-20200903.md rename to archived_sigs/data/meetings/007-20200903.md diff --git a/sigs/data/meetings/008-20201016.md b/archived_sigs/data/meetings/008-20201016.md similarity index 100% rename from sigs/data/meetings/008-20201016.md rename to archived_sigs/data/meetings/008-20201016.md diff --git a/sigs/data/meetings/009-20201104.md b/archived_sigs/data/meetings/009-20201104.md similarity index 100% rename from sigs/data/meetings/009-20201104.md rename to archived_sigs/data/meetings/009-20201104.md diff --git a/sigs/data/meetings/010-20201123.md b/archived_sigs/data/meetings/010-20201123.md similarity index 100% rename from sigs/data/meetings/010-20201123.md rename to archived_sigs/data/meetings/010-20201123.md diff --git a/sigs/data/meetings/011-20210414.md b/archived_sigs/data/meetings/011-20210414.md similarity index 100% rename from sigs/data/meetings/011-20210414.md rename to archived_sigs/data/meetings/011-20210414.md diff --git a/sigs/data/sig-info.yaml b/archived_sigs/data/sig-info.yaml similarity index 100% rename from sigs/data/sig-info.yaml rename to archived_sigs/data/sig-info.yaml diff --git a/sigs/datacompliance/README.md b/archived_sigs/datacompliance/README.md similarity index 100% rename from sigs/datacompliance/README.md rename to archived_sigs/datacompliance/README.md diff --git a/sigs/datacompliance/dataset-review-process/imgs/AIBOM_edit.png b/archived_sigs/datacompliance/dataset-review-process/imgs/AIBOM_edit.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/AIBOM_edit.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/AIBOM_edit.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/AIBOM_preview.png b/archived_sigs/datacompliance/dataset-review-process/imgs/AIBOM_preview.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/AIBOM_preview.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/AIBOM_preview.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_1.png b/archived_sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_1.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_1.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_1.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_2.png b/archived_sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_2.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_2.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/batch_datasets_uploading_2.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_entrance.png b/archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_entrance.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_entrance.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_entrance.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_CN.png b/archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_CN.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_CN.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_CN.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_EN.png b/archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_EN.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_EN.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_logic_architecture_EN.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_module_intro.png b/archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_module_intro.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_module_intro.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/dataset_reviewer_module_intro.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/initial_result_download.png b/archived_sigs/datacompliance/dataset-review-process/imgs/initial_result_download.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/initial_result_download.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/initial_result_download.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/initial_result_preview.png b/archived_sigs/datacompliance/dataset-review-process/imgs/initial_result_preview.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/initial_result_preview.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/initial_result_preview.png diff --git a/sigs/datacompliance/dataset-review-process/imgs/single_dataset_uploading.png b/archived_sigs/datacompliance/dataset-review-process/imgs/single_dataset_uploading.png similarity index 100% rename from sigs/datacompliance/dataset-review-process/imgs/single_dataset_uploading.png rename to archived_sigs/datacompliance/dataset-review-process/imgs/single_dataset_uploading.png diff --git a/sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-CN.md b/archived_sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-CN.md similarity index 100% rename from sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-CN.md rename to archived_sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-CN.md diff --git a/sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-EN.md b/archived_sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-EN.md similarity index 100% rename from sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-EN.md rename to archived_sigs/datacompliance/dataset-review-process/user-guide-for-dataset-reviewer-EN.md diff --git a/sigs/datacompliance/dataset-reviewer/Dockerfile b/archived_sigs/datacompliance/dataset-reviewer/Dockerfile similarity index 100% rename from sigs/datacompliance/dataset-reviewer/Dockerfile rename to archived_sigs/datacompliance/dataset-reviewer/Dockerfile diff --git a/sigs/datacompliance/dataset-reviewer/LICENSE b/archived_sigs/datacompliance/dataset-reviewer/LICENSE similarity index 100% rename from sigs/datacompliance/dataset-reviewer/LICENSE rename to archived_sigs/datacompliance/dataset-reviewer/LICENSE diff --git a/sigs/datacompliance/dataset-reviewer/README.md b/archived_sigs/datacompliance/dataset-reviewer/README.md similarity index 100% rename from sigs/datacompliance/dataset-reviewer/README.md rename to archived_sigs/datacompliance/dataset-reviewer/README.md diff --git a/sigs/datacompliance/dataset-reviewer/app.py b/archived_sigs/datacompliance/dataset-reviewer/app.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/app.py rename to archived_sigs/datacompliance/dataset-reviewer/app.py diff --git a/sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml b/archived_sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml similarity index 100% rename from sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml rename to archived_sigs/datacompliance/dataset-reviewer/k8s/deployment.yaml diff --git a/sigs/datacompliance/dataset-reviewer/k8s/service.yaml b/archived_sigs/datacompliance/dataset-reviewer/k8s/service.yaml similarity index 100% rename from sigs/datacompliance/dataset-reviewer/k8s/service.yaml rename to archived_sigs/datacompliance/dataset-reviewer/k8s/service.yaml diff --git a/sigs/datacompliance/dataset-reviewer/main/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/api.py b/archived_sigs/datacompliance/dataset-reviewer/main/api.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/api.py rename to archived_sigs/datacompliance/dataset-reviewer/main/api.py diff --git a/sigs/datacompliance/dataset-reviewer/main/conf/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/conf/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/conf/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/conf/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py b/archived_sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py rename to archived_sigs/datacompliance/dataset-reviewer/main/conf/db_conf_demo.py diff --git a/sigs/datacompliance/dataset-reviewer/main/controller/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/controller/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/controller/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/controller/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py b/archived_sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py rename to archived_sigs/datacompliance/dataset-reviewer/main/controller/dataset_review.py diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py b/archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py rename to archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/admin.py diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py b/archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py rename to archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/dataset.py diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py b/archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py rename to archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/license.py diff --git a/sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py b/archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py rename to archived_sigs/datacompliance/dataset-reviewer/main/data_transform_object/user.py diff --git a/sigs/datacompliance/dataset-reviewer/main/model/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/model/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/model/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/model/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/model/db_models.py b/archived_sigs/datacompliance/dataset-reviewer/main/model/db_models.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/model/db_models.py rename to archived_sigs/datacompliance/dataset-reviewer/main/model/db_models.py diff --git a/sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py b/archived_sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py rename to archived_sigs/datacompliance/dataset-reviewer/main/service/dataset_review.py diff --git a/sigs/datacompliance/dataset-reviewer/main/util/__init__.py b/archived_sigs/datacompliance/dataset-reviewer/main/util/__init__.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/util/__init__.py rename to archived_sigs/datacompliance/dataset-reviewer/main/util/__init__.py diff --git a/sigs/datacompliance/dataset-reviewer/main/util/namespace.py b/archived_sigs/datacompliance/dataset-reviewer/main/util/namespace.py similarity index 100% rename from sigs/datacompliance/dataset-reviewer/main/util/namespace.py rename to archived_sigs/datacompliance/dataset-reviewer/main/util/namespace.py diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/API-Document.png diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/Database.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/Database.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/Database.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/Database.png diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/hierarchical-architecture.png diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug1.png diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug2.png diff --git a/sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png b/archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png similarity index 100% rename from sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png rename to archived_sigs/datacompliance/dataset-reviewer/readme_src/werkzeug_vlab.png diff --git a/sigs/datacompliance/dataset-reviewer/requirements.txt b/archived_sigs/datacompliance/dataset-reviewer/requirements.txt similarity index 100% rename from sigs/datacompliance/dataset-reviewer/requirements.txt rename to archived_sigs/datacompliance/dataset-reviewer/requirements.txt diff --git a/sigs/datacompliance/merged_data/.keep b/archived_sigs/datacompliance/merged_data/.keep similarity index 100% rename from sigs/datacompliance/merged_data/.keep rename to archived_sigs/datacompliance/merged_data/.keep diff --git a/sigs/datacompliance/merged_data1.json b/archived_sigs/datacompliance/merged_data1.json similarity index 99% rename from sigs/datacompliance/merged_data1.json rename to archived_sigs/datacompliance/merged_data1.json index e7d7a51..9d1b0dd 100644 --- a/sigs/datacompliance/merged_data1.json +++ b/archived_sigs/datacompliance/merged_data1.json @@ -1,197 +1,197 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2011-2023 XIANGHA.COM", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "美食杰文化传媒有限公司版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " 食品伙伴网拥有本网站内所有信息内容(除食品伙伴网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明; \\n\\n 食品伙伴网(www.foodmate.net)所有的产品、技术与所有程序均属于食品伙伴网知识产权。“foodmate”、 “食品伙伴网”、其他产品服务名称及相关图形、标识等为食品伙伴网的知识产权。未经食品伙伴网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,食品伙伴网将依法追究法律责任。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "重申本站之禁止行为\\n  1)用户不得截获、篡改、收集、储存厨 studio/专栏/电子书等内容;\\n\\n  2)用户不得对厨 studio/专栏/电子书等内容,以文字、录音、截图、录屏等方式,用于公开使用或提供给第三方使用;\\n\\n  3)用户不得以其他方式侵犯本平台及平台之合作方知识产权;\\n\\n  4)账号使用须遵循自用原则,禁止转让、共享账号。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright© 2005-2023", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 xinshipu.com, all rights reserved.", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2011-2023 XIANGHA.COM", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "4.1 您应在遵守本协议、法律法规及其他规范性文件的前提下访问和使用我们的产品及/或服务。您同意,您不会进行或利用我们的产品及/或服务进行下列活动(也不为他人进行下列活动提供便利和支持):\\n\\n4.1.1 以任何方式危害未成年人及/或其他人;\\n\\n4.1.2 从事侵犯我们或他人合法权益的活动或违法犯罪活动,包括为上述活动提供帮助;\\n\\n4.1.3 未经我们及他人(如涉及)事先明确书面许可,自行或委托他人以任何方式(包括但不限于机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件)获取平台的服务、内容、数据(包括但不限于业务数据和用户的个人信息);\\n\\n4.1.4 规避、移除、更改、阻碍、破坏或以其他方式扰乱我们用于保护我们的产品及/或服务的安全措施;\\n\\n4.1.5 未经我们明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示我们的产品及/或内容(但如您的上述行为不构成侵权的除外);", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "5. 知识产权\\n5.1\\n美食杰提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料均受版权、商标和/或其它财产所有权法律的保护,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。所有这些资料或资料的任何部分仅可作为私人和非商业用途而保存在某台计算机内。美食杰不就由上述资料产生或在传送或递交全部或部分上述资料过程中产生的延误、不准确、错误和遗漏或从中产生或由此产生的任何损害赔偿,以任何形式,向用户或任何第三方负责。\\n5.2\\n任何单位或个人认为美食杰网站中的内容可能涉嫌侵犯其合法权益,可以及时向美食杰书面或邮件反馈,并提供详细侵权情况证明,美食杰在收到上述法律文件后,将会尽快移除被控侵权内容。\\n5.3\\n用户在美食杰注册之后在网站上产生的内容,即位默认美食杰拥有无偿使用权。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2011 系统之家(www.xitongzhijia.net) 版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "5、经作者授权,泡泡网声明:泡泡网旗下网站所载之作品(不含互动服务),未经过泡泡网书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载,不得以任何方式建立镜像站点。否则,泡泡网将通过行政投诉、民事诉讼等方式追究侵权者的侵权责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "北京传奇极客管理咨询有限公司 Copyright © 2009 - 2023", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "4. 知识产权;许可\\n\\n \\n\\n(1) “中关村在线”提供的网络服务中包含的全部信息(包括但不限于任何文本、图片、音频及视频等)以及为提供服务而使用的任何软件等均受知识产权和其他相关法律保护。用户仅可以为个人和非商业目的使用“中关村在线”的网络服务。除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。\\n\\n(2) 如果用户希望复制、转发或以其他方式使用“中关村在线”网站的任何内容或作品的,请与中关村在线联系:marketing@zol.com.cn。\\n\\n(3) “本协议”未授权用户使用“中关村在线”的任何商标、服务标识和域名。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本站所有文章均为作者本人创作,版权为作者所有,除非取得作者的明确授权,一律谢绝全文转载于其他网站。请尊重我们的劳动、自觉遵守规则。您有意无意的转载,伤害的不仅是一个人的创作热情。本站并非随意的娱乐性质站点,而是正式的科学性质网站!我们需要尽最大的努力保证内容的正确性,为了避免错误的知识在转载过程中以讹传讹,最终误导他人,请在向他人推荐时仅仅给出文章内容摘要和网址,而不要采用复制全文的传播方式。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权声明\\n\\n南方财富网独立拥有原创内容的版权(注明引用他方的图片内容除外),未经南方财富网明确书面许可,任何人不得对该内容进行复制、修改再使用、传播,或在非南方财富网所属的服务器上做镜像处理。\\n\\n凡来源非“南方财富网”的内容,均为转载、整理或用户投稿(包括但不限于文本、图片、数据、观点、建议等内容),其目的在于促进信息传播及交流,并不代表本网赞同其观点或对其内容的真实性负责。如其他媒体、单位或个人从本网下载使用,应予保留本网注明的“来源”,并自负版权等法律责任。\\n\\n另外,部分内容或没有作者署名,或署名错误,致使本网无法联系作者本人,亦无法通过事先许可的方式获得授权。同时,由于网络信息量巨大,在取得作者授权方面亦难免出现遗漏。如本网转载、整理及投稿的内容涉及版权问题,请作者持相应版权证明与本网联系做删除处理。联系邮箱:jubao@southmoney.com", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "浙江同花顺基金销售有限公司版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2004-2023 64365.com版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2004-2023 法律快车", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2003-2023 找法网", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "严禁采集,违者必究\\n©2004-2022 m.64365.com All Rights Reserved", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "法邦版权本网站包含之所有内容:文本、图形、LOGO、创意、及软件等之所有权归属法邦网及本网站的内容/信息提供者,受中国及国际版权法的保护。对本网站上所有内容之复制(意指收集、组合和重新组合),本网站享有排他权并受中国及国际版权法的保护。本网站使用的所有软件的所有权归属于法邦网或它的软件供应商并受中国及国际版权法的保护。在本网站上的内容和软件可以用作信息获取网上交易及网上拍卖的信息资源,对本网站该等内容的任何其他使用,包括再造、修改、发布、转发、再版、演示或播出被严格禁止。转载文章凡本网注明“来源:法邦网”的所有作品,版权均属于法邦网,未经授权不得转载、摘编或利用其它方式使用上述作品。已经授权使用作品的,应在授权范围内使用,并注明“来源:法邦网”。违反上述声明者,本网将追究其相关法律责任。\\n\\n凡本网注明“来源:XXX(非法邦网)”的作品,均转载自其它媒体,版权归原作者及网站所有,转载的目的是为公众提供免费的法律资讯,普及法律知识,服务社会公众,并不代表本网赞同其观点和对其真实性负责。如果您对本网转载文章版权的归属存有异议或有其他任何问题,请与我们联系。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "第九条\\n\\n用户不得对本网站服务的任何部分或本网站服务之使用以及获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "\\n三、知识产权\\n\\n为了向用户提供高质量的信息,“什么值得买” 管理员有权对用户发表的内容进行合理的编辑和修改。用户在“什么值得买”上发表的全部内容,著作权归其本人和 “什么值得买”运营公司共同所有。用户和“什么值得买”均可授权第三方以任何方式使用该内容,不需要得到对方的同意。他人未经明确授权,不得使用该内容。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2013-2023. diyiyou.com All Rights Reserved.", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "7. 禁止用户利用BOSS直聘平台从事其他的违法行为,包括但不限于:\\n\\n利用BOSS直聘提供的开聊服务从事欺诈、传销、刷流量、好评、违法物品营销等行为;\\n冒用、混淆他人账号的昵称、头像、企业介绍发布招聘信息的,或冒充、利用他人名义对外招聘的;\\n可能存在拖欠或未依法支付薪资或劳务报酬等可能损害劳动者或劳务人员合法权益的行为;\\n未经BOSS直聘公司的许可自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取;“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n为他人提供自动登录到本平台、代办或协助他人代办身份认证的服务或代售身份认证所需的相关材料或凭据。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "4.3 通过任何技术手段侵入平台的软件、网站、数据库等系统,非法抓取平台数据或者干扰猎聘产品和/或服务正常运行的。非法抓取是指采用程序或者非正常浏览等技术手段获取内容数据的行为,包括但不限于采用“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n\\n4.4 任何利用自有或第三方的插件或程序盗链、抓取、读取、模拟下载、深度链接、收集平台展示的任何信息的;\\n\\n4.5 侵犯猎聘或第三方的专利权、著作权、商标权、名誉权或其他任何合法权益的行为;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "第六章 版权声明\\n\\n第四十一条 本网站除因站务管理需要并已获得网站授权而由网站管理人员发布的公告类帖文外,任何会员(包括本站各级管理人员)发表的文章或图片仅代表作者本人观点,与本网站立场无关,作者文责自负。\\n第四十二条 任何会员的合法言论、文章及图片一经在本站发表,该作品的版权,除署名权、发表权、修改权、保护作品完整权归原作者享有外,其他权益即无偿转归本站独占所有,除本站外的任何单位或个人未经本站的正式授权许可不得以任何方式使用上述作品。\\n第四十三条 前款所指的“其他权益”包括但不限于:通过复制、发行、信息网络传播、改编、翻译、汇编及应由版权人享有的其他方式使用上述作品并获得报酬的财产权利,以及许可他人以上述方式使用并获得报酬的权利。\\n第四十四条 前款述及的由本站独占所有的各项权利涵盖本站已经发布或将要发布的所有内容(包括但不限于:文字、图片、图像、音频、视频等),任何单位或个人不得以任何方式(包括但不限于:转载、摘编、复制、剪辑等)擅自使用上述内容,或利用这些内容再造与之相关的衍生作品。\\n第四十五条 任何转载、引用发表于本站的版权文章须符合以下规范:\\n(1) 用于非商业、非盈利、非广告性目的时需注明作者及作品的出处为\"职朋\"。\\n(2) 用于商业、盈利、广告性目的时需征得网站和作品原作者的同意,并注明作者姓名、授权范围及原作出处\"职朋\"。不得未经作者同意而剽窃、引用本网站的任何版权作品,否则本网站将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\\n(3) 任何作品的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "13.未经店长直聘公司的许可,以任何母的自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取,用于商业用途或其他任何目的。“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术设施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "职朋职业圈版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2010-2020 zx123.cn", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "2.土巴兔提示您,您通过自身账号在接受土巴兔的各项服务中所上传、发送的任何内容都应具有合法来源,如相关内容涉及任何第三方的合法权益,应事先获得相应的许可。如土巴兔收到涉及您的相关举报或投诉,土巴兔可采取相关法律法规所要求或允许的方式,向相关争议方、相关部门提供包括账号在内的必要的信息,以便解决纠纷争议,保护正当权利人的合法权益。\\n\\n3.除非法律允许或土巴兔书面许可,您使用本网站过程中不得从事下列行为:\\n\\n(1)删除本网站及其副本上关于著作权的信息;\\n\\n(2)对本网站进行反向工程、反向汇编、反向编译,或者以其他方式尝试发现本网站的源代码;\\n\\n(3)对土巴兔拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;\\n\\n(4)对本网站或者本网站运行过程中释放到任何终端内存中的数据、网站运行过程中客户端与服务器端的交互数据,以及本网站运行所必需的系统数据,进行复制、修改、增加、删除、挂接运行或创作任何衍生作品,形式包括但不限于使用插件、外挂或非经土巴兔授权的第三方工具/服务接入本网站和相关系统;\\n\\n(5)通过修改或伪造网站运行中的指令、数据,增加、删减、变动网站的功能或运行效果,或者将用于上述用途的软件、方法进行运营或向公众传播,无论这些行为是否为商业目的;\\n\\n(6)通过非土巴兔开发、授权的第三方软件、插件、外挂、系统,登录或使用本网站及服务,或制作、发布、传播上述工具;\\n\\n(7)自行或者授权他人、第三方软件对本网站及其组件、模块、数据进行干扰;\\n\\n(8)自行转载他人文章或者上传他人设计作品时未事先征得原作者同意并注明原作者姓名出处及版权仅归原作者所有。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2016-2021k.jinbaodm.com .All Rights Reserved .\\n\\n本站所有资源均收集于互联网其它网站,本站不提供影片资源存储,也不参与录制、上传,若本站收录的节目无意侵犯了贵司版权,请留言,我们会及时处理断开连接,谢谢。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2022 朵朵女性网 ddnx.com版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 XIANGHA.COM", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "美食杰文化传媒有限公司版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 食品伙伴网拥有本网站内所有信息内容(除食品伙伴网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明; \\n\\n 食品伙伴网(www.foodmate.net)所有的产品、技术与所有程序均属于食品伙伴网知识产权。“foodmate”、 “食品伙伴网”、其他产品服务名称及相关图形、标识等为食品伙伴网的知识产权。未经食品伙伴网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,食品伙伴网将依法追究法律责任。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "重申本站之禁止行为\\n  1)用户不得截获、篡改、收集、储存厨 studio/专栏/电子书等内容;\\n\\n  2)用户不得对厨 studio/专栏/电子书等内容,以文字、录音、截图、录屏等方式,用于公开使用或提供给第三方使用;\\n\\n  3)用户不得以其他方式侵犯本平台及平台之合作方知识产权;\\n\\n  4)账号使用须遵循自用原则,禁止转让、共享账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 2005-2023", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 xinshipu.com, all rights reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 XIANGHA.COM", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4.1 您应在遵守本协议、法律法规及其他规范性文件的前提下访问和使用我们的产品及/或服务。您同意,您不会进行或利用我们的产品及/或服务进行下列活动(也不为他人进行下列活动提供便利和支持):\\n\\n4.1.1 以任何方式危害未成年人及/或其他人;\\n\\n4.1.2 从事侵犯我们或他人合法权益的活动或违法犯罪活动,包括为上述活动提供帮助;\\n\\n4.1.3 未经我们及他人(如涉及)事先明确书面许可,自行或委托他人以任何方式(包括但不限于机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件)获取平台的服务、内容、数据(包括但不限于业务数据和用户的个人信息);\\n\\n4.1.4 规避、移除、更改、阻碍、破坏或以其他方式扰乱我们用于保护我们的产品及/或服务的安全措施;\\n\\n4.1.5 未经我们明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示我们的产品及/或内容(但如您的上述行为不构成侵权的除外);", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5. 知识产权\\n5.1\\n美食杰提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料均受版权、商标和/或其它财产所有权法律的保护,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。所有这些资料或资料的任何部分仅可作为私人和非商业用途而保存在某台计算机内。美食杰不就由上述资料产生或在传送或递交全部或部分上述资料过程中产生的延误、不准确、错误和遗漏或从中产生或由此产生的任何损害赔偿,以任何形式,向用户或任何第三方负责。\\n5.2\\n任何单位或个人认为美食杰网站中的内容可能涉嫌侵犯其合法权益,可以及时向美食杰书面或邮件反馈,并提供详细侵权情况证明,美食杰在收到上述法律文件后,将会尽快移除被控侵权内容。\\n5.3\\n用户在美食杰注册之后在网站上产生的内容,即位默认美食杰拥有无偿使用权。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2011 系统之家(www.xitongzhijia.net) 版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5、经作者授权,泡泡网声明:泡泡网旗下网站所载之作品(不含互动服务),未经过泡泡网书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载,不得以任何方式建立镜像站点。否则,泡泡网将通过行政投诉、民事诉讼等方式追究侵权者的侵权责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京传奇极客管理咨询有限公司 Copyright © 2009 - 2023", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4. 知识产权;许可\\n\\n \\n\\n(1) “中关村在线”提供的网络服务中包含的全部信息(包括但不限于任何文本、图片、音频及视频等)以及为提供服务而使用的任何软件等均受知识产权和其他相关法律保护。用户仅可以为个人和非商业目的使用“中关村在线”的网络服务。除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。\\n\\n(2) 如果用户希望复制、转发或以其他方式使用“中关村在线”网站的任何内容或作品的,请与中关村在线联系:marketing@zol.com.cn。\\n\\n(3) “本协议”未授权用户使用“中关村在线”的任何商标、服务标识和域名。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站所有文章均为作者本人创作,版权为作者所有,除非取得作者的明确授权,一律谢绝全文转载于其他网站。请尊重我们的劳动、自觉遵守规则。您有意无意的转载,伤害的不仅是一个人的创作热情。本站并非随意的娱乐性质站点,而是正式的科学性质网站!我们需要尽最大的努力保证内容的正确性,为了避免错误的知识在转载过程中以讹传讹,最终误导他人,请在向他人推荐时仅仅给出文章内容摘要和网址,而不要采用复制全文的传播方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明\\n\\n南方财富网独立拥有原创内容的版权(注明引用他方的图片内容除外),未经南方财富网明确书面许可,任何人不得对该内容进行复制、修改再使用、传播,或在非南方财富网所属的服务器上做镜像处理。\\n\\n凡来源非“南方财富网”的内容,均为转载、整理或用户投稿(包括但不限于文本、图片、数据、观点、建议等内容),其目的在于促进信息传播及交流,并不代表本网赞同其观点或对其内容的真实性负责。如其他媒体、单位或个人从本网下载使用,应予保留本网注明的“来源”,并自负版权等法律责任。\\n\\n另外,部分内容或没有作者署名,或署名错误,致使本网无法联系作者本人,亦无法通过事先许可的方式获得授权。同时,由于网络信息量巨大,在取得作者授权方面亦难免出现遗漏。如本网转载、整理及投稿的内容涉及版权问题,请作者持相应版权证明与本网联系做删除处理。联系邮箱:jubao@southmoney.com", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "浙江同花顺基金销售有限公司版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2004-2023 64365.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2023 法律快车", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2003-2023 找法网", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "严禁采集,违者必究\\n©2004-2022 m.64365.com All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "法邦版权本网站包含之所有内容:文本、图形、LOGO、创意、及软件等之所有权归属法邦网及本网站的内容/信息提供者,受中国及国际版权法的保护。对本网站上所有内容之复制(意指收集、组合和重新组合),本网站享有排他权并受中国及国际版权法的保护。本网站使用的所有软件的所有权归属于法邦网或它的软件供应商并受中国及国际版权法的保护。在本网站上的内容和软件可以用作信息获取网上交易及网上拍卖的信息资源,对本网站该等内容的任何其他使用,包括再造、修改、发布、转发、再版、演示或播出被严格禁止。转载文章凡本网注明“来源:法邦网”的所有作品,版权均属于法邦网,未经授权不得转载、摘编或利用其它方式使用上述作品。已经授权使用作品的,应在授权范围内使用,并注明“来源:法邦网”。违反上述声明者,本网将追究其相关法律责任。\\n\\n凡本网注明“来源:XXX(非法邦网)”的作品,均转载自其它媒体,版权归原作者及网站所有,转载的目的是为公众提供免费的法律资讯,普及法律知识,服务社会公众,并不代表本网赞同其观点和对其真实性负责。如果您对本网转载文章版权的归属存有异议或有其他任何问题,请与我们联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "第九条\\n\\n用户不得对本网站服务的任何部分或本网站服务之使用以及获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "\\n三、知识产权\\n\\n为了向用户提供高质量的信息,“什么值得买” 管理员有权对用户发表的内容进行合理的编辑和修改。用户在“什么值得买”上发表的全部内容,著作权归其本人和 “什么值得买”运营公司共同所有。用户和“什么值得买”均可授权第三方以任何方式使用该内容,不需要得到对方的同意。他人未经明确授权,不得使用该内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2013-2023. diyiyou.com All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "7. 禁止用户利用BOSS直聘平台从事其他的违法行为,包括但不限于:\\n\\n利用BOSS直聘提供的开聊服务从事欺诈、传销、刷流量、好评、违法物品营销等行为;\\n冒用、混淆他人账号的昵称、头像、企业介绍发布招聘信息的,或冒充、利用他人名义对外招聘的;\\n可能存在拖欠或未依法支付薪资或劳务报酬等可能损害劳动者或劳务人员合法权益的行为;\\n未经BOSS直聘公司的许可自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取;“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n为他人提供自动登录到本平台、代办或协助他人代办身份认证的服务或代售身份认证所需的相关材料或凭据。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "4.3 通过任何技术手段侵入平台的软件、网站、数据库等系统,非法抓取平台数据或者干扰猎聘产品和/或服务正常运行的。非法抓取是指采用程序或者非正常浏览等技术手段获取内容数据的行为,包括但不限于采用“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术措施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;\\n\\n4.4 任何利用自有或第三方的插件或程序盗链、抓取、读取、模拟下载、深度链接、收集平台展示的任何信息的;\\n\\n4.5 侵犯猎聘或第三方的专利权、著作权、商标权、名誉权或其他任何合法权益的行为;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "第六章 版权声明\\n\\n第四十一条 本网站除因站务管理需要并已获得网站授权而由网站管理人员发布的公告类帖文外,任何会员(包括本站各级管理人员)发表的文章或图片仅代表作者本人观点,与本网站立场无关,作者文责自负。\\n第四十二条 任何会员的合法言论、文章及图片一经在本站发表,该作品的版权,除署名权、发表权、修改权、保护作品完整权归原作者享有外,其他权益即无偿转归本站独占所有,除本站外的任何单位或个人未经本站的正式授权许可不得以任何方式使用上述作品。\\n第四十三条 前款所指的“其他权益”包括但不限于:通过复制、发行、信息网络传播、改编、翻译、汇编及应由版权人享有的其他方式使用上述作品并获得报酬的财产权利,以及许可他人以上述方式使用并获得报酬的权利。\\n第四十四条 前款述及的由本站独占所有的各项权利涵盖本站已经发布或将要发布的所有内容(包括但不限于:文字、图片、图像、音频、视频等),任何单位或个人不得以任何方式(包括但不限于:转载、摘编、复制、剪辑等)擅自使用上述内容,或利用这些内容再造与之相关的衍生作品。\\n第四十五条 任何转载、引用发表于本站的版权文章须符合以下规范:\\n(1) 用于非商业、非盈利、非广告性目的时需注明作者及作品的出处为\"职朋\"。\\n(2) 用于商业、盈利、广告性目的时需征得网站和作品原作者的同意,并注明作者姓名、授权范围及原作出处\"职朋\"。不得未经作者同意而剽窃、引用本网站的任何版权作品,否则本网站将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\\n(3) 任何作品的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "13.未经店长直聘公司的许可,以任何母的自行或授权、允许、协助任何第三人对平台内的任何信息内容进行非法获取,用于商业用途或其他任何目的。“非法获取”是指采用包括但不限于“蜘蛛”(spider)程序、爬虫程序、拟人程序等非真实用户或避开、破坏技术设施等非正常浏览的手段、方式,读取、复制、转存、获得数据和信息内容的行为;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "职朋职业圈版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2010-2020 zx123.cn", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2.土巴兔提示您,您通过自身账号在接受土巴兔的各项服务中所上传、发送的任何内容都应具有合法来源,如相关内容涉及任何第三方的合法权益,应事先获得相应的许可。如土巴兔收到涉及您的相关举报或投诉,土巴兔可采取相关法律法规所要求或允许的方式,向相关争议方、相关部门提供包括账号在内的必要的信息,以便解决纠纷争议,保护正当权利人的合法权益。\\n\\n3.除非法律允许或土巴兔书面许可,您使用本网站过程中不得从事下列行为:\\n\\n(1)删除本网站及其副本上关于著作权的信息;\\n\\n(2)对本网站进行反向工程、反向汇编、反向编译,或者以其他方式尝试发现本网站的源代码;\\n\\n(3)对土巴兔拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;\\n\\n(4)对本网站或者本网站运行过程中释放到任何终端内存中的数据、网站运行过程中客户端与服务器端的交互数据,以及本网站运行所必需的系统数据,进行复制、修改、增加、删除、挂接运行或创作任何衍生作品,形式包括但不限于使用插件、外挂或非经土巴兔授权的第三方工具/服务接入本网站和相关系统;\\n\\n(5)通过修改或伪造网站运行中的指令、数据,增加、删减、变动网站的功能或运行效果,或者将用于上述用途的软件、方法进行运营或向公众传播,无论这些行为是否为商业目的;\\n\\n(6)通过非土巴兔开发、授权的第三方软件、插件、外挂、系统,登录或使用本网站及服务,或制作、发布、传播上述工具;\\n\\n(7)自行或者授权他人、第三方软件对本网站及其组件、模块、数据进行干扰;\\n\\n(8)自行转载他人文章或者上传他人设计作品时未事先征得原作者同意并注明原作者姓名出处及版权仅归原作者所有。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站的内容,如文字、图形、图像、音乐、标识、图标按钮、链接、HTML编码、商标、软件和其他资料(以下统称\"资料\"),以及本网站所有资料的汇集(指收集、安排和汇编)均受著作权法、商标法和其他适用法律的保护。所有资料和资料的汇集均属本网站或本网站的内容提供者或客户的专有财产。未经授权擅自使用任何资料将违反著作权法、商标法和其他适用法律。如果您复制任何资料,您必须在复制件上保留原资料中有关版权、商标、服务标志以及其他专有权的告示。您只能复制一份资料,并且除非这些资料另有具体规定,复制件仅可用在私人、非商业用途。未经本网站事先的书面同意,您不得为了任何公共或商业目的销售或更改资料,或者复制、重制、再版、上载、下载、登载、传送、显示、公开执行或以任何方式发送资料,或将资料存储于检索系统,或以其他任何方式使用资料。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2016-2021k.jinbaodm.com .All Rights Reserved .\\n\\n本站所有资源均收集于互联网其它网站,本站不提供影片资源存储,也不参与录制、上传,若本站收录的节目无意侵犯了贵司版权,请留言,我们会及时处理断开连接,谢谢。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2022 朵朵女性网 ddnx.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data10.json b/archived_sigs/datacompliance/merged_data10.json similarity index 99% rename from sigs/datacompliance/merged_data10.json rename to archived_sigs/datacompliance/merged_data10.json index 188e66a..5bc8825 100644 --- a/sigs/datacompliance/merged_data10.json +++ b/archived_sigs/datacompliance/merged_data10.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2002-2017 可可诗词网 版权所有 ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2021 WWW.JIEYAN8.CN 版权所有", - "output": "这是古诗词类数据,属于公共领域知识,风险低" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 北京中教双元科技集团有限公司 EOL Corporation  除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright© 2019-2023 弈方广告 86历史网 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "诗词吾爱网 ©2009-2023 任何转载、引用发表于本网站的版权文章须符合以下规范:\\n    (1)征得文章或图片原作者同意,注明作者及文章及图片的出处为\"诗词吾爱网\"(www.52shici.com),并向作者支付稿酬。\\n    (2)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 完美知识 版权所有 未经完美知识事先书面许可,任何人不得擅自使用、监视、复制、传播、展示、镜像、上传、下载全历史软件及相关服务中的内容(也包括通过任何机器人、蜘蛛等程序或设备进行操作)。未经完美知识事先书面许可,除5.6条规定的情况外,您不得以任何营利性或非营利性的目的修改、复制、传播、传送、发行、转移、销售全历史产品与/或服务所使用的知识产权或创造、制作与其有关的派生产品或衍生品或者利用全历史产品与/或服务之部分或全部向任何第三方提供服务或产品。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有北京中教双元科技集团有限公司EOL Corporation", - "output": "这是古诗词类数据,属于公共领域知识,风险低" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2000-2020 Dunhuangtour.com Inc. All rights reserve ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 Airbnb, Inc. All rights reserved 未经我们同意,请勿使用、复制、显示、镜像或嵌置爱彼迎平台、任何内容、任何爱彼迎品牌或任何页面布局或设计", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中央广播电视台 央视网 版权所有 任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 Mafengwo.cn 不得对马蜂窝上的任何数据作商业性利用,包括但不限于在未经马蜂窝事先书面同意的情况下,以复制、发布、传播等任何方式使用马蜂窝上展示的资料;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2002-2017 可可诗词网 版权所有 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2021 WWW.JIEYAN8.CN 版权所有", + "output": "这是古诗词类数据,属于公共领域知识,风险低" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 北京中教双元科技集团有限公司 EOL Corporation  除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 2019-2023 弈方广告 86历史网 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "诗词吾爱网 ©2009-2023 任何转载、引用发表于本网站的版权文章须符合以下规范:\\n    (1)征得文章或图片原作者同意,注明作者及文章及图片的出处为\"诗词吾爱网\"(www.52shici.com),并向作者支付稿酬。\\n    (2)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 完美知识 版权所有 未经完美知识事先书面许可,任何人不得擅自使用、监视、复制、传播、展示、镜像、上传、下载全历史软件及相关服务中的内容(也包括通过任何机器人、蜘蛛等程序或设备进行操作)。未经完美知识事先书面许可,除5.6条规定的情况外,您不得以任何营利性或非营利性的目的修改、复制、传播、传送、发行、转移、销售全历史产品与/或服务所使用的知识产权或创造、制作与其有关的派生产品或衍生品或者利用全历史产品与/或服务之部分或全部向任何第三方提供服务或产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有北京中教双元科技集团有限公司EOL Corporation", + "output": "这是古诗词类数据,属于公共领域知识,风险低" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权 北京中教双元科技集团有限公司 Corporation 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2020 Dunhuangtour.com Inc. All rights reserve ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 Airbnb, Inc. All rights reserved 未经我们同意,请勿使用、复制、显示、镜像或嵌置爱彼迎平台、任何内容、任何爱彼迎品牌或任何页面布局或设计", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中央广播电视台 央视网 版权所有 任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 Mafengwo.cn 不得对马蜂窝上的任何数据作商业性利用,包括但不限于在未经马蜂窝事先书面同意的情况下,以复制、发布、传播等任何方式使用马蜂窝上展示的资料;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data11.json b/archived_sigs/datacompliance/merged_data11.json similarity index 99% rename from sigs/datacompliance/merged_data11.json rename to archived_sigs/datacompliance/merged_data11.json index bb0d62d..fe8d316 100644 --- a/sigs/datacompliance/merged_data11.json +++ b/archived_sigs/datacompliance/merged_data11.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2003-2023 dianping.com, All Rights Reserved. 本站发布的所有内容,未经许可,不得转载", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2013-2023 华夏EV网 版权所有 若有关媒体、网站或个人从本网站下载使用文章、图片等相关信息,请在转载、使用该等信息时务必尊重该信息的版权或相关权利,保留本网站注明的“稿件来源”,并自行承担版权、商标权等法律责任;若擅自篡改或以其他方式损害来源为“华夏EV网”网站的相关信息,本网站保留追究其法律责任的权利用途。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:车主之家(www.16888.com) 除本协议明确规定外,未经车主之家事先明确书面同意,您不可以任何方式 (包括“镜像”) 将车主之家的任何部分及任何内容复制、再制、重印、上传、发布、公开展示、编码、翻译、传输或散布至任何其他计算机、服务器、网站、客户端或其他媒介。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "@2011-2023 www.autotimes.com.cn ALL Rights Reserved. 汽车时代网 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2007 - 2023 58che.com All Rights Reserved. 版权所有 北京五八汽车科技股份有限公司 用户不得对他人张贴在公开使用区域或本服务其他内容进行复制、出售或用作其他商业用途。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2009 - 2023 www.360che.com All Rights Reserved.北京卡车之家信息技术股份有限公司 版权所有 未经卡车之家的明确书面许可,任何第三方不得为任何非私人或商业目的获取或使用卡车之家网站的任何部分或通过卡车之家网站可直接或间接获得的任何内容、服务或资料。任何第三方违反本协议的规定以任何方式,和/或以任何文字对卡车之家的任何部分进行发表、复制、转载、更改、引用、链接、下载或以其他方式进行使用", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2002-2023 www.xcar.com.cn All rights reserved. 北京智德典康电子商务有限公司(爱卡汽车) 版权所有 未经本公司事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“爱卡汽车”提供的网络服务中包含的任何信息。\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright Notice © 2016 Gasgoo.com Corporation and its licensors. All rights reserved. User, by accepting this Agreement, agrees and acknowledges, will not copy, reproduce or download any information, text, images, video clips, directories, files, databases or listings available on Sites, for the purpose of re-selling or re-distributing Sites content, mass mailing, or otherwise commercially exploiting Sites content without written permission from Gasgoo.com. ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "凤凰新媒体版权所有Copyright © 2019 Phoenix New Media Limited All Rights Reserved. 凤凰网提供的会员服务内容(包括但不限于文字、照片、图形、图像、图表、声音、FLASH 动画、视频、音频等)的知识产权均属于凤凰网所有,或由第三方授权使用。会员不能擅自复制、改编这些内容、或创造与内容有关的衍生产品。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2018-2022 焉知 All Right Reserved ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2013-2014 银河演员网(演员表,演员网) All Rights Reserved.", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2003-2023 dianping.com, All Rights Reserved. 本站发布的所有内容,未经许可,不得转载", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2004-2023 © 穷游网® qyer.com All rights reserved. 本网站上刊载的所有内容以及本网站用户发表并授权刊载于本网站的所有内容,包括但不限于文字、图片、声音、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序、数据、数据文件、发现、发明、作品、设计、技术、方法、流程、计划、公式、专栏目录与名称、内容分类标准、过去、目前和计划的研究开发成果以及任何其他信息或资料,均受中国现行法律法规、规章制度及适用之国际公约中有关着作权、商标权、专利权及/或其它财产所有权法律的保护,为本公司所有。使用者将本网站上刊载的内容与服务用于商业、盈利、广告性目的时,需征得本公司的书面特别授权,注明作者及文章出处并按有关规定支付相应费用。未经本公司的明确书面特别授权,任何人不得为任何目的使用以及向任何自然人或单位提供、披露、复印、复制、出售、出让、许可、营销、出版、宣讲、转让、处置或利用本网站上提供的任何内容或服务", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2013-2023 华夏EV网 版权所有 若有关媒体、网站或个人从本网站下载使用文章、图片等相关信息,请在转载、使用该等信息时务必尊重该信息的版权或相关权利,保留本网站注明的“稿件来源”,并自行承担版权、商标权等法律责任;若擅自篡改或以其他方式损害来源为“华夏EV网”网站的相关信息,本网站保留追究其法律责任的权利用途。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用;易车不对由上述资料产生或在传送、递交全部或部分上述资料,使用相关软件过程中产生的延误、不准确、错误和遗漏或由此产生的任何损害进行赔偿,亦无需以任何形式向用户或任何第三方负责。同时,经易车书面同意进行转载的,转载人应标明相关内容出处及原作者相关信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:车主之家(www.16888.com) 除本协议明确规定外,未经车主之家事先明确书面同意,您不可以任何方式 (包括“镜像”) 将车主之家的任何部分及任何内容复制、再制、重印、上传、发布、公开展示、编码、翻译、传输或散布至任何其他计算机、服务器、网站、客户端或其他媒介。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "@2011-2023 www.autotimes.com.cn ALL Rights Reserved. 汽车时代网 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007 - 2023 58che.com All Rights Reserved. 版权所有 北京五八汽车科技股份有限公司 用户不得对他人张贴在公开使用区域或本服务其他内容进行复制、出售或用作其他商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009 - 2023 www.360che.com All Rights Reserved.北京卡车之家信息技术股份有限公司 版权所有 未经卡车之家的明确书面许可,任何第三方不得为任何非私人或商业目的获取或使用卡车之家网站的任何部分或通过卡车之家网站可直接或间接获得的任何内容、服务或资料。任何第三方违反本协议的规定以任何方式,和/或以任何文字对卡车之家的任何部分进行发表、复制、转载、更改、引用、链接、下载或以其他方式进行使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2002-2023 www.xcar.com.cn All rights reserved. 北京智德典康电子商务有限公司(爱卡汽车) 版权所有 未经本公司事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“爱卡汽车”提供的网络服务中包含的任何信息。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司 易车提供的网络服务中所包含的任何文字、软件、图片、图形、图表、网页、音频、视频、域名等相关内容均受中国版权、商标及/或其他财产所有权等法律、法规及/或国际公约的保护,对为提供网络服务而使用的任何软件的一切权利均属于该软件的著作权人,未经易车或相关权利人同意,任何人均不得在任何媒体、任何场合直接或间接发布、使用、修改和再使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 @太平洋汽车 未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright Notice © 2016 Gasgoo.com Corporation and its licensors. All rights reserved. User, by accepting this Agreement, agrees and acknowledges, will not copy, reproduce or download any information, text, images, video clips, directories, files, databases or listings available on Sites, for the purpose of re-selling or re-distributing Sites content, mass mailing, or otherwise commercially exploiting Sites content without written permission from Gasgoo.com. ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凤凰新媒体版权所有Copyright © 2019 Phoenix New Media Limited All Rights Reserved. 凤凰网提供的会员服务内容(包括但不限于文字、照片、图形、图像、图表、声音、FLASH 动画、视频、音频等)的知识产权均属于凤凰网所有,或由第三方授权使用。会员不能擅自复制、改编这些内容、或创造与内容有关的衍生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2018-2022 焉知 All Right Reserved ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2013-2014 银河演员网(演员表,演员网) All Rights Reserved.", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data12.json b/archived_sigs/datacompliance/merged_data12.json similarity index 99% rename from sigs/datacompliance/merged_data12.json rename to archived_sigs/datacompliance/merged_data12.json index 39e4ac8..d4135fc 100644 --- a/sigs/datacompliance/merged_data12.json +++ b/archived_sigs/datacompliance/merged_data12.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2007-2020 ZDFACE Corporation 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得用于任何商业用途,无论是否在资料上明示,所有此等资料都是受到版权法的法律保护。浏览者没有获得妆点网(www.zdface.com)或各自的版权所有者明确的书面同意下,不得分发、修改、散布、再使用、再传递或使用", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2014, Qule Technology Co. Ltd. All Rights Reserved. 北京趣乐科技有限公司 用户不得擅自删除、掩盖或更改弹琴吧的版权声明、商标或其它权利声明。弹琴吧平台所有设计图样以及其他图样、产品及服务名称,均为弹琴吧所享有的商标、标识。任何人不得使用、复制或用作其他用途。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2020 吉他社 除非另有约定或我方另行声明,我方平台所有:产品外观、网站图片、技术、软件、数据等其他信息,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2005 - 2023 咪咕音乐有限公司 除非另有约定或咪咕公司另行声明,咪咕产品内的所有内容(用户自行上传和咪咕公司合作伙伴依法享有权利的内容除外)、技术、软件、程序、数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有知识产权(包括但不限于著作权、商标权、专利权、商业秘密等)及相关权利,均归咪咕公司所有。未经咪咕公司许可,任何人不得擅自使用(包括但不限于复制、传播、展示、镜像、上传、下载、修改、出租)", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2004-2023 KuGou-IncAll Rights Reserved 除非法律允许或酷狗书面许可,用户不得从事下列行为,否则,酷狗将保留依法追究法律责任的权利:(3)对酷狗拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2016 帮学教育 不得侵犯考研帮所有著作权、版权;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight @2020 答案网 www.zqnf.com All Rights Reserved  任何个人、组织、网站只有在获得答案网(www.zqnf.com)或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容或创造与内容有关的派生产品。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright www.zhakao.cn Inc. All 未经授权,禁止转载,违者必究!", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2019 shuashuati.com 不得将本产品用于商业目的的活动之中。任何商业目的的复制、分发、传播、展示必须经得北京深远思维科技的另外许可,如捆绑、赠送、销售、集成、将本产品作为为他人提供服务的工具等。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "copyright © 2010-today pxto.com.cn, All Rights Reserved. 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;", - "output": "已无法访问" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2020 ZDFACE Corporation 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得用于任何商业用途,无论是否在资料上明示,所有此等资料都是受到版权法的法律保护。浏览者没有获得妆点网(www.zdface.com)或各自的版权所有者明确的书面同意下,不得分发、修改、散布、再使用、再传递或使用", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014, Qule Technology Co. Ltd. All Rights Reserved. 北京趣乐科技有限公司 用户不得擅自删除、掩盖或更改弹琴吧的版权声明、商标或其它权利声明。弹琴吧平台所有设计图样以及其他图样、产品及服务名称,均为弹琴吧所享有的商标、标识。任何人不得使用、复制或用作其他用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2020 吉他社 除非另有约定或我方另行声明,我方平台所有:产品外观、网站图片、技术、软件、数据等其他信息,未经相关权利人同意,上述资料均不得在任何媒体直接或间接发布、播放、出于播放或发布目的而改写或再发行,或者被用于其他任何商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005 - 2023 咪咕音乐有限公司 除非另有约定或咪咕公司另行声明,咪咕产品内的所有内容(用户自行上传和咪咕公司合作伙伴依法享有权利的内容除外)、技术、软件、程序、数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有知识产权(包括但不限于著作权、商标权、专利权、商业秘密等)及相关权利,均归咪咕公司所有。未经咪咕公司许可,任何人不得擅自使用(包括但不限于复制、传播、展示、镜像、上传、下载、修改、出租)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2004-2023 KuGou-IncAll Rights Reserved 除非法律允许或酷狗书面许可,用户不得从事下列行为,否则,酷狗将保留依法追究法律责任的权利:(3)对酷狗拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京酷我科技有限公司版权所有 除非法律允许或酷我公司书面许可,用户不得从事下列行为,否则,酷我公司将保留依法追究注律责任的权利: (2)对软件进行反向工程、反向汇编、反向编译或者以其他方式尝试发现软件的源代码(3)对酷我公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2016 帮学教育 不得侵犯考研帮所有著作权、版权;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight @2020 答案网 www.zqnf.com All Rights Reserved  任何个人、组织、网站只有在获得答案网(www.zqnf.com)或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容或创造与内容有关的派生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright www.zhakao.cn Inc. All 未经授权,禁止转载,违者必究!", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2019 shuashuati.com 不得将本产品用于商业目的的活动之中。任何商业目的的复制、分发、传播、展示必须经得北京深远思维科技的另外许可,如捆绑、赠送、销售、集成、将本产品作为为他人提供服务的工具等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright © 2010-today pxto.com.cn, All Rights Reserved. 任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;", + "output": "已无法访问" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data13.json b/archived_sigs/datacompliance/merged_data13.json similarity index 98% rename from sigs/datacompliance/merged_data13.json rename to archived_sigs/datacompliance/merged_data13.json index b86980a..f153711 100644 --- a/sigs/datacompliance/merged_data13.json +++ b/archived_sigs/datacompliance/merged_data13.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © dongao.com Inc. All Rights Reserved天津东奥时代培训学校有限公司版权所有 已获得书面授权,可以使用东奥拥有版权和/或其他相关知识产权的任何内容及商标标识的公司及个人使用上述内容时必须注明来源。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 © 98作文大全网(98zw.com) ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "北京六智信息技术股份有限公司 Copyright © 2005-2023 360doc.com , All Rights Reserved 未经个人图书馆事先许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制个人图书馆网页或其所包含的任何内容。否则,个人图书馆有权依法追究法律责任。\\n【附则】", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2001-2023zuowen.net版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2013-2022 www.sodocs.net", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 成都中品网络科技有限公司 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2003 - 2023JSYKS.COM All Rights Reserved. 版权:南京元贝信息技术有限公司 不得为商业目的而复制、出售、转售或利用本服务的任何部分、本服务的使用或本服务的接入。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 大众信息网 版权所有 您同意,您不得对任何资料作商业性利用,包括但不限于在未经大众信息网授权高层管理人员事先书面批准的情况下,复制在大众信息网网站上展示的任何资料并用于商业用途。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "任何未被授权的浏览、复制、打印和传播属于19楼互联网社区的信息内容,都不得用于商业目的,且所有信息内容及其任何部分的使用都必须包括此版权声明;已经书面授权的,应在授权范围内使用,并注明\"来源:19楼互联网社区\"。违反上述声明者,以侵权论,19楼可以其自己的名义主张权利,包括但不限于提出交涉、投诉、向人民法院提起诉讼等,将依法追究其相关法律责任。\\n", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2006-2023 All rights reserved. 本地宝 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2011-2023 8684.com 任何单位或个人不得以任何方式,以任何文字对8684本地生活的资料作全部和局部复制、转载、引用和链接。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © dongao.com Inc. All Rights Reserved天津东奥时代培训学校有限公司版权所有 已获得书面授权,可以使用东奥拥有版权和/或其他相关知识产权的任何内容及商标标识的公司及个人使用上述内容时必须注明来源。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 98作文大全网(98zw.com) ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "北京六智信息技术股份有限公司 Copyright © 2005-2023 360doc.com , All Rights Reserved 未经个人图书馆事先许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制个人图书馆网页或其所包含的任何内容。否则,个人图书馆有权依法追究法律责任。\\n【附则】", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2001-2023zuowen.net版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2013-2022 www.sodocs.net", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 成都中品网络科技有限公司 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2005-2023 liuxue86.com All rights reserved.出国留学网 版权所有 本站所有内容,凡注明“原创文章、图片、视频”等,版权均属出国留学网所有,任何自然人、法人未经本站授权不得转载、链接、复制等方式发布,如需使用,必须注明来源,“转自(或来源)出国留学网(www.liuxue86.com )”,版权归出国留学网所有,如有侵权将追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2003 - 2023JSYKS.COM All Rights Reserved. 版权:南京元贝信息技术有限公司 不得为商业目的而复制、出售、转售或利用本服务的任何部分、本服务的使用或本服务的接入。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2001-2023 无忧考网版权所有 (北京无忧世纪科技有限公司旗下网站) All Rights Reserved. 无忧考网授权您观看和本网站(简称\"站\")上的内容,但仅供您个人而非商业使用,而且,对于原始内容中所含的版权和其他所有权声明,您必须在其副本中予以保留。您不得以任何方式修改、复制、公开展示、公布或分发这些材料或者以其他方式把它们用于任何公开或商业目的。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 大众信息网 版权所有 您同意,您不得对任何资料作商业性利用,包括但不限于在未经大众信息网授权高层管理人员事先书面批准的情况下,复制在大众信息网网站上展示的任何资料并用于商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何未被授权的浏览、复制、打印和传播属于19楼互联网社区的信息内容,都不得用于商业目的,且所有信息内容及其任何部分的使用都必须包括此版权声明;已经书面授权的,应在授权范围内使用,并注明\"来源:19楼互联网社区\"。违反上述声明者,以侵权论,19楼可以其自己的名义主张权利,包括但不限于提出交涉、投诉、向人民法院提起诉讼等,将依法追究其相关法律责任。\\n", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 All rights reserved. 本地宝 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2011-2023 8684.com 任何单位或个人不得以任何方式,以任何文字对8684本地生活的资料作全部和局部复制、转载、引用和链接。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data14.json b/archived_sigs/datacompliance/merged_data14.json similarity index 98% rename from sigs/datacompliance/merged_data14.json rename to archived_sigs/datacompliance/merged_data14.json index 1720d3f..796f754 100644 --- a/sigs/datacompliance/merged_data14.json +++ b/archived_sigs/datacompliance/merged_data14.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1999-2023 C114 All Rights Reserved | Discuz Licensed 不得利用本站制作、复制和传播下列信息:(十)进行商业广告行为的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2004-2023 www.autohome.com.cn All Rights Reserved. 汽车之家 版权所有 经作者授权,汽车之家声明:汽车之家旗下网站所载之作品(不含互动服务),未经过汽车之家书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " ©2023 中关村在线 版权所有 除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright ©2021 KUANGHUI All Rights Reserved. 匡慧公司 版权所有 未经虎扑书面许可,任何人或机构,不得自行或授权、允许、协助其他人或机构复制、读取、抓取或采用虎扑相关软件或服务中的任何信息内容(亦不可擅自编辑修改后使用),用于包括但不限于宣传、增加阅读量、浏览量等商业用途。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中国工控网(gongkong.com)版权所有© Copyright 不得对本公司及网站的页面内容进行复制、修改、展示、公开传播等及其他任何商业目的的使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2004-2023 YW11.COM. 起名网 All Rights Reserved 对于已经授权本站独家使用提供给本站资料的版权所有人的文章、图片等资料,如需转载使用,需取得本站和版权所有人的同意。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有©解梦吧 2006-2014 ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 . All rights reserved. 1997-2023 粤ICP备2023016683号-1公司版权所有", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "copyright © 2005-2023 www.d1xz.net 第一星座网 版权所有 其他媒体如需转载需按对方标准支付稿酬并标注来源(第一星座网)并链接至(3g.d1xz.net)第一星座网首页。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 杭州火烧云科技有限公司 您和婚礼都应当遵守法律规定,不得侵犯对方以及其他第三人的知识产权权利", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "copyright©2008-2022 3g.d5168.com 周新春易学网 版权所有 ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight © 2008-2023 小百通网 All Rights Reserved.", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 小娃子 版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2023 词林在线词典", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2018 All Rights Reserved", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 C114 All Rights Reserved | Discuz Licensed 不得利用本站制作、复制和传播下列信息:(十)进行商业广告行为的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2023 www.autohome.com.cn All Rights Reserved. 汽车之家 版权所有 经作者授权,汽车之家声明:汽车之家旗下网站所载之作品(不含互动服务),未经过汽车之家书面授权许可,任何单位或个人不得擅自复制、链接、非法使用或转载 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " ©2023 中关村在线 版权所有 除出于使用“中关村在线”服务的目的外,未经“中关村在线”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“中关村在线”提供的网络服务中包含的任何信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2021 KUANGHUI All Rights Reserved. 匡慧公司 版权所有 未经虎扑书面许可,任何人或机构,不得自行或授权、允许、协助其他人或机构复制、读取、抓取或采用虎扑相关软件或服务中的任何信息内容(亦不可擅自编辑修改后使用),用于包括但不限于宣传、增加阅读量、浏览量等商业用途。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国工控网(gongkong.com)版权所有© Copyright 不得对本公司及网站的页面内容进行复制、修改、展示、公开传播等及其他任何商业目的的使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2004-2023 YW11.COM. 起名网 All Rights Reserved 对于已经授权本站独家使用提供给本站资料的版权所有人的文章、图片等资料,如需转载使用,需取得本站和版权所有人的同意。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有©解梦吧 2006-2014 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 . All rights reserved. 1997-2023 粤ICP备2023016683号-1公司版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright © 2005-2023 www.d1xz.net 第一星座网 版权所有 其他媒体如需转载需按对方标准支付稿酬并标注来源(第一星座网)并链接至(3g.d1xz.net)第一星座网首页。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 杭州火烧云科技有限公司 您和婚礼都应当遵守法律规定,不得侵犯对方以及其他第三人的知识产权权利", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "copyright©2008-2022 3g.d5168.com 周新春易学网 版权所有 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2008-2023 小百通网 All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 小娃子 版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 词林在线词典", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2018 All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data15.json b/archived_sigs/datacompliance/merged_data15.json similarity index 99% rename from sigs/datacompliance/merged_data15.json rename to archived_sigs/datacompliance/merged_data15.json index 9cafa17..b58dd3e 100644 --- a/sigs/datacompliance/merged_data15.json +++ b/archived_sigs/datacompliance/merged_data15.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "六维联合信息科技 (北京) 有限公司©版权所有 未经六维公司书面授权许可不得以任何方式(包括但不限于复制本软件系统的部分或者全部;破解本软件系统等加密措施;爬取本软件系统文献数据等)侵犯掌桥科研软件系统著作权及其他相关合法权益", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有© 2001-2023 经由服务传送的信息及内容受到法律的保护,用户未经许可不得进行复制、修改、出租、传播、衍生其它作品及用于商业目的。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 一站阅读 - 蜀ICP备09001226号-1, All Rights Reserved. ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2006-2023 深圳市天助人和信息技术有限公司 版权所有 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2003 - 2023 testmart.cn All Rights Reserved 仪器仪表交易网 版权所有 对本网站上的内容和软件可以作为信息资源获取,但不得对本网站的内容进行再造、修改、发布、转发、再版、演示或播出等。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2009-2023 spzs.com 用户只有在获得食品招商网或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容,或创造与内容有关的派生产品。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 www.jqw.com 版权所有 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得分发、修改、散布、再使用、再传递或使用本网站的内容用于任何公众商业用途。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "企博网 版权所有 © 2006-2025 除法律另有强制性规定外,未经企博网或相关权利人许可,任何单位或个人不得以任何形式非法地全部或部分复制、转载、引用、链接、抓取、反向工程、反向编译、反汇编或以其他方式使用企博网或相关权利人提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料等信息内容", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2007-2023  www.anjuke.com All Rights Reserved 安居客平台以下内容不可任意转载:\\n\\n1)本平台内发布的所有信息;\\n\\n2)已作出不得转载或未经许可不得转载声明的内容;\\n\\n3)本平台中特有的图形、标志、页面风格、编排方式、程序等;\\n\\n4)本平台中必须具有特别授权或具有注册用户资格方可知晓的内容;\\n\\n5)其他法律不允许或本平台认为不适合转载的内容。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "2015 CBS Interactive.万维家电网 版权所有 除出于使用“万维家电网”服务的目的外,未经“万维家电网”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“万维家电网”提供的网络服务中包含的任何信息。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Qiyeku版权所有 © 2006-2023 用户承诺不对企业库任何资料作商业性利用,包括但不限于在未经企业库事先书面批准的情况下,复制企业库网站上展示的任何资料,不能利用企业库各项服务进行销售或其它商业用途。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "一步电子网 版权所有 © 2005-2023 您同意,您不得对任何资料作商业性利用,包括但不限于在未经一步电子网授权高层管理人员事先书面批准的情况下,复制在一步电子网网站上展示的任何资料并用于商业用途。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "@2023 bestb2b.com ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2003-2023 114ic.com All Rights Reserved ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "六维联合信息科技 (北京) 有限公司©版权所有 未经六维公司书面授权许可不得以任何方式(包括但不限于复制本软件系统的部分或者全部;破解本软件系统等加密措施;爬取本软件系统文献数据等)侵犯掌桥科研软件系统著作权及其他相关合法权益", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有© 2001-2023 经由服务传送的信息及内容受到法律的保护,用户未经许可不得进行复制、修改、出租、传播、衍生其它作品及用于商业目的。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 一站阅读 - 蜀ICP备09001226号-1, All Rights Reserved. ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2023 深圳市天助人和信息技术有限公司 版权所有 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2003 - 2023 testmart.cn All Rights Reserved 仪器仪表交易网 版权所有 对本网站上的内容和软件可以作为信息资源获取,但不得对本网站的内容进行再造、修改、发布、转发、再版、演示或播出等。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009-2023 spzs.com 用户只有在获得食品招商网或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容,或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 www.jqw.com 版权所有 浏览者可以下载本网站上显示的资料,但这些资料只限用于个人学习研究使用,不得分发、修改、散布、再使用、再传递或使用本网站的内容用于任何公众商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "企博网 版权所有 © 2006-2025 除法律另有强制性规定外,未经企博网或相关权利人许可,任何单位或个人不得以任何形式非法地全部或部分复制、转载、引用、链接、抓取、反向工程、反向编译、反汇编或以其他方式使用企博网或相关权利人提供的网络服务中包含的任何文本、图片、图形、音频和/或视频资料等信息内容", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2023  www.anjuke.com All Rights Reserved 安居客平台以下内容不可任意转载:\\n\\n1)本平台内发布的所有信息;\\n\\n2)已作出不得转载或未经许可不得转载声明的内容;\\n\\n3)本平台中特有的图形、标志、页面风格、编排方式、程序等;\\n\\n4)本平台中必须具有特别授权或具有注册用户资格方可知晓的内容;\\n\\n5)其他法律不允许或本平台认为不适合转载的内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "2015 CBS Interactive.万维家电网 版权所有 除出于使用“万维家电网”服务的目的外,未经“万维家电网”事先书面同意,用户不得以任何方式复制、转发或以其他方式使用“万维家电网”提供的网络服务中包含的任何信息。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2023 ybzhan.cn All Rights Reserved 未经兴旺宝明通事先书面许可,禁止使用任何机器人、蜘蛛、其他自动设备,或手动程序来监视或复制兴旺宝明通网页或其所包含的任何内容。否则,我们有权依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Qiyeku版权所有 © 2006-2023 用户承诺不对企业库任何资料作商业性利用,包括但不限于在未经企业库事先书面批准的情况下,复制企业库网站上展示的任何资料,不能利用企业库各项服务进行销售或其它商业用途。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "一步电子网 版权所有 © 2005-2023 您同意,您不得对任何资料作商业性利用,包括但不限于在未经一步电子网授权高层管理人员事先书面批准的情况下,复制在一步电子网网站上展示的任何资料并用于商业用途。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2008-2023 南京九六零网络科技有限公司 版权所有 除非有相反证据证明外,我们平台上的所有图标、标识、网页页眉、按钮图标、服务名称、文字、图片音频、视频等的知识产权及所有权均归属于我们。未经我们书面许可,任何人不得自行或提供第三方使用。 ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "@2023 bestb2b.com ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2003-2023 114ic.com All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data16.json b/archived_sigs/datacompliance/merged_data16.json similarity index 99% rename from sigs/datacompliance/merged_data16.json rename to archived_sigs/datacompliance/merged_data16.json index 309b722..c35c87b 100644 --- a/sigs/datacompliance/merged_data16.json +++ b/archived_sigs/datacompliance/merged_data16.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2016-2023 iHuaBen.com ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright ©2017-2023 爱读小说 All Rights Reserved. ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 爱奇艺 All Rights Reserved 您同意,您不会进行或利用我们的产品及服务进行下列活动(也不为他人进行下列活动提供便利和支持): 4.1.5 未经我们授权,以视频采集、直播、录屏、截屏、下载后分享、转发等任何方式,将我们的产品及服务、我们平台的文字、图片、音频、视频等所有内容提供给任何第三方或在第三方平台进行传播; ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本站各栏目的作品版权属文章作者本人所有。若报刊、出版社拟选载本站各栏目的作品,请与作者本人联系。转载作品的报刊、出版社,必须按“中华人民共和国著作权法”给付稿酬并寄发样报(刊)。 如擅自转载不付稿酬,文章作者有权诉之于法。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © tongxiehui.net All Rights Reserved ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 当当网 2004-2021, All Rights Reserved 除非另外明确书面授权,您不得向任何第三方出售、出租、租赁、分发、传播、分许可或以其他任何方式转让本“软件产品”所提供的内容、服务或其任何部分享有的任何权利。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2023 book.qq.com All Rights Reserved 除非腾讯书面许可,您不得从事下列任一行为:(3)对腾讯拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 侵权必究", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2014 Heiyan.com All rights reserved. 用户无权实施包括但不限于下列行为: 用户擅自实施包括但不限于下列行为:使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版,建立镜像站点、擅自借助黑岩发展与之有关的衍生产品、作品、服务、插件、外挂、兼容、互联等; ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 搜狐服务中包含的任何文字、图表、音频、视频和/或软件(包括但不限于软件中包含的图表、动画、音频、视频、界面实际、数据和程序、代码、文档)等信息或材料均受著作权法、商标法和/或其它法律法规的保护,未经相关权利人书面同意,用户不得以任何方式使用该等信息或材料,但出于使用搜狐服务目的而使用的除外。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "许可证", - "output": "不确定" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中华人民共和国外交部 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2016-2023 iHuaBen.com ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright ©2017-2023 爱读小说 All Rights Reserved. ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 爱奇艺 All Rights Reserved 您同意,您不会进行或利用我们的产品及服务进行下列活动(也不为他人进行下列活动提供便利和支持): 4.1.5 未经我们授权,以视频采集、直播、录屏、截屏、下载后分享、转发等任何方式,将我们的产品及服务、我们平台的文字、图片、音频、视频等所有内容提供给任何第三方或在第三方平台进行传播; ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022中国知网(CNKI) 未经中国知网或广告商明示授权,您不得修改、出租、出借、出售、散布本服务或软件之任何部分或全部,或据以制作衍生著作,或使用擅自修改后的软件等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 1997-2023 网易公司版权所有 除非法律允许或网易公司书面许可,用户使用网易服务的过程中不得从事下列行为:(3) 对网易公司拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站各栏目的作品版权属文章作者本人所有。若报刊、出版社拟选载本站各栏目的作品,请与作者本人联系。转载作品的报刊、出版社,必须按“中华人民共和国著作权法”给付稿酬并寄发样报(刊)。 如擅自转载不付稿酬,文章作者有权诉之于法。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © tongxiehui.net All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 当当网 2004-2021, All Rights Reserved 除非另外明确书面授权,您不得向任何第三方出售、出租、租赁、分发、传播、分许可或以其他任何方式转让本“软件产品”所提供的内容、服务或其任何部分享有的任何权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 yunqi.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有 除非事先获得阅文集团或其权利人的合法授权,您不得对任何该信息、资料、文字、软件、声音、图片、视频、图表进行修改、拷贝、散布、传送、展示、执行、复制、发行、授权、制作衍生著作、移转或销售。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2023 book.qq.com All Rights Reserved 除非腾讯书面许可,您不得从事下列任一行为:(3)对腾讯拥有知识产权的内容进行使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版、建立镜像站点等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 侵权必究", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014 Heiyan.com All rights reserved. 用户无权实施包括但不限于下列行为: 用户擅自实施包括但不限于下列行为:使用、出租、出借、复制、修改、链接、转载、汇编、发表、出版,建立镜像站点、擅自借助黑岩发展与之有关的衍生产品、作品、服务、插件、外挂、兼容、互联等; ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 搜狐服务中包含的任何文字、图表、音频、视频和/或软件(包括但不限于软件中包含的图表、动画、音频、视频、界面实际、数据和程序、代码、文档)等信息或材料均受著作权法、商标法和/或其它法律法规的保护,未经相关权利人书面同意,用户不得以任何方式使用该等信息或材料,但出于使用搜狐服务目的而使用的除外。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu.com Inc. All Rights Reserved. 搜狐公司 版权所有 任何第三方未经搜狐焦点同意,不得将用户在平台上的用户成果、所发表言论等进行复制、修改、编辑、转让、使用、通过信息网络传播或作其他用途,包括但不限于通过截取视频信号、抓取录播音频/视频、编辑视频/音频/文字和其他形式的内容等方式。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国外交部 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data17.json b/archived_sigs/datacompliance/merged_data17.json similarity index 99% rename from sigs/datacompliance/merged_data17.json rename to archived_sigs/datacompliance/merged_data17.json index 4d129f8..5a8b66d 100644 --- a/sigs/datacompliance/merged_data17.json +++ b/archived_sigs/datacompliance/merged_data17.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "任何组织或个人应当尊重他人的著作权,非法转载或抄袭他人文章或信息所致侵权责任自行承担,均与西陆网无关。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "来源为\"中国军网\"的均为中国军网版权所有,未经协议授权,请勿作为商业用途使用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。 未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中国西藏网版权所有,未经书面授权禁止使用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "凡注明来源为“观察者网”,除与观察者网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除非中国法律另有规定,未经凤凰网书面许可,对于凤凰网拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非凤凰网所属服务器上做镜像处理或以其他任何方式进行使用;", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何组织或个人应当尊重他人的著作权,非法转载或抄袭他人文章或信息所致侵权责任自行承担,均与西陆网无关。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "来源为\"中国军网\"的均为中国军网版权所有,未经协议授权,请勿作为商业用途使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。 未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国西藏网版权所有,未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡注明来源为“观察者网”,除与观察者网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除非中国法律另有规定,未经凤凰网书面许可,对于凤凰网拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非凤凰网所属服务器上做镜像处理或以其他任何方式进行使用;", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何第三方不得歪曲和篡改本网所呈现的内容。未经本网授权,任何第三方不得擅自引用、复制、转载、摘编或以其他任何方式非法使用本网站所呈现的内容。\n  任何第三方不得擅自转载本网提供的信息和服务内容,如需转载,必须取得相应权利人的合法授权。经本网授权使用的,不得超越所获授权范围,且在转载时须保留原有信息和服务内容的来源。\n  任何第三方不得盗用本网名义发布信息,或擅自使用本网名义引用、转载来源不规范或权属不明晰的信息。\n  凡本网注明“来源:央视网/中国网络电视台”的所有内容,均为本网合法拥有著作权或相关权利的内容,未经本网授权,任何第三方不得转载、链接、摘编或以其他方式使用上述内容。已经本网授权使用的,应在授权范围内使用,并注明“来源:央视网/中国网络电视台”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data18.json b/archived_sigs/datacompliance/merged_data18.json similarity index 99% rename from sigs/datacompliance/merged_data18.json rename to archived_sigs/datacompliance/merged_data18.json index 0aa7cdf..5685502 100644 --- a/sigs/datacompliance/merged_data18.json +++ b/archived_sigs/datacompliance/merged_data18.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 中国互联网信息中心", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "央广网文化传媒有限公司 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "(一)用于非商业、非盈利、非广告性目的时需注明作者及文章及图片的出处为“南方周末网”或“www.infzm.com”。\n\n(二)用于商业、盈利、广告性目的时需征得本网同意,并注明作者姓名、授权范围及原作出处“南方周末网”。不得未经作者同意而剽窃、引用本网的任何版权作品,否则本网将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\n\n(三)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:未来网", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "1.任何单位和个人,凡在互联网或其他媒体转载、传播、使用解放军报社在所属媒体刊登的享有版权的作品,除法定许可使用外,必须事先获得解放军报社的书面授权,方可使用。\n\n2.任何单位或个人,在获得授权使用解放军报社作品时,必须注明解放军报社相应媒体平台来源、作者姓名和作品名称,并加注链接;不得擅自编造误导视听的作品名称,不得擅自作出违背作品原意的修改、篡改、摘录、改编等行为。\n\n3.除法定许可使用外,未经解放军报社授权许可,擅自对解放军报社享有版权的作品进行转载、传播、使用、修改、摘录、改编等行为,或不标注解放军报社所属媒体平台来源、作者姓名、作品名称等行为,以及著作权法规定的其他侵权行为,均属于侵犯解放军报社版权的行为。\n\n4.自声明之日起,由解放军报社全媒体运营广告部代表本报社唯一对外开展作品版权维权工作,凡已涉嫌侵权的单位和个人,须 及时与解放军报社全媒体运营广告部商谈版权谅解和合作事宜(咨询电话:010—66720652 邮箱:zzx@jfjb.com.cn)。\n\n5.侵权单位或个人 未立即删除侵权作品或未及时与解放军报社达成版权谅解和合作事宜的,解放军报社将对其依法进行公告或直接通过其他法律手段维权。\n\n6、解放军报社所属传统媒体、网络和新媒体包括:《解放军报》、《中国国防报》、《解放军画报》、《国防参考》、《环球军事》、《中国民兵》、《军事记者》、《国防教育》、长征出版社、长城出版社,中国军网(中英文版)、国防部网(中英文版)、解放军报网、国防动员网、军队人才网、解放军报客户端(互联网版)、解放军报客户端(军内版)及蓝信订阅号、军报法人微博(@军报记者)、军报记者微信公众账号、中国军网微信公众号等,军报记者网以及解放军报社各分社所属的军委后勤保障部网、军委装备发展部网、中国陆军网、中国海军网、中国空军网、中国武警网、东部战区网、南部战区网、西部战区网、北部战区网、中部战区网、西部战区陆军网和北部战区陆军网等子网。\n\n7、本声明由解放军报社负责全权解释。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:中国民用航空局", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中华人民共和国财政部 版权所有,如需转载,请注明来源", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网站由黄河新闻网版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中共中央宣传部宣传舆情研究中心版权所有 未经书面授权禁止使用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中国精神文明网网站©版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 中国互联网信息中心", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "央广网文化传媒有限公司 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "(一)用于非商业、非盈利、非广告性目的时需注明作者及文章及图片的出处为“南方周末网”或“www.infzm.com”。\n\n(二)用于商业、盈利、广告性目的时需征得本网同意,并注明作者姓名、授权范围及原作出处“南方周末网”。不得未经作者同意而剽窃、引用本网的任何版权作品,否则本网将保留按相关法律程序替原著作者追究侵权责任单位或个人的权利。\n\n(三)任何文章或图片的修改或删除均应保持作者原意并征求原作者同意,并注明授权范围。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:未来网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1.任何单位和个人,凡在互联网或其他媒体转载、传播、使用解放军报社在所属媒体刊登的享有版权的作品,除法定许可使用外,必须事先获得解放军报社的书面授权,方可使用。\n\n2.任何单位或个人,在获得授权使用解放军报社作品时,必须注明解放军报社相应媒体平台来源、作者姓名和作品名称,并加注链接;不得擅自编造误导视听的作品名称,不得擅自作出违背作品原意的修改、篡改、摘录、改编等行为。\n\n3.除法定许可使用外,未经解放军报社授权许可,擅自对解放军报社享有版权的作品进行转载、传播、使用、修改、摘录、改编等行为,或不标注解放军报社所属媒体平台来源、作者姓名、作品名称等行为,以及著作权法规定的其他侵权行为,均属于侵犯解放军报社版权的行为。\n\n4.自声明之日起,由解放军报社全媒体运营广告部代表本报社唯一对外开展作品版权维权工作,凡已涉嫌侵权的单位和个人,须 及时与解放军报社全媒体运营广告部商谈版权谅解和合作事宜(咨询电话:010—66720652 邮箱:zzx@jfjb.com.cn)。\n\n5.侵权单位或个人 未立即删除侵权作品或未及时与解放军报社达成版权谅解和合作事宜的,解放军报社将对其依法进行公告或直接通过其他法律手段维权。\n\n6、解放军报社所属传统媒体、网络和新媒体包括:《解放军报》、《中国国防报》、《解放军画报》、《国防参考》、《环球军事》、《中国民兵》、《军事记者》、《国防教育》、长征出版社、长城出版社,中国军网(中英文版)、国防部网(中英文版)、解放军报网、国防动员网、军队人才网、解放军报客户端(互联网版)、解放军报客户端(军内版)及蓝信订阅号、军报法人微博(@军报记者)、军报记者微信公众账号、中国军网微信公众号等,军报记者网以及解放军报社各分社所属的军委后勤保障部网、军委装备发展部网、中国陆军网、中国海军网、中国空军网、中国武警网、东部战区网、南部战区网、西部战区网、北部战区网、中部战区网、西部战区陆军网和北部战区陆军网等子网。\n\n7、本声明由解放军报社负责全权解释。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:中国民用航空局", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国财政部 版权所有,如需转载,请注明来源", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站由黄河新闻网版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中共中央宣传部宣传舆情研究中心版权所有 未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国精神文明网网站©版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data19.json b/archived_sigs/datacompliance/merged_data19.json similarity index 98% rename from sigs/datacompliance/merged_data19.json rename to archived_sigs/datacompliance/merged_data19.json index 4146f3c..0fcabc5 100644 --- a/sigs/datacompliance/merged_data19.json +++ b/archived_sigs/datacompliance/merged_data19.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data2.json b/archived_sigs/datacompliance/merged_data2.json similarity index 100% rename from sigs/datacompliance/merged_data2.json rename to archived_sigs/datacompliance/merged_data2.json diff --git a/sigs/datacompliance/merged_data20.json b/archived_sigs/datacompliance/merged_data20.json similarity index 98% rename from sigs/datacompliance/merged_data20.json rename to archived_sigs/datacompliance/merged_data20.json index 292656d..fa1e0a8 100644 --- a/sigs/datacompliance/merged_data20.json +++ b/archived_sigs/datacompliance/merged_data20.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "共产党员网 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "凡本网注明“来源:中华网”的所有作品,均为北京华网智讯信息有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中华网”。违反上述声明者,本网将追究其相关法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "共产党员网 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明“来源:中华网”的所有作品,均为北京华网智讯信息有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中华网”。违反上述声明者,本网将追究其相关法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data21.json b/archived_sigs/datacompliance/merged_data21.json similarity index 98% rename from sigs/datacompliance/merged_data21.json rename to archived_sigs/datacompliance/merged_data21.json index f834f08..0b3f963 100644 --- a/sigs/datacompliance/merged_data21.json +++ b/archived_sigs/datacompliance/merged_data21.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "共产党员网 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2001-2023 dzwww.com. All Rights Reserved", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "  2、光明网网页所呈现的任何资料(包括但不限于文字、图片、声音、视频、版面设计及其他任何形式的作品)的版权均属光明网和相关权利人所有。未经光明网及相关权利人书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式使用光明网的上述内容。\n\n  3、凡来源为“光明网”或单独带有光明网水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品,其版权均属于光明网,任何媒体、单位或个人未经本网书面授权不得以任何形式转载、摘编、改编或以其他方式复制发表。经本网授权的媒体、单位或个人,应在授权范围内使用,并注明来源“光明网”。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "海外网传媒有限公司版权所有,未经书面授权禁止使用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:未来网", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "法制网传媒(北京)有限公司版权所有,未经协议授权禁止转载", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中华人民共和国外交部 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "凡本网注明 “来源:XXX(非国防部网站)” 的作品,均由其他媒体及相关单位提供。任何媒体或互联网站如需转载,必须与相应提供单位直接联系获得合法授权。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:中华人民共和国国家民族事务委员会", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "凡本网注明“来源:新华网”的所有作品,均为新华网股份有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:新华网”。违反上述声明者,本网将追究其相关法律责任。\n\n凡本网注明“来源:XXX(非新华网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。\n\n对于新华社下属社办报刊通过本网发布的作品,本网受著作权人委托,在此声明禁止任何媒体、网站或个人在未经书面授权的情况下违法转载或使用。\n\n如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中央和国家机关工委旗帜杂志社版权所有 人民网 中国共产党新闻网承建 版权声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经许可 不得转载、复制", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "共产党员网 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2001-2023 dzwww.com. All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "  2、光明网网页所呈现的任何资料(包括但不限于文字、图片、声音、视频、版面设计及其他任何形式的作品)的版权均属光明网和相关权利人所有。未经光明网及相关权利人书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式使用光明网的上述内容。\n\n  3、凡来源为“光明网”或单独带有光明网水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品,其版权均属于光明网,任何媒体、单位或个人未经本网书面授权不得以任何形式转载、摘编、改编或以其他方式复制发表。经本网授权的媒体、单位或个人,应在授权范围内使用,并注明来源“光明网”。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "海外网传媒有限公司版权所有,未经书面授权禁止使用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:未来网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "法制网传媒(北京)有限公司版权所有,未经协议授权禁止转载", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中华人民共和国外交部 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明 “来源:XXX(非国防部网站)” 的作品,均由其他媒体及相关单位提供。任何媒体或互联网站如需转载,必须与相应提供单位直接联系获得合法授权。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:中华人民共和国国家民族事务委员会", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "凡本网注明“来源:新华网”的所有作品,均为新华网股份有限公司合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:新华网”。违反上述声明者,本网将追究其相关法律责任。\n\n凡本网注明“来源:XXX(非新华网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。\n\n对于新华社下属社办报刊通过本网发布的作品,本网受著作权人委托,在此声明禁止任何媒体、网站或个人在未经书面授权的情况下违法转载或使用。\n\n如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中央和国家机关工委旗帜杂志社版权所有 人民网 中国共产党新闻网承建 版权声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经许可 不得转载、复制", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data22.json b/archived_sigs/datacompliance/merged_data22.json similarity index 99% rename from sigs/datacompliance/merged_data22.json rename to archived_sigs/datacompliance/merged_data22.json index effad8c..33712c4 100644 --- a/sigs/datacompliance/merged_data22.json +++ b/archived_sigs/datacompliance/merged_data22.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经本网书面授权的,在使用时必须注明“来源:国务院新闻办公室网站”。违反上述声明者,本网将追究其相关法律责任。\n\n  二、凡本网注明“来源:XXX(非国务院新闻办公室和地方各级政府新闻办公室)”的作品,转载的内容均有可靠的来源,明确署有出处,其版权属于原作者。转载目的在于传递更多信息,并不代表国务院新闻办公室和本网站赞同其观点和对其真实性负责。由于受条件限制,如有未能与作者本人取得联系,或作者不同意该内容在本网公布,或发现有错误之处,请与本网联系,我们将尊重作者的意愿,及时予以更正。如其他媒体、网站或个人转载使用,必须保留本网注明的“稿件来源”,并自负法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经中工网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中工网的上述内容。对于有上述行为者,中工网将保留追究其法律责任的权利。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright© 1999-2020 消费日报社 版权所有 违者必究", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经中国青年报社书面授权,任何机构或个人无权转载、剪辑、修改、摘编、转贴或以其他方式复制并传播,包括但不限于文字、图片、声音、录像、图表、标志、标识、版面设计以及为读者提供的任何信息。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网站内容由自然资源部地图技术审查中心提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n本网站提供的资料如与相关纸质文本不符,以纸质文本为准。\n\n任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n自然资源部地图技术审查中心拥有本网站内所有资料的版权,对违反版权者保留一切追索权利。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "许可证", - "output": "不确定" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 © 2004-2023 美食天下 保留所有权利", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2004-2022 美食天下 保留所有权利 - 京ICP证090244号 / 京ICP备10020153号", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "5、任何单位或个人如认为通过搜狗网站搜索引擎服务所得的第三方网页中内容可能涉嫌侵害其合法著作权,应按照《信息网络传播权保护条例》的规定,以书面的形式及时向搜狗公司反应,并提供相应身份证明、权属证明及详细的侵权情况证明,搜狗公司在收到上述文件后,会尽快断开搜索结果中至被控侵权的第三方网页的链接。如果该等被断开链接的第三方网站所有者认为被提出权利主张的搜狗搜索结果并未侵害他人合法著作权的,亦有权按照《信息网络传播权保护条例》的规定,向搜狗公司发出关于被断开链接不违反《信息网络传播权保护条例》的反通知。搜狗公司提醒您注意:如您的主张侵权或主张不侵权的陈述失实,您将按照《信息网络传播权保护条例》的规定,承担相关法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2023 Sohu All Rights Reserved. 搜狐公司 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "球天下的服务内容包括:文字、软件、声音、图片、录象、图表;广告中的全部内容;电子邮件的全部内容;球天下为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在球天下体育授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。球天下所有的文章版权归原文作者和球天下共同所有,任何人需要转载球天下的文章,必须征得原文作者或球天下授权。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "宠物圈", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经本网书面授权的,在使用时必须注明“来源:国务院新闻办公室网站”。违反上述声明者,本网将追究其相关法律责任。\n\n  二、凡本网注明“来源:XXX(非国务院新闻办公室和地方各级政府新闻办公室)”的作品,转载的内容均有可靠的来源,明确署有出处,其版权属于原作者。转载目的在于传递更多信息,并不代表国务院新闻办公室和本网站赞同其观点和对其真实性负责。由于受条件限制,如有未能与作者本人取得联系,或作者不同意该内容在本网公布,或发现有错误之处,请与本网联系,我们将尊重作者的意愿,及时予以更正。如其他媒体、网站或个人转载使用,必须保留本网注明的“稿件来源”,并自负法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中工网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中工网的上述内容。对于有上述行为者,中工网将保留追究其法律责任的权利。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright© 1999-2020 消费日报社 版权所有 违者必究", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 本网站信息内容由西藏自治区人民政府、及其门户网站以及自治区相关部门单位提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n  任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n 本网站提供的资料如与相关纸质文本不符,以纸质文本为准。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中国青年报社书面授权,任何机构或个人无权转载、剪辑、修改、摘编、转贴或以其他方式复制并传播,包括但不限于文字、图片、声音、录像、图表、标志、标识、版面设计以及为读者提供的任何信息。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网站内容由自然资源部地图技术审查中心提供。任何媒体、互联网站和商业机构不得利用本网站发布的内容进行商业性的原版原式地转载,也不得歪曲和篡改本网站所发布的内容。本网站所涉及到的版权归本网站所属。\n\n本网站提供的资料如与相关纸质文本不符,以纸质文本为准。\n\n任何媒体或互联网站不得擅自转载本网站由其他单位提供的信息和服务内容,如需转载,必须与相应提供单位直接联系获得合法授权。\n\n自然资源部地图技术审查中心拥有本网站内所有资料的版权,对违反版权者保留一切追索权利。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "人 民 网 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 2004-2023 美食天下 保留所有权利", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2004-2022 美食天下 保留所有权利 - 京ICP证090244号 / 京ICP备10020153号", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "5、任何单位或个人如认为通过搜狗网站搜索引擎服务所得的第三方网页中内容可能涉嫌侵害其合法著作权,应按照《信息网络传播权保护条例》的规定,以书面的形式及时向搜狗公司反应,并提供相应身份证明、权属证明及详细的侵权情况证明,搜狗公司在收到上述文件后,会尽快断开搜索结果中至被控侵权的第三方网页的链接。如果该等被断开链接的第三方网站所有者认为被提出权利主张的搜狗搜索结果并未侵害他人合法著作权的,亦有权按照《信息网络传播权保护条例》的规定,向搜狗公司发出关于被断开链接不违反《信息网络传播权保护条例》的反通知。搜狗公司提醒您注意:如您的主张侵权或主张不侵权的陈述失实,您将按照《信息网络传播权保护条例》的规定,承担相关法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2023 Sohu All Rights Reserved. 搜狐公司 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "球天下的服务内容包括:文字、软件、声音、图片、录象、图表;广告中的全部内容;电子邮件的全部内容;球天下为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在球天下体育授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。球天下所有的文章版权归原文作者和球天下共同所有,任何人需要转载球天下的文章,必须征得原文作者或球天下授权。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "宠物圈", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data23.json b/archived_sigs/datacompliance/merged_data23.json similarity index 99% rename from sigs/datacompliance/merged_data23.json rename to archived_sigs/datacompliance/merged_data23.json index 048a46b..40e62af 100644 --- a/sigs/datacompliance/merged_data23.json +++ b/archived_sigs/datacompliance/merged_data23.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "7.3除法律规定外,未经「蘑菇宠医」书面形式的明确许可,任何单位或个人不得以任何方式全部或部分复制、转载、引用、链接、抓取或以其他方式使用「蘑菇宠医」的信息内容(包括但不限于:源程序和文档、用户界面设计、文案等)。如有违反本条协议者,一经调查及核实,「蘑菇宠医」坚决追究其法律责任,并要求其赔偿因其行为所造成的任何经济损失。\n\n7.4用户在此同意并承诺,在「蘑菇宠医」平台上的发布的内容不构成对他人知识产权、隐私权或其他权利的侵犯。因用户违反上述承诺,所造成或引起的任何形式的法律纠纷,由用户个人承担法律责任。\n\n7.5本用户协议已经构成《中华人民共和国著作权法》及相关法律规定的著作权财产性权利(包括但不限于:复制权、发行权、出租权、展览权、表演权、广播权、信息网络传播权、改编权、摄制权、翻译权、汇编权等)的转让书面协议,其效力及于用户在「蘑菇宠医」上发布的任何受著作权法保护的作品内容。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本站一贯高度重视知识产权保护并遵守中华人民共和国各项知识产权法律、法规和具有约束力的规范性文件。本站认为著作权拥有者的合法权益应该得到尊重和依法保护,坚决反对任何违反中华人民共和国有关著作权的法律法规的行为。\n\n由于本站无法对用户上传到本网站的所有作品内容进行充分的监测,如果阁下是某一作品的著作权人或依法可以行使信息网络传播权的权利人,且阁下认为本站上用户上传内容侵犯了阁下对该作品的信息网络传播权,请阁下发邮件通知本站(本站邮箱:czd0126@163.com),本站将根据相关法律规定采取措施删除相关内容。阁下应对通知陈述之真实性负责。为方便本站及时处理阁下之意见,阁下的通知书中应至少包含以下内容:\n\n 1、阁下的名称(姓名)及身份证明电子版(包括身份证、法人执照、营业执照等有效身份证件)、联系方式(含Email地址)及地址;\n\n 2、要求删除的作品的名称和在本网站的地址;\n\n 3、构成侵权的初步证明材料,谨此提示以下材料可能构成初步证明:对于涉嫌侵权作品阁下拥有著作权或依法可以行使信息网络传播权的权属证明;对涉嫌侵权作品侵权事实的举证证明。(如阁下所拥有的著作权权属证明,包括但不限于有关的著作权登记证书或创作原稿等)。\n\n在本站上传作品的会员视为同意本站上述及已采用的相应措施。本站不因此而承担任何违约责任或其他任何法律责任,包括不承担因侵权指控不成立而给原上传用户带来损害的赔偿责任。本站在收到上述通知后会发送电子邮件通知上载该作品的会员。对于多次上载涉嫌侵权作品的会员,本站将取消其会员资格。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "除非天眼查另行声明,天眼查平台内的本网站(www.tianyancha.com)的所有产品、技术、软件、程序、 数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有权利所有知识产权(包括但不限于版权、商标权、 专利权、商业秘密及其他所有相关权利)均归天眼查或其关联公司所有。未经天眼查许可,任何人不得擅自使用(包括但不限于通过任何机器人、 蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载)天眼查平台内的任何内容。\n\n天眼查平台的Logo、“天眼查”、“tianyancha”等文字、图形及其组合,以及天眼查平台的其他标识、 徽记、产品和服务名称均为天眼查及其关联公司在中国和其它国家的商标,未经天眼查书面授权,任何人不得以任何方式展示、 使用或作其他处理,也不得向他人表明您有权展示、使用或作其他处理。\n\n天眼查尊重知识产权,反对侵权盗版行为。未经天眼查许可, 任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预天眼查数据)影响天眼查的正常服务, 任何人不得擅自以软件程序自动获得天眼查数据。否则,天眼查有权依法追究其法律责任。\n\n未经天眼查许可,任何人禁止转载或商业使用天眼查网站内文字、图形、表格等信息,否则, 天眼查保留采取一切合法方式维护正当利益的权利。经许可的信息的转载或商业使用时,应当以恰当方式说明,该信息来源于天眼查。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 中国科学院植物研究所", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "许可证", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "该数据现已无法访问和获取" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2006-2023ruiwen.com版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 星座网 www.xingzuo.com 法律声明:如有侵权,请告知网站管理员我们会在7个工作日内处理。本站除标明 \"本站原创\" 外所有照片版权归创作人所有,如有冒犯, 请直接联系本站, 我们将立即予以纠正并致歉!", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "7.3除法律规定外,未经「蘑菇宠医」书面形式的明确许可,任何单位或个人不得以任何方式全部或部分复制、转载、引用、链接、抓取或以其他方式使用「蘑菇宠医」的信息内容(包括但不限于:源程序和文档、用户界面设计、文案等)。如有违反本条协议者,一经调查及核实,「蘑菇宠医」坚决追究其法律责任,并要求其赔偿因其行为所造成的任何经济损失。\n\n7.4用户在此同意并承诺,在「蘑菇宠医」平台上的发布的内容不构成对他人知识产权、隐私权或其他权利的侵犯。因用户违反上述承诺,所造成或引起的任何形式的法律纠纷,由用户个人承担法律责任。\n\n7.5本用户协议已经构成《中华人民共和国著作权法》及相关法律规定的著作权财产性权利(包括但不限于:复制权、发行权、出租权、展览权、表演权、广播权、信息网络传播权、改编权、摄制权、翻译权、汇编权等)的转让书面协议,其效力及于用户在「蘑菇宠医」上发布的任何受著作权法保护的作品内容。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " 除非中国法律另有规定,未经中国教育在线书面许可,对于中国教育在线拥有版权或其他知识产权的任何内容,任何人不得复制或在非中国教育在线所属的服务器上做镜像或以其他任何方式进行使用。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本站一贯高度重视知识产权保护并遵守中华人民共和国各项知识产权法律、法规和具有约束力的规范性文件。本站认为著作权拥有者的合法权益应该得到尊重和依法保护,坚决反对任何违反中华人民共和国有关著作权的法律法规的行为。\n\n由于本站无法对用户上传到本网站的所有作品内容进行充分的监测,如果阁下是某一作品的著作权人或依法可以行使信息网络传播权的权利人,且阁下认为本站上用户上传内容侵犯了阁下对该作品的信息网络传播权,请阁下发邮件通知本站(本站邮箱:czd0126@163.com),本站将根据相关法律规定采取措施删除相关内容。阁下应对通知陈述之真实性负责。为方便本站及时处理阁下之意见,阁下的通知书中应至少包含以下内容:\n\n 1、阁下的名称(姓名)及身份证明电子版(包括身份证、法人执照、营业执照等有效身份证件)、联系方式(含Email地址)及地址;\n\n 2、要求删除的作品的名称和在本网站的地址;\n\n 3、构成侵权的初步证明材料,谨此提示以下材料可能构成初步证明:对于涉嫌侵权作品阁下拥有著作权或依法可以行使信息网络传播权的权属证明;对涉嫌侵权作品侵权事实的举证证明。(如阁下所拥有的著作权权属证明,包括但不限于有关的著作权登记证书或创作原稿等)。\n\n在本站上传作品的会员视为同意本站上述及已采用的相应措施。本站不因此而承担任何违约责任或其他任何法律责任,包括不承担因侵权指控不成立而给原上传用户带来损害的赔偿责任。本站在收到上述通知后会发送电子邮件通知上载该作品的会员。对于多次上载涉嫌侵权作品的会员,本站将取消其会员资格。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "除非天眼查另行声明,天眼查平台内的本网站(www.tianyancha.com)的所有产品、技术、软件、程序、 数据及其他信息(包括但不限于文字、图像、图片、照片、音频、视频、图表、色彩、版面设计、电子文档)的所有权利所有知识产权(包括但不限于版权、商标权、 专利权、商业秘密及其他所有相关权利)均归天眼查或其关联公司所有。未经天眼查许可,任何人不得擅自使用(包括但不限于通过任何机器人、 蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载)天眼查平台内的任何内容。\n\n天眼查平台的Logo、“天眼查”、“tianyancha”等文字、图形及其组合,以及天眼查平台的其他标识、 徽记、产品和服务名称均为天眼查及其关联公司在中国和其它国家的商标,未经天眼查书面授权,任何人不得以任何方式展示、 使用或作其他处理,也不得向他人表明您有权展示、使用或作其他处理。\n\n天眼查尊重知识产权,反对侵权盗版行为。未经天眼查许可, 任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预天眼查数据)影响天眼查的正常服务, 任何人不得擅自以软件程序自动获得天眼查数据。否则,天眼查有权依法追究其法律责任。\n\n未经天眼查许可,任何人禁止转载或商业使用天眼查网站内文字、图形、表格等信息,否则, 天眼查保留采取一切合法方式维护正当利益的权利。经许可的信息的转载或商业使用时,应当以恰当方式说明,该信息来源于天眼查。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 中国科学院植物研究所", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "该数据现已无法访问和获取" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023ruiwen.com版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2019-2022 好生活,好二三四 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 星座网 www.xingzuo.com 法律声明:如有侵权,请告知网站管理员我们会在7个工作日内处理。本站除标明 \"本站原创\" 外所有照片版权归创作人所有,如有冒犯, 请直接联系本站, 我们将立即予以纠正并致歉!", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data24.json b/archived_sigs/datacompliance/merged_data24.json similarity index 99% rename from sigs/datacompliance/merged_data24.json rename to archived_sigs/datacompliance/merged_data24.json index 8a7927f..04489d6 100644 --- a/sigs/datacompliance/merged_data24.json +++ b/archived_sigs/datacompliance/merged_data24.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 11467.com 顺企网版权所有 发布批发采购信息、查询企业黄页,上顺企网", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:上海玄霆娱乐信息科技有限公司", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "铁血社区 Ver2.3 铁血网版权所有2001-2018", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "许可证", - "output": "不确定" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "电视猫网站的原创剧情系电视猫网站独立创作,并受知识产权等相关法律保护。任何单位或个人,未经本网站主办方的许可, 不得以任何方式(包括但不限于:复制、篡改、盗链、程序盗取等)直接或间接地使用剧情。\n\n否则,本网站主办方将保留进一步追究侵权者法律责任的权利。\n\n转载许可:\n\n1. 在贵方网站首页挂链接,链接地址: http://www.tvmao.com ,链接文字:剧情介绍\n\n2. 在转载页面加来源出处链接,链接地址,被转载剧情的页面地址 如:http://www.tvmao.com/drama/L2gvKSE=/episode ,链接文字:老九门分集剧情来源电视猫\n\n3. 以上链接不得加 nofollow\n\n接受以上3条,并请联系 tvmaobd@163.com 确认转载。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "电影网立足于互联网为客户提供全方位的服务。电影网的各项服务的所有权和运营权归电影卫星频道节目制作中心版权所有。电影网的点播影片版权归电影卫星频道节目制作中心版权所有。\n\n  电影网提供的服务将完全按照其发布的章程、服务条款和操作规则严格执行。用户若完全同意所有服务条款,完成相关注册程序后即可成为电影网的用户,用户在享受电影网任何单项服务时,应当受本服务条款的约束。\n\n  电影网由电影卫星频道节目制作中心运营和控制,符合中华人民共和国法律。保留随时更改网站上述免责条款的权利。 (c) 2005-2009,电影网。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "9.1 公司在“今日头条”软件及相关服务中提供的内容(包括但不限于软件、技术、程序、网页、文字、图片、图像、音频、视频、图表、版面设计、电子文档等)的知识产权属于公司所有。公司提供“今日头条”服务时所依托的软件的著作权、专利权及其他知识产权均归公司所有。未经公司许可,任何人不得擅自使用(包括但不限于通过任何机器人、“蜘蛛”等程序或设备监视、复制、传播、展示、镜像、上载、下载)“今日头条”软件及相关服务中的内容。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "本网所有内容,凡注明“来源:胶东在线网”或有标识的所有文字、图片和音视频资料,版权均属胶东在线网站所有,任何媒体、网站或个人未经本网授权不得转载、链接、转贴或以其他方式复制、发布。已经本网授权的媒体、网站,在下载使用时必须注明“稿件来源:胶东在线网”并保留原有标识,违者本网将依法追究法律责任。\n2、本网以下内容不可任意转载:\n (1)本网所指向的非本网内容的相关链接内容;\n (2)已作出不得转载或未经许可不得转载声明的内容;\n (3)未由本网署名或本网引用、转载的他人作品等非本网版权内容;\n (4)本网中特有的图形、标志、页面风格、编排方式、程序等;\n (5)本网中必须具有特别授权或具有注册用户资格方可知晓的内容;\n (6)其他法律法规不允许或本网认为不适合转载的内容。\n3、转载或引用本网内容,不得进行如下活动:\n (1)任何违法行为;\n (2)损害本网或他人利益的行为;\n (3)任何可能破坏公序良俗的行为;\n (4)擅自同意他人继续转载、引用本网内容;\n (5)不得用于商业活动或商业炒作。\n4、转载或引用本网版权所有之内容须注明“转自(或引自)胶东在线”字样,标明本网网址www.jiaodong.net,并不得删除或破坏本网原有技术措施或标识,不得任意删改或歪曲转自本网具有版权的内容。\n5、凡本网注明“来源:XXX(非胶东在线)”的作品,均系胶东在线转载自其它媒体,转载目的在于向公众传递更多信息,并不代表本网赞同其作品所持观点和对其真实性负责。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "用户在证券时报网发表的内容(包含但不限于证券时报网目前各产品功能里的内容)仅表明其个人的立场和观点,并不代表证券时报网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。证券时报网不承担任何法律及连带责任。用户在证券时报网发布侵犯他人知识产权或其他合法权益的内容,证券时报网有权予以删除,证券时报网不承担任何法律及连带责任,并保留移交司法机关处理的权利。用户在使用证券时报网网络服务过程中,必须遵循以下原则:(1)遵守中国有关的法律和法规;(2)不得为任何非法目的而使用网络服务系统;(3)遵守所有与网络服务有关的网络协议、规定和程序;(4)不得利用证券时报网网络服务系统进行任何可能对互联网的正常运转造成不利影响的行为;(5)不得利用证券时报网网络服务系统传输任何骚扰性的、中伤他人的、辱骂性的、恐吓性的、庸俗淫秽的或其他任何非法的信息资料;(6)不得利用证券时报网网络服务系统进行任何不利于证券时报网的行为;(7)如发现任何非法使用用户帐号或帐号出现安全漏洞的情况,应立即通告证券时报网。", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "\n新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 11467.com 顺企网版权所有 发布批发采购信息、查询企业黄页,上顺企网", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 读书网 www.dushu.com 2005-2020, All Rights Reserved.", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海玄霆娱乐信息科技有限公司", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "铁血社区 Ver2.3 铁血网版权所有2001-2018", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "许可证", + "output": "不确定" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "电视猫网站的原创剧情系电视猫网站独立创作,并受知识产权等相关法律保护。任何单位或个人,未经本网站主办方的许可, 不得以任何方式(包括但不限于:复制、篡改、盗链、程序盗取等)直接或间接地使用剧情。\n\n否则,本网站主办方将保留进一步追究侵权者法律责任的权利。\n\n转载许可:\n\n1. 在贵方网站首页挂链接,链接地址: http://www.tvmao.com ,链接文字:剧情介绍\n\n2. 在转载页面加来源出处链接,链接地址,被转载剧情的页面地址 如:http://www.tvmao.com/drama/L2gvKSE=/episode ,链接文字:老九门分集剧情来源电视猫\n\n3. 以上链接不得加 nofollow\n\n接受以上3条,并请联系 tvmaobd@163.com 确认转载。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "电影网立足于互联网为客户提供全方位的服务。电影网的各项服务的所有权和运营权归电影卫星频道节目制作中心版权所有。电影网的点播影片版权归电影卫星频道节目制作中心版权所有。\n\n  电影网提供的服务将完全按照其发布的章程、服务条款和操作规则严格执行。用户若完全同意所有服务条款,完成相关注册程序后即可成为电影网的用户,用户在享受电影网任何单项服务时,应当受本服务条款的约束。\n\n  电影网由电影卫星频道节目制作中心运营和控制,符合中华人民共和国法律。保留随时更改网站上述免责条款的权利。 (c) 2005-2009,电影网。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "9.1 公司在“今日头条”软件及相关服务中提供的内容(包括但不限于软件、技术、程序、网页、文字、图片、图像、音频、视频、图表、版面设计、电子文档等)的知识产权属于公司所有。公司提供“今日头条”服务时所依托的软件的著作权、专利权及其他知识产权均归公司所有。未经公司许可,任何人不得擅自使用(包括但不限于通过任何机器人、“蜘蛛”等程序或设备监视、复制、传播、展示、镜像、上载、下载)“今日头条”软件及相关服务中的内容。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "本网所有内容,凡注明“来源:胶东在线网”或有标识的所有文字、图片和音视频资料,版权均属胶东在线网站所有,任何媒体、网站或个人未经本网授权不得转载、链接、转贴或以其他方式复制、发布。已经本网授权的媒体、网站,在下载使用时必须注明“稿件来源:胶东在线网”并保留原有标识,违者本网将依法追究法律责任。\n2、本网以下内容不可任意转载:\n (1)本网所指向的非本网内容的相关链接内容;\n (2)已作出不得转载或未经许可不得转载声明的内容;\n (3)未由本网署名或本网引用、转载的他人作品等非本网版权内容;\n (4)本网中特有的图形、标志、页面风格、编排方式、程序等;\n (5)本网中必须具有特别授权或具有注册用户资格方可知晓的内容;\n (6)其他法律法规不允许或本网认为不适合转载的内容。\n3、转载或引用本网内容,不得进行如下活动:\n (1)任何违法行为;\n (2)损害本网或他人利益的行为;\n (3)任何可能破坏公序良俗的行为;\n (4)擅自同意他人继续转载、引用本网内容;\n (5)不得用于商业活动或商业炒作。\n4、转载或引用本网版权所有之内容须注明“转自(或引自)胶东在线”字样,标明本网网址www.jiaodong.net,并不得删除或破坏本网原有技术措施或标识,不得任意删改或歪曲转自本网具有版权的内容。\n5、凡本网注明“来源:XXX(非胶东在线)”的作品,均系胶东在线转载自其它媒体,转载目的在于向公众传递更多信息,并不代表本网赞同其作品所持观点和对其真实性负责。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户在证券时报网发表的内容(包含但不限于证券时报网目前各产品功能里的内容)仅表明其个人的立场和观点,并不代表证券时报网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。证券时报网不承担任何法律及连带责任。用户在证券时报网发布侵犯他人知识产权或其他合法权益的内容,证券时报网有权予以删除,证券时报网不承担任何法律及连带责任,并保留移交司法机关处理的权利。用户在使用证券时报网网络服务过程中,必须遵循以下原则:(1)遵守中国有关的法律和法规;(2)不得为任何非法目的而使用网络服务系统;(3)遵守所有与网络服务有关的网络协议、规定和程序;(4)不得利用证券时报网网络服务系统进行任何可能对互联网的正常运转造成不利影响的行为;(5)不得利用证券时报网网络服务系统传输任何骚扰性的、中伤他人的、辱骂性的、恐吓性的、庸俗淫秽的或其他任何非法的信息资料;(6)不得利用证券时报网网络服务系统进行任何不利于证券时报网的行为;(7)如发现任何非法使用用户帐号或帐号出现安全漏洞的情况,应立即通告证券时报网。", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "11.1腾讯在本服务中提供的内容(包括但不限于网页、文字、图片、音频、视频、图表、计算机软件等)的知识产权归腾讯所有,用户在使用本服务中所产生内容的知识产权归用户或相关权利人所有,除非您与腾讯另有约定。\n\n 11.2除另有特别声明外,腾讯提供本服务时所依托软件的著作权、专利权及其他知识产权均归腾讯所有。\n\n 11.3腾讯在本服务中所使用的“QQ”、“腾讯”、“TENCENT”及企鹅形象等商业标识,其著作权或商标权归腾讯所有。\n\n 11.4上述及其他任何本服务包含的内容的知识产权均受到法律法规保护,未经腾讯、用户或相关权利人书面许可,任何人不得以任何形式进行使用或创造相关衍生作品。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "澎湃新闻网提供的所有网页内容、网页设计的所有内容(包括但不限于文字、图片、声音、录像、图表、标志、标识、广告、商标、商号、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准及多媒体形式的新闻﹑信息等),均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权及/或其他财产所有权法律的保护,为澎湃新闻网及/或相关权利人专属所有或持有。\n\n未经澎湃新闻网及/或相关权利人明确书面授权,任何人不得复制、转载、摘编、修改、链接、转帖澎湃新闻网的内容,或在非澎湃新闻网所属的服务器上做镜像或以其他任何方式进行使用。\n\n获得合法授权的,应在授权范围内使用,必须为作者署名并注明“来源:澎湃新闻网”字样,并按有关国际公约和中华人民共和国法律的有关规定向相关权利人支付版权费用。该版权费用为800-1000元/千字,500-800元/图片(具体费用另行协商确定)。违反上述声明者,本网将依法追究其相关法律责任。\n\n对于本站所有形式的原创内容,本站有结集出版的权利。\n\n澎湃新闻网对于用户所发布的内容所引发的版权、署名权疑议、纠纷,不承担任何责任。\n\n澎湃新闻网所转载、链接的内容,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "\n新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "新浪公司独立拥有或与相关内容提供者共同拥有新浪网站内相关内容(包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等)的版权和/或其他相关知识产权。“新浪网”、“sina”为新浪公司及其关联公司的注册商标,受中国法律保护。\n\n\n除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\n\n\n违反上述声明而给新浪公司造成损失的,新浪公司将依法追究其法律责任。\t", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data25.json b/archived_sigs/datacompliance/merged_data25.json similarity index 99% rename from sigs/datacompliance/merged_data25.json rename to archived_sigs/datacompliance/merged_data25.json index c57bd7d..8ee08b4 100644 --- a/sigs/datacompliance/merged_data25.json +++ b/archived_sigs/datacompliance/merged_data25.json @@ -1,112 +1,112 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "9.4 上述及其他任何本服务包含的内容的知识产权均受到法律保护,其他未经百度、用户或相关权利人许可的第三人,不得以任何形式进行使用或创造相关衍生作品。\n\n9.5 您理解并同意,您向任何第三人分享、转发、复制百家号平台信息内容的行为,均应遵守百家号平台为此制定的规范和标准,包括但不限于展示方式应为该信息或内容的原链接、确保附属于该信息或内容的功能可正常使用等。\n\n9.6 任何未经百度书面同意及权利人许可的非法获取行为,均属违法侵权行为。您确认并同意,为及时、有效地保障您基于本服务的合法权益,您特别授权百度在发现您的合法权益(包括但不限于信息网络传播权、著作权等)可能受到侵害时,百度有权以自己的名义或委托专业第三方机构代您向涉嫌侵权的第三人采取法律手段进行维权,特别授权采取的维权手段包括但不限于侵权监控、发函警告、行政举报、提起诉讼、申请仲裁、移送侦查机关处理、调解、和解等。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2015 All rights reserved 中国餐饮美食小吃加盟网 版权所有 ", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:上海问礼信息科技有限公司 ", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2018 Jidianwang.com All Rights Reserved", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "郑重声明:本站作品来源于网络用户上传,完全免费共享。", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright @ 2006 - 2023 学习啦 All Rights Reserved 学习啦 版权所有", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2000-2023oh100.com版权所有 广州瑞文信息科技有限责任公司 ", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2015-2023 南京蓝鲸人网络科技有限公司", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "万方医学网(http://med.wanfangdata.com.cn)所登载发布的一切内容,包括但不限于文字、图片、音像、图表、标志、标识、广告、商标、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准以及为使用者提供的任何信息,均受《中华人民共和国著作权法》、《中华人民共和国商标法》、《中华人民共和国专利法》等法律法规以及有关国际条约的保护,相应权利由北京万方数据股份有限公司/相关权利人享有。\n\n未经北京万方数据股份有限公司书面授权/相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得编辑、转载、链接、复制、发行、传播镜像、进行还原工程、解编或反向组译等本站的部分或全部内容或服务,否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。\n\n本网仅为用户学习、科研提供资料参考,不作为用户疾病诊断、治疗、药品使用、产品采购的依据。如因用户不当使用本网内容造成的任何法律纠纷,北京万方数据股份有限公司/相关权利人均不承担责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经北京万方数据股份有限公司及/或相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得改动、转载、链接、复制、发行、传播等本站的部分或全部内容或服务,或将之在非本站所属的服务器上作镜像。否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "汉斯出版社的期刊作者对其作品享有著作权,所有出版的文章均根据知识共享署名许可协议(CCBY或CC BY-NC)的条款进行出版,该协议允许使用者以任何电子媒介方式非商业性的复制、使用、发表、传播、公开展示作品、制作和发表衍生作品,并保留原作者的署名。", - "output": "这是低风险数据,使用该数据风险较小" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "1、重庆维普资讯有限公司是《中文科技期刊数据库》的合法拥有者,是维普资讯网及相关网站的合法拥有者,维普资讯网保留运用合法手段维护自身权利的权利。\n2、维普资讯网上传播期刊的相关权利归期刊社所有,基于收录协议中约定的委托,维普资讯网保留运用合法手段维护期刊社权利的权利。\n3、由于历史原因或者技术原因而可能存在的维普资讯网将未签约的期刊错误传播,重庆维普资讯有限公司在维普资讯网上保留相关期刊社的权利,直到相关期刊社通过正规途径向重庆维普资讯有限公司提出权利主张,并按此标准进行相应的补偿。", - "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "9.4 上述及其他任何本服务包含的内容的知识产权均受到法律保护,其他未经百度、用户或相关权利人许可的第三人,不得以任何形式进行使用或创造相关衍生作品。\n\n9.5 您理解并同意,您向任何第三人分享、转发、复制百家号平台信息内容的行为,均应遵守百家号平台为此制定的规范和标准,包括但不限于展示方式应为该信息或内容的原链接、确保附属于该信息或内容的功能可正常使用等。\n\n9.6 任何未经百度书面同意及权利人许可的非法获取行为,均属违法侵权行为。您确认并同意,为及时、有效地保障您基于本服务的合法权益,您特别授权百度在发现您的合法权益(包括但不限于信息网络传播权、著作权等)可能受到侵害时,百度有权以自己的名义或委托专业第三方机构代您向涉嫌侵权的第三人采取法律手段进行维权,特别授权采取的维权手段包括但不限于侵权监控、发函警告、行政举报、提起诉讼、申请仲裁、移送侦查机关处理、调解、和解等。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "网易公司提供的内容包括但不限于:非用户上传/提供的文字、软件、图片、音频、视频、图表、程序代码、界面设计、版面框架、数据资料、账号等,所有这些内容的知识产权及相关智力成果的权利均属于网易公司,并受版权、商标、专利和其它相关法律的保护。未经网易公司授权,用户不得使用上述内容,并且用户未经许可,不得对上述内容进行包括但不限于复制、销售、重制、再创作等行为。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015 All rights reserved 中国餐饮美食小吃加盟网 版权所有 ", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海问礼信息科技有限公司 ", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2018 Jidianwang.com All Rights Reserved", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "郑重声明:本站作品来源于网络用户上传,完全免费共享。", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2006 - 2023 学习啦 All Rights Reserved 学习啦 版权所有", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2000-2023oh100.com版权所有 广州瑞文信息科技有限责任公司 ", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015-2023 南京蓝鲸人网络科技有限公司", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2007-2023 Houxue.com 版权所有. 江苏厚学网信息技术股份有限公司.", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是中风险数据,版权限制不清晰,律师认为有灵活空间,可以解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "万方医学网(http://med.wanfangdata.com.cn)所登载发布的一切内容,包括但不限于文字、图片、音像、图表、标志、标识、广告、商标、域名、软件、程序、版面设计、专栏目录与名称、内容分类标准以及为使用者提供的任何信息,均受《中华人民共和国著作权法》、《中华人民共和国商标法》、《中华人民共和国专利法》等法律法规以及有关国际条约的保护,相应权利由北京万方数据股份有限公司/相关权利人享有。\n\n未经北京万方数据股份有限公司书面授权/相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得编辑、转载、链接、复制、发行、传播镜像、进行还原工程、解编或反向组译等本站的部分或全部内容或服务,否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。\n\n本网仅为用户学习、科研提供资料参考,不作为用户疾病诊断、治疗、药品使用、产品采购的依据。如因用户不当使用本网内容造成的任何法律纠纷,北京万方数据股份有限公司/相关权利人均不承担责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经北京万方数据股份有限公司及/或相关权利人书面授权,任何人不得将本站所登载、发布的内容及相关服务用于商业性目的,亦不得改动、转载、链接、复制、发行、传播等本站的部分或全部内容或服务,或将之在非本站所属的服务器上作镜像。否则,北京万方数据股份有限公司将依法追究侵权者的法律责任。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "汉斯出版社的期刊作者对其作品享有著作权,所有出版的文章均根据知识共享署名许可协议(CCBY或CC BY-NC)的条款进行出版,该协议允许使用者以任何电子媒介方式非商业性的复制、使用、发表、传播、公开展示作品、制作和发表衍生作品,并保留原作者的署名。", + "output": "这是低风险数据,使用该数据风险较小" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1、重庆维普资讯有限公司是《中文科技期刊数据库》的合法拥有者,是维普资讯网及相关网站的合法拥有者,维普资讯网保留运用合法手段维护自身权利的权利。\n2、维普资讯网上传播期刊的相关权利归期刊社所有,基于收录协议中约定的委托,维普资讯网保留运用合法手段维护期刊社权利的权利。\n3、由于历史原因或者技术原因而可能存在的维普资讯网将未签约的期刊错误传播,重庆维普资讯有限公司在维普资讯网上保留相关期刊社的权利,直到相关期刊社通过正规途径向重庆维普资讯有限公司提出权利主张,并按此标准进行相应的补偿。", + "output": "这是高风险数据,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data3.json b/archived_sigs/datacompliance/merged_data3.json similarity index 100% rename from sigs/datacompliance/merged_data3.json rename to archived_sigs/datacompliance/merged_data3.json diff --git a/sigs/datacompliance/merged_data4.json b/archived_sigs/datacompliance/merged_data4.json similarity index 99% rename from sigs/datacompliance/merged_data4.json rename to archived_sigs/datacompliance/merged_data4.json index 11cb3bc..8ca8b80 100644 --- a/sigs/datacompliance/merged_data4.json +++ b/archived_sigs/datacompliance/merged_data4.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "12. 禁止商业行为\\n\\n您同意不对本服务任何部分或本服务之使用或获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "百度拥有本网站内所有资料的版权,各分频道权利声明有特殊规定的,从其规定。任何被授权的浏览、复制、打印和传播属于本网站内的资料必须符合以下条件:\\n\\n所有的资料和图象均以获得信息为目的;\\n所有的资料和图象均不得用于商业目的;\\n所有的资料、图象及其任何部分都必须包括此版权声明;\\n本网站(www.baidu.com)所有的产品、技术与所有程序均属于百度知识产权,在此并未授权。“Baidu”、 “百度”及相关图形等为百度的注册商标。\\n\\n未经百度许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预百度数据)影响百度的正常服务,任何人不得擅自以软件程序自动获得百度数据。否则,百度将依法追究法律责任。\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "十四、网络服务内容的所有权\\n\\n企查猫定义的网络服务内容包括:文字、终端、声音、图片、录象、图表、广告中的全部内容;电子邮件的全部内容;企查猫为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在企查猫和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。企查猫所有的文章版权归原文作者和企查猫共同所有,任何人需要转载企查猫的文章,必须征得原文作者或企查猫授权。我们的服务方式适应于通过电话线拨号上网(或者其他方式)接入INTERNET。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权声明:\\n凡本网注明“来源:报告大厅”的所有作品,版权均属于中国报告大厅网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明\"来源:报告大厅网\"。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非中国报告大厅网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的。 联系方式: +86-10-58247072", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "律师声明\\n为维护自身合法权益,分析测试百科网授权本律师声明如下:\\n\\n本网站所有的信息,包括但不限于文字、图片及其他资源,均受到《中华人民共和国著作权法》及相关法律法规和国际条约的保护;上述内容的知识产权属于本公司,或其他授权公司用于网站使用的内容提供者。\\n任何单位或个人使用本网站的信息,必须获得分析测试百科网授权,未经授权许可,不得转载或镜像,否则本律师将根据当事人的委托追究其法律责任。\\n对于引用他人的信息,本网站均已经列明出处。我们转载的目的在于学术交流与讨论,如果您认为我们的转载侵犯了您的权益,请与我们联系,我们将在3个工作日内删除相关内容。\\n本网站文章仅代表作者本人的观点,与本网站立场无关,作者文责自负。\\n本网站所刊载的文章、图片、资料及价格信息等仅供参考使用。本网站所刊载的内容,并不代表同意其说法或描述,仅为提供更多信息,也不构成任何学术建议。任何依据本网站信息所做的决定均由其本人负责。\\n其他任何未尽事宜,请与本律师联系。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "optyright © 2009-2023 17house.com,All rights reserved. 北京一起网科技股份有限公司", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2009-2023 spzs.com. All Rights Reserved. ", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "1、版权:\\nA、此网址的所有内容和图表受《中华人民共和国著作权法》及相关法律法规和中国加入的所有知识产权方面的国际条约的保护。丁香通网站(http://www.biomart.cn,以下简称丁香通)对网站内容享有完整的著作权,未经其允许,不得以任何形式复制和采用。\\n\\nB、 请勿擅自复制或采用丁香通所创造的用以制成网页的HTML。丁香通对其html享有著作权。同时丁香通对其网址上的所有图 标、图饰、图表、色彩、文字表述及其组合、版面设计、数据库均享有完全的著作权,对发布的信息均享有专有的发布和使用权,未经丁香通同意,不得 擅自复制、使用或转载。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有:上海玄霆娱乐信息科技有限公司 网络出版服务许可证编号:(署)网出证沪字第055号", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 阅文集团版权所有\\n\\n网络文化经营许可证:沪网文【 2023 】0374-020号", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 0.00 second(s) 最后生成2023-11-20 06:28:51\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司。本站所收录的作品、社区话题、用户评论、用户上传内容或图片等均属用户个人行为。如前述内容侵害您的权益,欢迎举报投诉,一经核实,立即删除,本站不承担任何责任", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "出版物经营许可证 京出发京批字第直110071", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "6.1.1未经爱奇艺明确授权,以商业性或其他非个人使用等目的为自己或他人获取、使用本服务\\n6.1.2 未经爱奇艺明确授权,通过机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件等方式获取本服务、内容、数据\\n6.1.3未经爱奇艺明确授权,通过技术手段对服务内容、服务期限、消费金额、交易状态等信息进行修改;\\n6.1.4将本服务通过非爱奇艺明确授权的方式在爱奇艺账号之间转移,或未经爱奇艺明确授权而赠与、借用、租用、销售、转让本服务部分或全部内容\\n6.1.5未经爱奇艺明确授权,将本服务提供的部分或全部内容进行复制、下载、上传、修改、编目排序、翻译、发行、开发、转让、销售、展示、传播、合成、嵌套、链接、创作衍生作品、进行商业开发或推广等\\n6.1.6对爱奇艺用于保护本服务的任何安全措施技术进行破解、更改、反操作、篡改或其他破坏,未经爱奇艺事先书面同意而删除本服务内容上的任何所有权或知识产权声明或标签\\n6.1.7 未经爱奇艺明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示本服务内容(但如用户的上述行为不构成侵权的除+G76外) ;\\n6.1.8通过不正当手段或以违反诚实信用原则的方式(如利用规则漏洞、利用系统漏洞、滥用会员身份、黑色产业、投机等违背爱奇艺提供服务的初衷的方式);\\n6.1.9通过侵犯爱奇艺或他人合法权益的方式\\n6.1.10其他未经爱奇艺明示授权许可或违反本协议、法律法规或监管政策的行为", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright(C) 2008-2021 www.tadu.com All Rights Reserved 版权所有 北京易天新动网络科技有限公司 塔读小说版权所有,未经许可不得转载", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权归纵横文学旗下纵横中文网所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "12. 禁止商业行为\\n\\n您同意不对本服务任何部分或本服务之使用或获得,进行复制、拷贝、出售、转售或用于任何其它商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "百度拥有本网站内所有资料的版权,各分频道权利声明有特殊规定的,从其规定。任何被授权的浏览、复制、打印和传播属于本网站内的资料必须符合以下条件:\\n\\n所有的资料和图象均以获得信息为目的;\\n所有的资料和图象均不得用于商业目的;\\n所有的资料、图象及其任何部分都必须包括此版权声明;\\n本网站(www.baidu.com)所有的产品、技术与所有程序均属于百度知识产权,在此并未授权。“Baidu”、 “百度”及相关图形等为百度的注册商标。\\n\\n未经百度许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用,或通过非常规方式(如:恶意干预百度数据)影响百度的正常服务,任何人不得擅自以软件程序自动获得百度数据。否则,百度将依法追究法律责任。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "十四、网络服务内容的所有权\\n\\n企查猫定义的网络服务内容包括:文字、终端、声音、图片、录象、图表、广告中的全部内容;电子邮件的全部内容;企查猫为用户提供的其他信息。所有这些内容受版权、商标、标签和其它财产所有权法律的保护。所以,用户只能在企查猫和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。企查猫所有的文章版权归原文作者和企查猫共同所有,任何人需要转载企查猫的文章,必须征得原文作者或企查猫授权。我们的服务方式适应于通过电话线拨号上网(或者其他方式)接入INTERNET。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明:\\n凡本网注明“来源:报告大厅”的所有作品,版权均属于中国报告大厅网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明\"来源:报告大厅网\"。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非中国报告大厅网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的。 联系方式: +86-10-58247072", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "律师声明\\n为维护自身合法权益,分析测试百科网授权本律师声明如下:\\n\\n本网站所有的信息,包括但不限于文字、图片及其他资源,均受到《中华人民共和国著作权法》及相关法律法规和国际条约的保护;上述内容的知识产权属于本公司,或其他授权公司用于网站使用的内容提供者。\\n任何单位或个人使用本网站的信息,必须获得分析测试百科网授权,未经授权许可,不得转载或镜像,否则本律师将根据当事人的委托追究其法律责任。\\n对于引用他人的信息,本网站均已经列明出处。我们转载的目的在于学术交流与讨论,如果您认为我们的转载侵犯了您的权益,请与我们联系,我们将在3个工作日内删除相关内容。\\n本网站文章仅代表作者本人的观点,与本网站立场无关,作者文责自负。\\n本网站所刊载的文章、图片、资料及价格信息等仅供参考使用。本网站所刊载的内容,并不代表同意其说法或描述,仅为提供更多信息,也不构成任何学术建议。任何依据本网站信息所做的决定均由其本人负责。\\n其他任何未尽事宜,请与本律师联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "optyright © 2009-2023 17house.com,All rights reserved. 北京一起网科技股份有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2009-2023 spzs.com. All Rights Reserved. ", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1、版权:\\nA、此网址的所有内容和图表受《中华人民共和国著作权法》及相关法律法规和中国加入的所有知识产权方面的国际条约的保护。丁香通网站(http://www.biomart.cn,以下简称丁香通)对网站内容享有完整的著作权,未经其允许,不得以任何形式复制和采用。\\n\\nB、 请勿擅自复制或采用丁香通所创造的用以制成网页的HTML。丁香通对其html享有著作权。同时丁香通对其网址上的所有图 标、图饰、图表、色彩、文字表述及其组合、版面设计、数据库均享有完全的著作权,对发布的信息均享有专有的发布和使用权,未经丁香通同意,不得 擅自复制、使用或转载。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有:上海玄霆娱乐信息科技有限公司 网络出版服务许可证编号:(署)网出证沪字第055号", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 阅文集团版权所有\\n\\n网络文化经营许可证:沪网文【 2023 】0374-020号", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 0.00 second(s) 最后生成2023-11-20 06:28:51\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司。本站所收录的作品、社区话题、用户评论、用户上传内容或图片等均属用户个人行为。如前述内容侵害您的权益,欢迎举报投诉,一经核实,立即删除,本站不承担任何责任", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "出版物经营许可证 京出发京批字第直110071", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "6.1.1未经爱奇艺明确授权,以商业性或其他非个人使用等目的为自己或他人获取、使用本服务\\n6.1.2 未经爱奇艺明确授权,通过机器人软件、蜘蛛软件、爬虫软件等任何自动程序、脚本、软件等方式获取本服务、内容、数据\\n6.1.3未经爱奇艺明确授权,通过技术手段对服务内容、服务期限、消费金额、交易状态等信息进行修改;\\n6.1.4将本服务通过非爱奇艺明确授权的方式在爱奇艺账号之间转移,或未经爱奇艺明确授权而赠与、借用、租用、销售、转让本服务部分或全部内容\\n6.1.5未经爱奇艺明确授权,将本服务提供的部分或全部内容进行复制、下载、上传、修改、编目排序、翻译、发行、开发、转让、销售、展示、传播、合成、嵌套、链接、创作衍生作品、进行商业开发或推广等\\n6.1.6对爱奇艺用于保护本服务的任何安全措施技术进行破解、更改、反操作、篡改或其他破坏,未经爱奇艺事先书面同意而删除本服务内容上的任何所有权或知识产权声明或标签\\n6.1.7 未经爱奇艺明确授权,采用收费或免费的方式,在任何公开场合全部或部分展示本服务内容(但如用户的上述行为不构成侵权的除+G76外) ;\\n6.1.8通过不正当手段或以违反诚实信用原则的方式(如利用规则漏洞、利用系统漏洞、滥用会员身份、黑色产业、投机等违背爱奇艺提供服务的初衷的方式);\\n6.1.9通过侵犯爱奇艺或他人合法权益的方式\\n6.1.10其他未经爱奇艺明示授权许可或违反本协议、法律法规或监管政策的行为", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright(C) 2008-2021 www.tadu.com All Rights Reserved 版权所有 北京易天新动网络科技有限公司 塔读小说版权所有,未经许可不得转载", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权归纵横文学旗下纵横中文网所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data5.json b/archived_sigs/datacompliance/merged_data5.json similarity index 99% rename from sigs/datacompliance/merged_data5.json rename to archived_sigs/datacompliance/merged_data5.json index 4251a86..8e0edfe 100644 --- a/sigs/datacompliance/merged_data5.json +++ b/archived_sigs/datacompliance/merged_data5.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2006-2023unjs.com版权所有", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "知识产权声明\\n孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "AllRights Reserved版权所有 北京创阅科技有限公司", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "用户在下厨房发布的菜谱、作品、图片、文字等内容,著作权均归本人所有。\\n用户不得将侵犯他人的专利、商标、著作权、商业秘密或其他专属权利之内容进行上载、张贴或以其他方式发布在下厨房;用户自行发布或者授权他人在下厨房平台发表的全部内容,授予下厨房免费的、不可撤销的、非独家使用许可,用于下厨房相关的产品和服务上,包括但不限于网站、手机客户端或其他互联网产品,下厨房将在显著位置标注作者信息。\\n标有「独家」选项的菜谱,用户如果需要同时发布在其他互联网平台,需要得到下厨房的许可,否则视为侵权,下厨房保留对这些内容的处理权力,包括但不限于取消「独家」标识、屏蔽(不出现公共区域,包括但不限于榜单、分类里)、删除,请自行做好内容备份。\\n第三方出于非商业目的,将用户在下厨房上发表的内容进行转载,应该在显著位置注明原作者信息以及「来源于下厨房」、给出原始链接,并且不允许对内容进行修改演绎。(如用户在内容里表达拒绝任何形式的转载,以用户的版权声明为准)\\n用户需要对上传的图片、文字等内容的版权负责,下厨房不承担因此带来的任何第三方责任以及法律风险。\\n对于第三方侵犯下厨房用户的相关权益,在用户的同意和授权下,下厨房保留对该第三方提出警告、诉讼的权利。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权所有 © 2004-2023 北京盛世传越科技有限公司 保留所有权利 除该菜谱及其它内容上载的用户所享有的版权,未经美食天下明示授权许可,其他用户不得进行修改、出租、散布或衍生其他作品。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "食品科技网 版权所有©1999-2022 TECH-FOOD.COM ALL RIGHTS RESERVED.未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:食品科技网”。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非食品科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "用户不得自行或许可任何第三方对“豆果美食”软件及相关服务复制、修改、出售或衍生产品。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright2014-2020© 卡饭网", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "我们的产品中明确标注为果壳发布或者原创的内容,其知识产权归属于果壳所有、或者我们已获得权利人的合法授权。用户在使用本服务中所产生的内容的知识产权归用户或相关权利人所有。未经权利人同意,您不得以任何形式使用前述内容,否则因此产生的法律责任由您自行承担。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2004-2023博客园保留所有权利", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 环球时报在线(北京)文化传播有限公司 版权所有 用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2011-2023 SegmentFault. SegmentFault 为用户提供“保留所有权利,禁止转载”的选项。除非获得原作者的单独授权,任何第三方不得转载标注了“禁止转载”的内容,否则均视为侵权。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023unjs.com版权所有", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright By 晋江文学城 www.jjwxc.net All rights reserved\\nProcessed in 1,700,128,109.22 second(s) 最后生成2023-11-16 17:48:29\\n违规内容投诉/未成年投诉热线400-870-5552,短信投诉发15300292289,投诉邮箱help@jjwxc.com,欢迎网监部门直接致电通知删除违规内容\\n本站作品(专栏、小说、评论、贴子等)版权均为原创者所有,本站仅提供上传、存储及展示功能。本站所收录、展示内容及广告仅代表创作者观点,与本站立场无关。\\n请所有用户发布内容时严格遵守国家相关法律法规。我们拒绝任何色情暴力及其他违规内容,一经发现,立即删除,严重者将同时封禁账号。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1999-2023 www.hongxiu.com All Rights Reserved版权所有 北京红袖添香科技发展有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright (C) 2006-2022 www.17k.com All Rights Reserved 中文在线版权所有, 都市小说、 仙侠武侠、 言情小说等在线小说阅读网站,未经许可不得擅自转载本站内容。\\n17K小说网所收录免费小说作品、社区话题、书友评论、用户上传文字、图片等其他一切内容均属用户个人行为,与17K小说网无关。--17K权利声明。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "知识产权声明\\n孔夫子旧书网拥有本网站内所有信息内容(除孔夫子旧书网会员发布的商品信息外,包括但不限于文字、图片、软件、音频、视频)的版权。\\n\\n任何被授权的浏览、复制、打印和传播属于本网站内信息内容都不得用于商业目的且所有信息内容及其任何部分的使用都必须包括此版权声明;\\n\\n孔夫子旧书网(www.kongfz.com)所有的产品、技术与所有程序均属于孔夫子旧书网知识产权。\"kongfz\"\"孔夫子旧书网\"、其他产品服务名称及相关图形、标识等为孔夫子旧书网的注册商标。未经孔夫子旧书网许可,任何人不得擅自(包括但不限于:以非法的方式复制、传播、展示、镜像、上载、下载)使用。否则,孔夫子旧书网将依法追究法律责任。\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "AllRights Reserved版权所有 北京创阅科技有限公司", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户在下厨房发布的菜谱、作品、图片、文字等内容,著作权均归本人所有。\\n用户不得将侵犯他人的专利、商标、著作权、商业秘密或其他专属权利之内容进行上载、张贴或以其他方式发布在下厨房;用户自行发布或者授权他人在下厨房平台发表的全部内容,授予下厨房免费的、不可撤销的、非独家使用许可,用于下厨房相关的产品和服务上,包括但不限于网站、手机客户端或其他互联网产品,下厨房将在显著位置标注作者信息。\\n标有「独家」选项的菜谱,用户如果需要同时发布在其他互联网平台,需要得到下厨房的许可,否则视为侵权,下厨房保留对这些内容的处理权力,包括但不限于取消「独家」标识、屏蔽(不出现公共区域,包括但不限于榜单、分类里)、删除,请自行做好内容备份。\\n第三方出于非商业目的,将用户在下厨房上发表的内容进行转载,应该在显著位置注明原作者信息以及「来源于下厨房」、给出原始链接,并且不允许对内容进行修改演绎。(如用户在内容里表达拒绝任何形式的转载,以用户的版权声明为准)\\n用户需要对上传的图片、文字等内容的版权负责,下厨房不承担因此带来的任何第三方责任以及法律风险。\\n对于第三方侵犯下厨房用户的相关权益,在用户的同意和授权下,下厨房保留对该第三方提出警告、诉讼的权利。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权所有 © 2004-2023 北京盛世传越科技有限公司 保留所有权利 除该菜谱及其它内容上载的用户所享有的版权,未经美食天下明示授权许可,其他用户不得进行修改、出租、散布或衍生其他作品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "食品科技网 版权所有©1999-2022 TECH-FOOD.COM ALL RIGHTS RESERVED.未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:食品科技网”。违反上述声明者,本网将追究其相关法律责任。 凡本网注明“来源:XXX(非食品科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "用户不得自行或许可任何第三方对“豆果美食”软件及相关服务复制、修改、出售或衍生产品。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright2014-2020© 卡饭网", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "我们的产品中明确标注为果壳发布或者原创的内容,其知识产权归属于果壳所有、或者我们已获得权利人的合法授权。用户在使用本服务中所产生的内容的知识产权归用户或相关权利人所有。未经权利人同意,您不得以任何形式使用前述内容,否则因此产生的法律责任由您自行承担。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2004-2023博客园保留所有权利", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 环球时报在线(北京)文化传播有限公司 版权所有 用户只能在环球网和相关权利人授权下才能使用这些内容,而不能擅自复制、发布、转载、播放、改编、汇编或以其他方式使用这些内容或将该等内容用于其他任何商业目的。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2011-2023 SegmentFault. SegmentFault 为用户提供“保留所有权利,禁止转载”的选项。除非获得原作者的单独授权,任何第三方不得转载标注了“禁止转载”的内容,否则均视为侵权。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data6.json b/archived_sigs/datacompliance/merged_data6.json similarity index 98% rename from sigs/datacompliance/merged_data6.json rename to archived_sigs/datacompliance/merged_data6.json index 050f72d..b2e7715 100644 --- a/sigs/datacompliance/merged_data6.json +++ b/archived_sigs/datacompliance/merged_data6.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "1997-2023 版权所有 Copyright(C)Mydrivers.com, All Rights Reserved.", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright2014-2020©卡饭网", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 稀土掘金 除非得到公司事先书面授权,您不得以任何形式对“稀土掘金”及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CoolShell.cn © 2023 除非文章内特别说明,你可以转载酷壳的文章,但请加入文章作者和出处。谢谢。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight 2000 CFl, Inc. All Rights Reserved", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权声明©2023 盖德化工网 第三方若出于非商业目的,将用户在盖德问答上发表的内容转载在盖德问答之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在盖德问答上使用的帐号名称),给出原始链接,注明「发表于盖德问答」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996-2020 IASK Corporation,All Right Reserved 用户从新浪爱问的服务中获得的信息在没有得到事先许可的情况下,个人或提供给第三方利用复制,发送,传播等手段用于盈利目的时,将追究相关当事人的法律责任。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经公司书面许可,您不得自行或授权、允许、协助任何第三人对本协议查字典平台服务中信息内容进行如下行为:(1)复制、读取、采用查字典服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "1997-2023 版权所有 Copyright(C)Mydrivers.com, All Rights Reserved.", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright2014-2020©卡饭网", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 稀土掘金 除非得到公司事先书面授权,您不得以任何形式对“稀土掘金”及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CoolShell.cn © 2023 除非文章内特别说明,你可以转载酷壳的文章,但请加入文章作者和出处。谢谢。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright @ 2007-2023 中国科学报社 All Rights Reserved 凡本网注明“来源:科学网”或“中国科学报”的文字、图片和音、视频作品,版权均属科学网所有,任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式使用;已经有本网书面授权的,在使用时必须注明“来源:科学网”", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经东方财富或相关权利人事先书面许可,任何人不得将本网站上的任何内容以任何方式进行复制、修改、转载、传播、经销、翻印、演示、出版或任何其它形式的散发。", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight 2000 CFl, Inc. All Rights Reserved", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权声明©2023 盖德化工网 第三方若出于非商业目的,将用户在盖德问答上发表的内容转载在盖德问答之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在盖德问答上使用的帐号名称),给出原始链接,注明「发表于盖德问答」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2020 IASK Corporation,All Right Reserved 用户从新浪爱问的服务中获得的信息在没有得到事先许可的情况下,个人或提供给第三方利用复制,发送,传播等手段用于盈利目的时,将追究相关当事人的法律责任。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经公司书面许可,您不得自行或授权、允许、协助任何第三人对本协议查字典平台服务中信息内容进行如下行为:(1)复制、读取、采用查字典服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data7.json b/archived_sigs/datacompliance/merged_data7.json similarity index 99% rename from sigs/datacompliance/merged_data7.json rename to archived_sigs/datacompliance/merged_data7.json index 3265001..a2751af 100644 --- a/sigs/datacompliance/merged_data7.json +++ b/archived_sigs/datacompliance/merged_data7.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2005-2023 douban.com, all rights reserved 豆瓣网展示的豆瓣标识、版面设计、排版方式、文本、图片、图形等受著作权法、商标法、专利法及其他法律保护的部分,未经豆瓣书面同意,不得进行任何形式的发布、改编、修改,或其他商业及非商业性使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", - "output": "已无法访问" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "无法访问", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任.", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经中国台湾网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中国台湾网的上述内容。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2011-2019 ZAKER.All Rights Reserved", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "未经授权  严禁转载 Copyright © 2023 JCRB.com Inc. All Rights Reserved.", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2005-2023 版权所有 360公司 个别授权: 未经360事先书面同意并获得书面授权和许可,您不得进行任何商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1998 - 2023 Tencent. All Rights Reserved 腾讯公司对其发行的或与合作伙伴共同发行的作品享有版权,受各国版权法及国际版权公约的保护。\\n对于上述版权内容,超越合理使用范畴、并未经本公司书面许可的使用行为,我公司均保留追究法律责任的权利。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 2023 marksmile.com", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©1999-2023清科创业版权所有", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2003-2022 7k7k.com ,除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2004-2023 4399.com All Rights Reserved. 四三九九网络股份有限公司 版权所有 除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2019-2020 66game.cn 66街机网 未得66街机游戏网的书面允许,任何人不得以各种形式复制、散布、出售、出版、广播、转播66街机游戏网上的相关信息。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright 2004-2023 TGBUS Corporation, All Rights Reserved 任何传播媒体转载、摘编本网站刊登、发布的作品,必须按有关规定向著作权人或本网站支付报酬并注明出处,且不得超过本网站刊登、转载该作品的范围;著作权人声明或者本网站受著作权人授权声明不得转载、摘编其作品的,任何人不得擅自转载、摘编,否则必须承担一切法律后果。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "CopyRight © 2011-2023 www.nanrenwo.net,All rights reserved. 男人窝 版权所有. 除了授权转载和用户自行分享发布的信息之外拥有版权等知识产权,受法律保护。未经厦门男人尚网络科技有书面授权许可,任何其他个人或组织均不得以任何形式将本网站的各项资源转载、复制、编辑、修改或抄录于其他任何场合;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2005-2023 douban.com, all rights reserved 豆瓣网展示的豆瓣标识、版面设计、排版方式、文本、图片、图形等受著作权法、商标法、专利法及其他法律保护的部分,未经豆瓣书面同意,不得进行任何形式的发布、改编、修改,或其他商业及非商业性使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2023 猫眼电影 www.maoyan.com 未经本平台事先书面许可,您不应自行或授权、协助任何第三方采用任何未经本平台认可的程序、软件、引擎、爬虫或者其他非正常浏览等技术手段抓取本平台所展示的任何内容(无论该等内容是否由您本人发表或传播)", + "output": "已无法访问" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "无法访问", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权禁止转载、摘编、复制或建立镜像,如有违反,追究法律责任.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经中国台湾网书面许可,任何人不得引用、复制、转载、摘编或以其他任何方式非法使用中国台湾网的上述内容。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2011-2019 ZAKER.All Rights Reserved", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "未经授权  严禁转载 Copyright © 2023 JCRB.com Inc. All Rights Reserved.", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2005-2023 版权所有 360公司 个别授权: 未经360事先书面同意并获得书面授权和许可,您不得进行任何商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 今日头条 除非得到公司事先明示书面授权,你不得以任何形式对“今日头条”软件及相关服务进行包括但不限于改编、复制、传播、垂直搜索、镜像或交易等未经授权的访问或使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1998 - 2023 Tencent. All Rights Reserved 腾讯公司对其发行的或与合作伙伴共同发行的作品享有版权,受各国版权法及国际版权公约的保护。\\n对于上述版权内容,超越合理使用范畴、并未经本公司书面许可的使用行为,我公司均保留追究法律责任的权利。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 2023 marksmile.com", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©1999-2023清科创业版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2003-2022 7k7k.com ,除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2004-2023 4399.com All Rights Reserved. 四三九九网络股份有限公司 版权所有 除非获得权利人的授权,用户不得转载、修改、传播、制作衍生作品或者商业使用。用户或其他媒体、企业、网站、其他组织或个人对本平台内容如需使用,必须先与作者、相关权利人或本平台联系。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2019-2020 66game.cn 66街机网 未得66街机游戏网的书面允许,任何人不得以各种形式复制、散布、出售、出版、广播、转播66街机游戏网上的相关信息。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright 2004-2023 TGBUS Corporation, All Rights Reserved 任何传播媒体转载、摘编本网站刊登、发布的作品,必须按有关规定向著作权人或本网站支付报酬并注明出处,且不得超过本网站刊登、转载该作品的范围;著作权人声明或者本网站受著作权人授权声明不得转载、摘编其作品的,任何人不得擅自转载、摘编,否则必须承担一切法律后果。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "CopyRight © 2011-2023 www.nanrenwo.net,All rights reserved. 男人窝 版权所有. 除了授权转载和用户自行分享发布的信息之外拥有版权等知识产权,受法律保护。未经厦门男人尚网络科技有书面授权许可,任何其他个人或组织均不得以任何形式将本网站的各项资源转载、复制、编辑、修改或抄录于其他任何场合;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + } ] \ No newline at end of file diff --git a/sigs/datacompliance/merged_data8.json b/archived_sigs/datacompliance/merged_data8.json similarity index 100% rename from sigs/datacompliance/merged_data8.json rename to archived_sigs/datacompliance/merged_data8.json diff --git a/sigs/datacompliance/merged_data9.json b/archived_sigs/datacompliance/merged_data9.json similarity index 99% rename from sigs/datacompliance/merged_data9.json rename to archived_sigs/datacompliance/merged_data9.json index f2261dc..ac5f206 100644 --- a/sigs/datacompliance/merged_data9.json +++ b/archived_sigs/datacompliance/merged_data9.json @@ -1,102 +1,102 @@ -[ - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2022虎扑 hupu.com 除非得到虎扑明示事先书面授权,您不得以任何形式改编、复制、传播、垂直搜索、镜像或交易虎扑相关软件或服务。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2015-2019 后台修改文字 版权所有 本站采用创作共用版权 CC BY-NC-SA 3.0 CN 许可协议,转载或复制请注明出处", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "没有声明", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "©2012-2021 上海佰集信息科技有限公司 / 简书 如需进行商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等,您必须另行取得我公司的书面授权和许可。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": " © 2005-2023 douban.com, all rights reserved 北京豆网科技有限公司 除法律另有规定外,在未取得豆瓣书面许可前,任何主体不得将豆瓣网的任何公开信息或数据以任何目的进行任何形式的使用,包括但不限于: (1) 商业性使用; (2) 以可能损害豆瓣权益的方式对豆瓣网读书、电影、音乐等条目信息、评分或评论的使用、引用以及展示; (3) 对豆瓣网内容的衍生利用,包括但不限于基于或利用豆瓣网内容而开发的任何插件、软件、应用程序、网站; (4) 以任何形式盗取、拷贝用户账号信息,或采用诱导、要求用户提供账号名称及密码等方式登录用户账号,或对用户主页、ID信息、账号信息的其他使用;或以上述方式取得用户账号登录信息、ID信息、主页信息后,以任何手段复制、转载、抓取豆瓣网内容; (5) 侵犯或可能侵犯豆瓣权益的数据采集、网络爬虫或类似的数据收集以及数据摘录等; (6) 在其他网站、应用程序、服务或商品中使用豆瓣的商标、标识或其他豆瓣专有信息(包括图像、文字、数字、网页设计或形式等); (7) 其他可能侵犯豆瓣合法权益的行为。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "好大夫在线版权所有 Copyright 2023 转载或引用医生在好大夫在线上发布的原创作品/内容,应获得医生授权,以显著方式注明医生姓名和医生个人网站链接,并按照法律规定向医生支付稿酬。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "中国信鸽协会版权所有 www.crpa.cn 中国信鸽协会官方网站独家发布的所有资料(版面、文字、图片、音视频资料和技术统计数据及软件),未经许可不得转载,经许可转载应标明新闻来源为“中国信鸽协会官方网站”并加上来源的网站链接。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2007- 2023 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2007-2021 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (2)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (3)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2014 - 2022 最句子 粤ICP备20047785号-2 , All Rights Reserved ", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2006-2015 全景统计 如未经著作权人授权用于他处和/或作为他用,著作权人及本站将保留追究侵权者法律责任的权利。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright©2006-2023 ruiwen.com版权所有", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "© 中国国家图书馆版权所有 本网站发布的所有自建的或与他人共同开发的信息和内容,包括但不限于标识、图文、音频、视频、网站版式、网页设计等各项内容,除特别注明外,相关作品的著作权均为国家图书馆所有。任何单位或个人未经事先书面许可,均不得将以上内容用于任何商业用途,未经许可用于商业用途或非法目的而侵害我馆合法权益甚至影响我馆声誉的,我馆保留依法追究其法律责任的权利。如需使用相关资料,请提前与我馆相关部门联系(联系邮箱: webmaster@nlc.cn)。", - "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" - }, - { - "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", - "input": "Copyright © 2010 www.lishi.net 版权所有 您的网站或机构从本站获取的一切资源进行商业使用,除来源为本站的资料需与本站协商外,其他资源请自行联系版权所有人。", - "output": "版权限制不清晰,律师认为有灵活空间,可解释" - } +[ + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996-2023 SINA Corporation All Rights Reserved 新浪公司 版权所有 除非中国法律另有规定,未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。\\n\\n", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2022虎扑 hupu.com 除非得到虎扑明示事先书面授权,您不得以任何形式改编、复制、传播、垂直搜索、镜像或交易虎扑相关软件或服务。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2015-2019 后台修改文字 版权所有 本站采用创作共用版权 CC BY-NC-SA 3.0 CN 许可协议,转载或复制请注明出处", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "没有声明", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "©2012-2021 上海佰集信息科技有限公司 / 简书 如需进行商业性的销售、复制、分发,包括但不限于软件销售、预装、捆绑等,您必须另行取得我公司的书面授权和许可。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": " © 2005-2023 douban.com, all rights reserved 北京豆网科技有限公司 除法律另有规定外,在未取得豆瓣书面许可前,任何主体不得将豆瓣网的任何公开信息或数据以任何目的进行任何形式的使用,包括但不限于: (1) 商业性使用; (2) 以可能损害豆瓣权益的方式对豆瓣网读书、电影、音乐等条目信息、评分或评论的使用、引用以及展示; (3) 对豆瓣网内容的衍生利用,包括但不限于基于或利用豆瓣网内容而开发的任何插件、软件、应用程序、网站; (4) 以任何形式盗取、拷贝用户账号信息,或采用诱导、要求用户提供账号名称及密码等方式登录用户账号,或对用户主页、ID信息、账号信息的其他使用;或以上述方式取得用户账号登录信息、ID信息、主页信息后,以任何手段复制、转载、抓取豆瓣网内容; (5) 侵犯或可能侵犯豆瓣权益的数据采集、网络爬虫或类似的数据收集以及数据摘录等; (6) 在其他网站、应用程序、服务或商品中使用豆瓣的商标、标识或其他豆瓣专有信息(包括图像、文字、数字、网页设计或形式等); (7) 其他可能侵犯豆瓣合法权益的行为。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 1996 - 2023 SINA Corporation, All Rights Reserved 未经新浪公司书面许可,对于新浪公司拥有版权和/或其他知识产权的任何内容,任何人不得复制或在非新浪公司所属的服务器上做镜像或以其他任何方式进行使用;对于“新浪网”、“sina”等商标,任何人不得擅自使用。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "好大夫在线版权所有 Copyright 2023 转载或引用医生在好大夫在线上发布的原创作品/内容,应获得医生授权,以显著方式注明医生姓名和医生个人网站链接,并按照法律规定向医生支付稿酬。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "中国信鸽协会版权所有 www.crpa.cn 中国信鸽协会官方网站独家发布的所有资料(版面、文字、图片、音视频资料和技术统计数据及软件),未经许可不得转载,经许可转载应标明新闻来源为“中国信鸽协会官方网站”并加上来源的网站链接。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007- 2023 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2007-2021 Boqii.com All Rights Reserved 光橙(上海)信息科技有限公司 版权所有 用户只能在光橙公司和广告商授权下才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。 ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (2)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2000-2023www.ChinaXinge.com All Rights Reserved 未经中信网许可,任何用户、第三方不得自行或授权、允许、协助任何他人对中信网服务中信息内容进行如下行为:\\n\\n (1)复制、读取、采用中信网服务的信息内容,用于包括但不限于宣传、增加阅读量、浏览量等商业用途;\\n\\n (3)擅自编辑、整理、编排中信网服务的信息内容后在中信网的源页面以外的渠道进行展示;", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2014 - 2022 最句子 粤ICP备20047785号-2 , All Rights Reserved ", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2006-2015 全景统计 如未经著作权人授权用于他处和/或作为他用,著作权人及本站将保留追究侵权者法律责任的权利。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright©2006-2023 ruiwen.com版权所有", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "© 中国国家图书馆版权所有 本网站发布的所有自建的或与他人共同开发的信息和内容,包括但不限于标识、图文、音频、视频、网站版式、网页设计等各项内容,除特别注明外,相关作品的著作权均为国家图书馆所有。任何单位或个人未经事先书面许可,均不得将以上内容用于任何商业用途,未经许可用于商业用途或非法目的而侵害我馆合法权益甚至影响我馆声誉的,我馆保留依法追究其法律责任的权利。如需使用相关资料,请提前与我馆相关部门联系(联系邮箱: webmaster@nlc.cn)。", + "output": "这是高风险许可证,明确要书面许可,提供出去有较大风险" + }, + { + "instruction": "以下是一个数据集使用的许可文本或者是使用协议文本,帮我判断一下该数据集是否可以商用?不确定的话也请明确表示。", + "input": "Copyright © 2010 www.lishi.net 版权所有 您的网站或机构从本站获取的一切资源进行商业使用,除来源为本站的资料需与本站协商外,其他资源请自行联系版权所有人。", + "output": "版权限制不清晰,律师认为有灵活空间,可解释" + } ] \ No newline at end of file diff --git a/sigs/dx/README.md b/archived_sigs/dx/README.md similarity index 100% rename from sigs/dx/README.md rename to archived_sigs/dx/README.md diff --git a/sigs/dx/docs/How to build a SIG or WG_cn.md b/archived_sigs/dx/docs/How to build a SIG or WG_cn.md similarity index 100% rename from sigs/dx/docs/How to build a SIG or WG_cn.md rename to archived_sigs/dx/docs/How to build a SIG or WG_cn.md diff --git a/sigs/dx/docs/How to build a SIG or WG_en.md b/archived_sigs/dx/docs/How to build a SIG or WG_en.md similarity index 100% rename from sigs/dx/docs/How to build a SIG or WG_en.md rename to archived_sigs/dx/docs/How to build a SIG or WG_en.md diff --git a/sigs/dx/docs/SIG Governance_CN.md b/archived_sigs/dx/docs/SIG Governance_CN.md similarity index 100% rename from sigs/dx/docs/SIG Governance_CN.md rename to archived_sigs/dx/docs/SIG Governance_CN.md diff --git a/sigs/dx/docs/SIG Governance_EN.md b/archived_sigs/dx/docs/SIG Governance_EN.md similarity index 100% rename from sigs/dx/docs/SIG Governance_EN.md rename to archived_sigs/dx/docs/SIG Governance_EN.md diff --git a/sigs/dx/docs/design-template.md b/archived_sigs/dx/docs/design-template.md similarity index 100% rename from sigs/dx/docs/design-template.md rename to archived_sigs/dx/docs/design-template.md diff --git a/sigs/dx/docs/images/add_sig_issue.png b/archived_sigs/dx/docs/images/add_sig_issue.png similarity index 100% rename from sigs/dx/docs/images/add_sig_issue.png rename to archived_sigs/dx/docs/images/add_sig_issue.png diff --git a/sigs/dx/docs/images/maillist.png b/archived_sigs/dx/docs/images/maillist.png similarity index 100% rename from sigs/dx/docs/images/maillist.png rename to archived_sigs/dx/docs/images/maillist.png diff --git a/sigs/dx/docs/images/real_warrior.jpeg b/archived_sigs/dx/docs/images/real_warrior.jpeg similarity index 100% rename from sigs/dx/docs/images/real_warrior.jpeg rename to archived_sigs/dx/docs/images/real_warrior.jpeg diff --git a/sigs/dx/docs/images/sig.jpg b/archived_sigs/dx/docs/images/sig.jpg similarity index 100% rename from sigs/dx/docs/images/sig.jpg rename to archived_sigs/dx/docs/images/sig.jpg diff --git a/sigs/dx/docs/issue-workflow.md b/archived_sigs/dx/docs/issue-workflow.md similarity index 100% rename from sigs/dx/docs/issue-workflow.md rename to archived_sigs/dx/docs/issue-workflow.md diff --git a/sigs/dx/docs/labels.md b/archived_sigs/dx/docs/labels.md similarity index 100% rename from sigs/dx/docs/labels.md rename to archived_sigs/dx/docs/labels.md diff --git a/sigs/dx/docs/robot_design_CN.md b/archived_sigs/dx/docs/robot_design_CN.md similarity index 100% rename from sigs/dx/docs/robot_design_CN.md rename to archived_sigs/dx/docs/robot_design_CN.md diff --git a/sigs/dx/images/requirements_of_dx-bot_2021H2.png b/archived_sigs/dx/images/requirements_of_dx-bot_2021H2.png similarity index 100% rename from sigs/dx/images/requirements_of_dx-bot_2021H2.png rename to archived_sigs/dx/images/requirements_of_dx-bot_2021H2.png diff --git a/sigs/dx/issue_analysis/202104_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202104_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202104_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202104_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/202105_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202105_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202105_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202105_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/202106_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202106_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202106_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202106_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/202107_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202107_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202107_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202107_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/202108_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202108_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202108_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202108_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/202109_MindSpore_issue_analysis.xlsx b/archived_sigs/dx/issue_analysis/202109_MindSpore_issue_analysis.xlsx similarity index 100% rename from sigs/dx/issue_analysis/202109_MindSpore_issue_analysis.xlsx rename to archived_sigs/dx/issue_analysis/202109_MindSpore_issue_analysis.xlsx diff --git a/sigs/dx/issue_analysis/scripts/event_classifier.py b/archived_sigs/dx/issue_analysis/scripts/event_classifier.py similarity index 100% rename from sigs/dx/issue_analysis/scripts/event_classifier.py rename to archived_sigs/dx/issue_analysis/scripts/event_classifier.py diff --git a/sigs/dx/issue_analysis/scripts/issue_data_analyzer.py b/archived_sigs/dx/issue_analysis/scripts/issue_data_analyzer.py similarity index 100% rename from sigs/dx/issue_analysis/scripts/issue_data_analyzer.py rename to archived_sigs/dx/issue_analysis/scripts/issue_data_analyzer.py diff --git a/sigs/dx/meetings/001-20210309.md b/archived_sigs/dx/meetings/001-20210309.md similarity index 100% rename from sigs/dx/meetings/001-20210309.md rename to archived_sigs/dx/meetings/001-20210309.md diff --git a/sigs/dx/meetings/002-20210323.md b/archived_sigs/dx/meetings/002-20210323.md similarity index 100% rename from sigs/dx/meetings/002-20210323.md rename to archived_sigs/dx/meetings/002-20210323.md diff --git a/sigs/dx/meetings/003-20210407.md b/archived_sigs/dx/meetings/003-20210407.md similarity index 100% rename from sigs/dx/meetings/003-20210407.md rename to archived_sigs/dx/meetings/003-20210407.md diff --git a/sigs/dx/meetings/004-20210427.md b/archived_sigs/dx/meetings/004-20210427.md similarity index 100% rename from sigs/dx/meetings/004-20210427.md rename to archived_sigs/dx/meetings/004-20210427.md diff --git a/sigs/dx/meetings/005-20210511.md b/archived_sigs/dx/meetings/005-20210511.md similarity index 100% rename from sigs/dx/meetings/005-20210511.md rename to archived_sigs/dx/meetings/005-20210511.md diff --git a/sigs/dx/meetings/006-20210624.md b/archived_sigs/dx/meetings/006-20210624.md similarity index 100% rename from sigs/dx/meetings/006-20210624.md rename to archived_sigs/dx/meetings/006-20210624.md diff --git a/sigs/dx/meetings/007-20210713.md b/archived_sigs/dx/meetings/007-20210713.md similarity index 100% rename from sigs/dx/meetings/007-20210713.md rename to archived_sigs/dx/meetings/007-20210713.md diff --git a/sigs/dx/meetings/008-20210727.md b/archived_sigs/dx/meetings/008-20210727.md similarity index 100% rename from sigs/dx/meetings/008-20210727.md rename to archived_sigs/dx/meetings/008-20210727.md diff --git a/sigs/dx/meetings/009-20210907.md b/archived_sigs/dx/meetings/009-20210907.md similarity index 97% rename from sigs/dx/meetings/009-20210907.md rename to archived_sigs/dx/meetings/009-20210907.md index 6ca98af..8e493fe 100644 --- a/sigs/dx/meetings/009-20210907.md +++ b/archived_sigs/dx/meetings/009-20210907.md @@ -1,35 +1,35 @@ -# Tuesday, Sep 7, 2021 at 19:00 GMT+8 - -## Agenda - -* 1 - MindSpore Developer Kanban (Routine) -- Zhaoboxuan/wangyehui - -* 2 - Dev Portrait based reminder bot -- Zhaoboxuang - -* 3 - NPS Metrics model –- Wangyehui - -* 4 - The next step of Sep. conference in Nanjing –- Lizi/Prof.Cao - -## Conference links - -* Meeting link: [https://meeting.tencent.com/dm/M8wIUj0xud3y) - -* Meeting record link: https://www.bilibili.com/video/BV1rK4y1T7yg?p=8 - -## Attendees - -* Shanghai Jiaotong University OpenSource Team, Clement Li, Wang Yehui - -## Notes - -* 1 - Wang showed us the data of the Mindspore Developer Kanban - -* 2 - Zhao showed us the flowchart of the community reminder robot scheme based on the developer's portrait, and discussed the process, mainly discussed the measurement of the quality of the developer's comments. - -* 3 - Wang introduced us to the background and calculation process of the NPS indicator model, and discussed the evaluation process. - -* 4 - Prof.Cao and Clement Li discussed the plan of the Nanjing Research Group Achievement Conference at the end of September. - -## Action items - +# Tuesday, Sep 7, 2021 at 19:00 GMT+8 + +## Agenda + +* 1 - MindSpore Developer Kanban (Routine) -- Zhaoboxuan/wangyehui + +* 2 - Dev Portrait based reminder bot -- Zhaoboxuang + +* 3 - NPS Metrics model –- Wangyehui + +* 4 - The next step of Sep. conference in Nanjing –- Lizi/Prof.Cao + +## Conference links + +* Meeting link: [https://meeting.tencent.com/dm/M8wIUj0xud3y) + +* Meeting record link: https://www.bilibili.com/video/BV1rK4y1T7yg?p=8 + +## Attendees + +* Shanghai Jiaotong University OpenSource Team, Clement Li, Wang Yehui + +## Notes + +* 1 - Wang showed us the data of the Mindspore Developer Kanban + +* 2 - Zhao showed us the flowchart of the community reminder robot scheme based on the developer's portrait, and discussed the process, mainly discussed the measurement of the quality of the developer's comments. + +* 3 - Wang introduced us to the background and calculation process of the NPS indicator model, and discussed the evaluation process. + +* 4 - Prof.Cao and Clement Li discussed the plan of the Nanjing Research Group Achievement Conference at the end of September. + +## Action items + * 1 - At the end of September, the Nanjing Research Group Achievement Conference. -- Clement Li/Prof.Cao \ No newline at end of file diff --git a/sigs/dx/meetings/010-20211012.md b/archived_sigs/dx/meetings/010-20211012.md similarity index 100% rename from sigs/dx/meetings/010-20211012.md rename to archived_sigs/dx/meetings/010-20211012.md diff --git a/sigs/dx/meetings/011-20211109.md b/archived_sigs/dx/meetings/011-20211109.md similarity index 100% rename from sigs/dx/meetings/011-20211109.md rename to archived_sigs/dx/meetings/011-20211109.md diff --git a/sigs/dx/meetings/012-20211123.md b/archived_sigs/dx/meetings/012-20211123.md similarity index 100% rename from sigs/dx/meetings/012-20211123.md rename to archived_sigs/dx/meetings/012-20211123.md diff --git a/sigs/dx/meetings/013-20211207.md b/archived_sigs/dx/meetings/013-20211207.md similarity index 100% rename from sigs/dx/meetings/013-20211207.md rename to archived_sigs/dx/meetings/013-20211207.md diff --git "a/sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" "b/archived_sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" similarity index 100% rename from "sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" rename to "archived_sigs/dx/meetings/2021-08-10 \347\244\276\345\214\272\345\217\214\345\221\250\344\276\213\344\274\232.pptx" diff --git a/sigs/dx/paper/README.md b/archived_sigs/dx/paper/README.md similarity index 100% rename from sigs/dx/paper/README.md rename to archived_sigs/dx/paper/README.md diff --git a/sigs/executor/README.md b/archived_sigs/executor/README.md similarity index 100% rename from sigs/executor/README.md rename to archived_sigs/executor/README.md diff --git a/sigs/executor/README_en.md b/archived_sigs/executor/README_en.md similarity index 100% rename from sigs/executor/README_en.md rename to archived_sigs/executor/README_en.md diff --git a/sigs/executor/docs/design-template.md b/archived_sigs/executor/docs/design-template.md similarity index 100% rename from sigs/executor/docs/design-template.md rename to archived_sigs/executor/docs/design-template.md diff --git a/sigs/executor/meetings/001-20200604.md b/archived_sigs/executor/meetings/001-20200604.md similarity index 100% rename from sigs/executor/meetings/001-20200604.md rename to archived_sigs/executor/meetings/001-20200604.md diff --git a/sigs/executor/meetings/001-20210805.md b/archived_sigs/executor/meetings/001-20210805.md similarity index 96% rename from sigs/executor/meetings/001-20210805.md rename to archived_sigs/executor/meetings/001-20210805.md index 30caf70..7c4625a 100644 --- a/sigs/executor/meetings/001-20210805.md +++ b/archived_sigs/executor/meetings/001-20210805.md @@ -1,35 +1,35 @@ -# Thursday August 5, 2021 at 17:00pm GMT+8 - -## Agenda - -- Introduce the current Ascend memory allocation strategy, that is, allocate memory at compile stage. The input and output memory of the graph cannot be reused, which limits the scale of the model under given devices. -- Discuss several feasible ways to reuse input and output memory of graph when allocating memory in the graph running stage, and potential performance problems. -- Overview of the memory swap strategy under runtime memory allocation and the memory benefits it brings. - -## Conference links - -- Meeting Time: - - 2021-08-05 19:00-21:00 ((UTC+08:00)Beijing) - -- Meeting Link: - - https://welink.zhumu.com/j/209111783 - -## Attendees - -- Wang Kaisheng (Huawei) -- Jiang Jianfei (Huawei) -- Chu Jinjin (Huawei) -- Lai Yongqiang (Huawei) -- Bai Huawei (Huawei) - -## Notes - -- The meeting video can be found: - - [Executor & Serving SIG Meeting 2021](https://www.bilibili.com/video/BV1PX4y1F7i1) - -## Action items - -- None. +# Thursday August 5, 2021 at 17:00pm GMT+8 + +## Agenda + +- Introduce the current Ascend memory allocation strategy, that is, allocate memory at compile stage. The input and output memory of the graph cannot be reused, which limits the scale of the model under given devices. +- Discuss several feasible ways to reuse input and output memory of graph when allocating memory in the graph running stage, and potential performance problems. +- Overview of the memory swap strategy under runtime memory allocation and the memory benefits it brings. + +## Conference links + +- Meeting Time: + + 2021-08-05 19:00-21:00 ((UTC+08:00)Beijing) + +- Meeting Link: + + https://welink.zhumu.com/j/209111783 + +## Attendees + +- Wang Kaisheng (Huawei) +- Jiang Jianfei (Huawei) +- Chu Jinjin (Huawei) +- Lai Yongqiang (Huawei) +- Bai Huawei (Huawei) + +## Notes + +- The meeting video can be found: + + [Executor & Serving SIG Meeting 2021](https://www.bilibili.com/video/BV1PX4y1F7i1) + +## Action items + +- None. diff --git a/sigs/executor/meetings/meeting-template.md b/archived_sigs/executor/meetings/meeting-template.md similarity index 100% rename from sigs/executor/meetings/meeting-template.md rename to archived_sigs/executor/meetings/meeting-template.md diff --git a/sigs/frontend/README.md b/archived_sigs/frontend/README.md similarity index 100% rename from sigs/frontend/README.md rename to archived_sigs/frontend/README.md diff --git a/sigs/frontend/README_en.md b/archived_sigs/frontend/README_en.md similarity index 100% rename from sigs/frontend/README_en.md rename to archived_sigs/frontend/README_en.md diff --git a/sigs/frontend/docs/design-template.md b/archived_sigs/frontend/docs/design-template.md similarity index 100% rename from sigs/frontend/docs/design-template.md rename to archived_sigs/frontend/docs/design-template.md diff --git a/sigs/frontend/meetings/001-20200516.md b/archived_sigs/frontend/meetings/001-20200516.md similarity index 100% rename from sigs/frontend/meetings/001-20200516.md rename to archived_sigs/frontend/meetings/001-20200516.md diff --git a/sigs/frontend/meetings/002-20200605.md b/archived_sigs/frontend/meetings/002-20200605.md similarity index 100% rename from sigs/frontend/meetings/002-20200605.md rename to archived_sigs/frontend/meetings/002-20200605.md diff --git a/sigs/frontend/meetings/003-20200703.md b/archived_sigs/frontend/meetings/003-20200703.md similarity index 100% rename from sigs/frontend/meetings/003-20200703.md rename to archived_sigs/frontend/meetings/003-20200703.md diff --git a/sigs/frontend/meetings/004-20210426.md b/archived_sigs/frontend/meetings/004-20210426.md similarity index 100% rename from sigs/frontend/meetings/004-20210426.md rename to archived_sigs/frontend/meetings/004-20210426.md diff --git a/sigs/frontend/meetings/meeting-template.md b/archived_sigs/frontend/meetings/meeting-template.md similarity index 100% rename from sigs/frontend/meetings/meeting-template.md rename to archived_sigs/frontend/meetings/meeting-template.md diff --git a/sigs/graphengine/README.md b/archived_sigs/graphengine/README.md similarity index 100% rename from sigs/graphengine/README.md rename to archived_sigs/graphengine/README.md diff --git a/sigs/graphengine/docs/design-template.md b/archived_sigs/graphengine/docs/design-template.md similarity index 100% rename from sigs/graphengine/docs/design-template.md rename to archived_sigs/graphengine/docs/design-template.md diff --git a/sigs/graphengine/meetings/001-20200515.md b/archived_sigs/graphengine/meetings/001-20200515.md similarity index 100% rename from sigs/graphengine/meetings/001-20200515.md rename to archived_sigs/graphengine/meetings/001-20200515.md diff --git a/sigs/graphengine/meetings/002-20200731.md b/archived_sigs/graphengine/meetings/002-20200731.md similarity index 100% rename from sigs/graphengine/meetings/002-20200731.md rename to archived_sigs/graphengine/meetings/002-20200731.md diff --git a/sigs/graphlearning/README.en.md b/archived_sigs/graphlearning/README.en.md similarity index 100% rename from sigs/graphlearning/README.en.md rename to archived_sigs/graphlearning/README.en.md diff --git a/sigs/graphlearning/README.md b/archived_sigs/graphlearning/README.md similarity index 100% rename from sigs/graphlearning/README.md rename to archived_sigs/graphlearning/README.md diff --git a/sigs/graphlearning/sig-info.yaml b/archived_sigs/graphlearning/sig-info.yaml similarity index 96% rename from sigs/graphlearning/sig-info.yaml rename to archived_sigs/graphlearning/sig-info.yaml index cd1edbb..999fb97 100644 --- a/sigs/graphlearning/sig-info.yaml +++ b/archived_sigs/graphlearning/sig-info.yaml @@ -1,32 +1,32 @@ -name: graphlearning -description: Focus on the latest technologies and applications in the direction of graph computing and graph learning, explore more expressive graph learning models, build a graph learning framework that is simple to use and computationally efficient, and apply graph learning methods to actual scenarios to achieve better results. -created_on: '2019-12-31' -mailing_list: NA -meeting_url: Na -mature_level: startup -mentors: -- gitee_id: sophie - name: Luo Lan - organization: Huawei - email: luolan13@huawei.com -maintainers: -- gitee_id: sophie - name: Luo Lan - organization: Huawei - email: luolan13@huawei.com -- gitee_id: fengxun - name: Feng Xun - organization: Huawei - email: fengxun5@huawei.com -repositories: -- repo: - - MindSpore/graphlearning - committers: - - gitee_id: sophie - name: Luo Lan - organization: Huawei - email: luolan13@huawei.com - - gitee_id: fengxun - name: Feng Xun - organization: Huawei - email: fengxun5@huawei.com +name: graphlearning +description: Focus on the latest technologies and applications in the direction of graph computing and graph learning, explore more expressive graph learning models, build a graph learning framework that is simple to use and computationally efficient, and apply graph learning methods to actual scenarios to achieve better results. +created_on: '2019-12-31' +mailing_list: NA +meeting_url: Na +mature_level: startup +mentors: +- gitee_id: sophie + name: Luo Lan + organization: Huawei + email: luolan13@huawei.com +maintainers: +- gitee_id: sophie + name: Luo Lan + organization: Huawei + email: luolan13@huawei.com +- gitee_id: fengxun + name: Feng Xun + organization: Huawei + email: fengxun5@huawei.com +repositories: +- repo: + - MindSpore/graphlearning + committers: + - gitee_id: sophie + name: Luo Lan + organization: Huawei + email: luolan13@huawei.com + - gitee_id: fengxun + name: Feng Xun + organization: Huawei + email: fengxun5@huawei.com diff --git a/sigs/heterogeneous_fusion/README.md b/archived_sigs/heterogeneous_fusion/README.md similarity index 100% rename from sigs/heterogeneous_fusion/README.md rename to archived_sigs/heterogeneous_fusion/README.md diff --git a/sigs/heterogeneous_fusion/sig-info.yaml b/archived_sigs/heterogeneous_fusion/sig-info.yaml similarity index 100% rename from sigs/heterogeneous_fusion/sig-info.yaml rename to archived_sigs/heterogeneous_fusion/sig-info.yaml diff --git a/sigs/mdp/README.md b/archived_sigs/mdp/README.md similarity index 98% rename from sigs/mdp/README.md rename to archived_sigs/mdp/README.md index 0a86ea0..a728a06 100644 --- a/sigs/mdp/README.md +++ b/archived_sigs/mdp/README.md @@ -1,20 +1,20 @@ -# MindSpore MDP Special Interest Group (SIG) -This is the working repo for the MDP Special Interest Group (SIG). MindSpore Deep Probabilistic Programming (MDP) is a programming library for Bayesian deep learning. The target of MDP is to intergrade the gap between deep learning and Bayesian learning. This repo contains all the artifacts, materials, meeting notes and proposals regarding **Probabilistic Programming** , **Deep Probabilistic Programming** , **Toolbox** . Feedbacks and contributions are welcomed. - -1. Probabilistic Programming: Probabilistic Programming (PP) focuses on professional Bayesian learning, including statistical distributions classes used to generate stochastic tensors and probabilistic inference algorithms. -2. Deep Probabilistic Programming: Deep Probabilistic Programming (DPP) aims to provide composable BNN modules, which contains bnn layers, bnn modules, transforms and context. -3. Toolbox: Toolbox provides a set of BNN tools for some specific applications, such as Uncertainty Estimation, OoD Detection and so on. - -## SIG Leads -Chen Jianfei (Tsinghua University) - -## Logistics -- SIG leads will drive the meeting. -- Meeting announcement will be posted on our gitee channel: https://gitee.com/mindspore/community/tree/master/sigs/mdp -- Feedbacks and topic requests are welcomed by all. - -## Discussion -- Slack channel: https://app.slack.com/client/T018BLCMSGL/learning-slack -- Documents and artifacts: https://gitee.com/mindspore/community/tree/master/sigs/mdp - -## Meeting notes +# MindSpore MDP Special Interest Group (SIG) +This is the working repo for the MDP Special Interest Group (SIG). MindSpore Deep Probabilistic Programming (MDP) is a programming library for Bayesian deep learning. The target of MDP is to intergrade the gap between deep learning and Bayesian learning. This repo contains all the artifacts, materials, meeting notes and proposals regarding **Probabilistic Programming** , **Deep Probabilistic Programming** , **Toolbox** . Feedbacks and contributions are welcomed. + +1. Probabilistic Programming: Probabilistic Programming (PP) focuses on professional Bayesian learning, including statistical distributions classes used to generate stochastic tensors and probabilistic inference algorithms. +2. Deep Probabilistic Programming: Deep Probabilistic Programming (DPP) aims to provide composable BNN modules, which contains bnn layers, bnn modules, transforms and context. +3. Toolbox: Toolbox provides a set of BNN tools for some specific applications, such as Uncertainty Estimation, OoD Detection and so on. + +## SIG Leads +Chen Jianfei (Tsinghua University) + +## Logistics +- SIG leads will drive the meeting. +- Meeting announcement will be posted on our gitee channel: https://gitee.com/mindspore/community/tree/master/sigs/mdp +- Feedbacks and topic requests are welcomed by all. + +## Discussion +- Slack channel: https://app.slack.com/client/T018BLCMSGL/learning-slack +- Documents and artifacts: https://gitee.com/mindspore/community/tree/master/sigs/mdp + +## Meeting notes diff --git a/sigs/mdp/docs/design-template.md b/archived_sigs/mdp/docs/design-template.md similarity index 100% rename from sigs/mdp/docs/design-template.md rename to archived_sigs/mdp/docs/design-template.md diff --git a/sigs/mdp/meetings/001-20210525.md b/archived_sigs/mdp/meetings/001-20210525.md similarity index 100% rename from sigs/mdp/meetings/001-20210525.md rename to archived_sigs/mdp/meetings/001-20210525.md diff --git a/sigs/mdp/meetings/meeting-template.md b/archived_sigs/mdp/meetings/meeting-template.md similarity index 100% rename from sigs/mdp/meetings/meeting-template.md rename to archived_sigs/mdp/meetings/meeting-template.md diff --git a/sigs/mdp/roadmap_2021.md b/archived_sigs/mdp/roadmap_2021.md similarity index 95% rename from sigs/mdp/roadmap_2021.md rename to archived_sigs/mdp/roadmap_2021.md index 3917072..eb6355a 100644 --- a/sigs/mdp/roadmap_2021.md +++ b/archived_sigs/mdp/roadmap_2021.md @@ -1,100 +1,100 @@ -Technical Roadmap for 2021 -==== - -Probabilistic Programming Layer ----- - -Distribution: - -- [D1] add support to multivariate continous distributions -- [D1.1] MultivariateNormal -- [D1.2] GumbelSoftmax -- [D1.3] Dirichlet - -Expected time: Q3 - -Modeling Language: - -- [M1] Based on the new support of MindSpore, extend the BayesianNet modeling capacity to general -- [M1.1] Implement with dictionaies -- [M1.2] Integrate StochasticTensor with Distribution - -Expected time: Q1 - -- [M2] Hybrid BayesianNet + Bijector modeling language -- [M2.1] Implement a bijector API, and integrate it with the existing bijector in distributions -- [M2.2] Implement affine coupling layer -- [M2.3] Reimplement the existing Glow / VFlow in the test folder with the new API - -Depends on: M1 -Expected time: Q4 - -Inference algorithm: - -- [I1] Support common black-box algorithms -- [I1.1] Importance sampling -- [I1.2] SGLD -- [I1.3] Reinforce -- [I1.4] HMC - -Depends on: M1 -Expected time: [I1.1]:Q1, [I1.2]:Q2, [I1.3]:Q3, [I1.4]:Q4 - -Model and Toolbox Layer ----- - -- [T1] Reimplement existing model and toolbox with the probabilistic programming layer -- [T1.1] Reimplement VAE -- [T1.2] Reimplement BNN -- [T1.3] Reimplement Uncertainty Estimation -- [T1.4] Reimplement Anormaly Detection - -Depends on: M1 -Expected time: Q2 - -- [T2] Implement more SOTA algorithms of toolbox -- [T2.1] BNN with SGLD for uncertainty estimation - Depends on: M1, I1.2 - Expected time: Q2 -- [T2.2] SWAG for uncertainty estimation - Depends on: D1.1, M1 - Expected time: Q3 - -(Optional) Test uncertainty estimation on language modeling - -Appliation ----- - -- [A1] Apply our tools to representative applications - -Depends on: T2 -Expected time: Q4 - -Miscellanous ----- - -Keep interacting with MindSpore to improve the coding style. - -Expected Goal ----- - -Q1: - -- A general BayesianNet framework, that supports modeling of arbitary Bayesian networks - -Q2: - -- Support representative inference algorithms in the general format -- Rewrite applications and examples with the new interface - -Q3: - -- Implement more distributions, inference algorithms -- Implement some SOTA algorithms for uncertainty estimation -- Should have a comparable version of TF ZhuSuan now - -Q4: - -- Modeling tools for flow bases -- Tentative applications of uncertainty estimation - +Technical Roadmap for 2021 +==== + +Probabilistic Programming Layer +---- + +Distribution: + +- [D1] add support to multivariate continous distributions +- [D1.1] MultivariateNormal +- [D1.2] GumbelSoftmax +- [D1.3] Dirichlet + +Expected time: Q3 + +Modeling Language: + +- [M1] Based on the new support of MindSpore, extend the BayesianNet modeling capacity to general +- [M1.1] Implement with dictionaies +- [M1.2] Integrate StochasticTensor with Distribution + +Expected time: Q1 + +- [M2] Hybrid BayesianNet + Bijector modeling language +- [M2.1] Implement a bijector API, and integrate it with the existing bijector in distributions +- [M2.2] Implement affine coupling layer +- [M2.3] Reimplement the existing Glow / VFlow in the test folder with the new API + +Depends on: M1 +Expected time: Q4 + +Inference algorithm: + +- [I1] Support common black-box algorithms +- [I1.1] Importance sampling +- [I1.2] SGLD +- [I1.3] Reinforce +- [I1.4] HMC + +Depends on: M1 +Expected time: [I1.1]:Q1, [I1.2]:Q2, [I1.3]:Q3, [I1.4]:Q4 + +Model and Toolbox Layer +---- + +- [T1] Reimplement existing model and toolbox with the probabilistic programming layer +- [T1.1] Reimplement VAE +- [T1.2] Reimplement BNN +- [T1.3] Reimplement Uncertainty Estimation +- [T1.4] Reimplement Anormaly Detection + +Depends on: M1 +Expected time: Q2 + +- [T2] Implement more SOTA algorithms of toolbox +- [T2.1] BNN with SGLD for uncertainty estimation + Depends on: M1, I1.2 + Expected time: Q2 +- [T2.2] SWAG for uncertainty estimation + Depends on: D1.1, M1 + Expected time: Q3 + +(Optional) Test uncertainty estimation on language modeling + +Appliation +---- + +- [A1] Apply our tools to representative applications + +Depends on: T2 +Expected time: Q4 + +Miscellanous +---- + +Keep interacting with MindSpore to improve the coding style. + +Expected Goal +---- + +Q1: + +- A general BayesianNet framework, that supports modeling of arbitary Bayesian networks + +Q2: + +- Support representative inference algorithms in the general format +- Rewrite applications and examples with the new interface + +Q3: + +- Implement more distributions, inference algorithms +- Implement some SOTA algorithms for uncertainty estimation +- Should have a comparable version of TF ZhuSuan now + +Q4: + +- Modeling tools for flow bases +- Tentative applications of uncertainty estimation + diff --git a/sigs/mindelec/README.md b/archived_sigs/mindelec/README.md similarity index 100% rename from sigs/mindelec/README.md rename to archived_sigs/mindelec/README.md diff --git a/sigs/mindelec/README_en.md b/archived_sigs/mindelec/README_en.md similarity index 100% rename from sigs/mindelec/README_en.md rename to archived_sigs/mindelec/README_en.md diff --git a/sigs/mindelec/sig-info.yaml b/archived_sigs/mindelec/sig-info.yaml similarity index 100% rename from sigs/mindelec/sig-info.yaml rename to archived_sigs/mindelec/sig-info.yaml diff --git a/sigs/mindflow/README.en.md b/archived_sigs/mindflow/README.en.md similarity index 100% rename from sigs/mindflow/README.en.md rename to archived_sigs/mindflow/README.en.md diff --git a/sigs/mindflow/README.md b/archived_sigs/mindflow/README.md similarity index 100% rename from sigs/mindflow/README.md rename to archived_sigs/mindflow/README.md diff --git a/sigs/mindflow/images/mindflow_archi.png b/archived_sigs/mindflow/images/mindflow_archi.png similarity index 100% rename from sigs/mindflow/images/mindflow_archi.png rename to archived_sigs/mindflow/images/mindflow_archi.png diff --git a/sigs/mindflow/images/mindflow_archi_CN.png b/archived_sigs/mindflow/images/mindflow_archi_CN.png similarity index 100% rename from sigs/mindflow/images/mindflow_archi_CN.png rename to archived_sigs/mindflow/images/mindflow_archi_CN.png diff --git "a/sigs/mindflow/images/\345\255\231\346\265\251.jpeg" "b/archived_sigs/mindflow/images/\345\255\231\346\265\251.jpeg" similarity index 100% rename from "sigs/mindflow/images/\345\255\231\346\265\251.jpeg" rename to "archived_sigs/mindflow/images/\345\255\231\346\265\251.jpeg" diff --git "a/sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" "b/archived_sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" similarity index 100% rename from "sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" rename to "archived_sigs/mindflow/images/\345\274\240\344\274\237\344\274\237.jpeg" diff --git "a/sigs/mindflow/images/\350\221\243\345\275\254.jpeg" "b/archived_sigs/mindflow/images/\350\221\243\345\275\254.jpeg" similarity index 100% rename from "sigs/mindflow/images/\350\221\243\345\275\254.jpeg" rename to "archived_sigs/mindflow/images/\350\221\243\345\275\254.jpeg" diff --git a/sigs/mindquantfinance/README.en.md b/archived_sigs/mindquantfinance/README.en.md similarity index 100% rename from sigs/mindquantfinance/README.en.md rename to archived_sigs/mindquantfinance/README.en.md diff --git a/sigs/mindquantfinance/README.md b/archived_sigs/mindquantfinance/README.md similarity index 100% rename from sigs/mindquantfinance/README.md rename to archived_sigs/mindquantfinance/README.md diff --git a/sigs/mindspore_reinforcement/README.en.md b/archived_sigs/mindspore_reinforcement/README.en.md similarity index 100% rename from sigs/mindspore_reinforcement/README.en.md rename to archived_sigs/mindspore_reinforcement/README.en.md diff --git a/sigs/mindspore_reinforcement/README.md b/archived_sigs/mindspore_reinforcement/README.md similarity index 100% rename from sigs/mindspore_reinforcement/README.md rename to archived_sigs/mindspore_reinforcement/README.md diff --git a/sigs/mindspore_reinforcement/images/mindspore_rl_architecture.png b/archived_sigs/mindspore_reinforcement/images/mindspore_rl_architecture.png similarity index 100% rename from sigs/mindspore_reinforcement/images/mindspore_rl_architecture.png rename to archived_sigs/mindspore_reinforcement/images/mindspore_rl_architecture.png diff --git a/sigs/mindspore_sponge/README.md b/archived_sigs/mindspore_sponge/README.md similarity index 98% rename from sigs/mindspore_sponge/README.md rename to archived_sigs/mindspore_sponge/README.md index ee45824..3508c9f 100644 --- a/sigs/mindspore_sponge/README.md +++ b/archived_sigs/mindspore_sponge/README.md @@ -1,129 +1,129 @@ -## SIG 简介 - -MindSPONGE是基于昇思MindSpore面向计算生物领域的套件,涵盖药物研发全流程。MindSPONGE中包含白质结构预测工具MEGA-Protein,分子动力学模拟等多种常用功能。 - -### MEGA-Protein - -MEGA-Protein包含MSA生成(MEGA-EvoGen)、蛋白质折叠训练推理流程(MEGA-Fold)、蛋白质结构打分(MEGA-Assessment)、蛋白质结构预测数据集PSP等关键技术,该工具提供了高精度高性能蛋白质结构和功能预测。 - -#### MEGA-EvoGen - -MEGA-EvoGen能够在MSA较少(few shot)甚至没有MSA(zero-shot,即单序列)的情况下,帮助MEGA-Fold/AlphaFold2等模型维持甚至提高推理精度,突破了在“孤儿序列”、高异变序列和人造蛋白等MSA匮乏场景下无法做出准确预测的限制,该方法获得了CAMEO-3D蛋白质结构预测赛道月榜第一。 - -#### MEGA-Fold - -MEGA-Fold网络模型部分与AlphaFold2相同,在数据预处理的多序列对比环节采用了MMseqs2进行序列检索,相比于原版端到端速度提升2-3倍;同时借助内存复用大幅提升内存利用效率,同硬件条件下支持更长序列的推理。其中在Ascend 910 32G硬件下支持3072推理长度。 - -#### MEGA-Assessment - -MEGA-Assessment可以评价蛋白质结构每个残基的准确性以及残基-残基之间的距离误差,从而达到跨模型挑选蛋白质结构,并且在CAMEO-QE结构质量评估赛道取得月榜第一, 同时可以基于评价结果对蛋白结构作出进一步的优化。 - -### 基于AI框架昇思MindSpore的MD模拟软件 - -分子动力学模拟软件是一种根据分子力场所描述的势能函数模拟分子的微观运动,从而计算分子体系的物理和化学性质的科学计算工具,在化学、生物、物理、制药、材料、环境等领域有着广泛的应用。基于AI框架昇思MindSpore的MD模拟软件具备自动微分,支持不同硬件,端到端可微等优点。 - -#### 自动微分 - -昇思MindSpore的“自动微分”功能,可以直接计算函数的导数,因此基于MindSpore编写分子力场只需编写势能函数的代码即可,原子受力即原子坐标对势能函数的负梯度可以直接通过“自动微分”计算,在很大程度上简化了MD模拟程序结构的复杂度。 - -#### 支持不同硬件 - -昇思MindSpore能在CPU、GPU和华为自主研发的“昇腾”(Ascend)AI加速芯片上运行,程序只需修改一行代码便可移植到不同的硬件设备上。此外,华为昇思MindSpore还具备“自动并行”的能力,只需简单修改代码就能自动实现程序的并行化计算。 - -#### 端到端可微 - -昇思MindSpore具备“高阶自动微分”的能力,可以自动求解函数的高阶导数。因此可以像运行AI优化算法那样,直接对MD模拟过程本身进行优化,从而获得理想的结果。这即是一种“元优化”(meta-optimization)过程。 - -## SIG 代码仓 - -1. [MindSPONGE 代码仓](https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE) -2. [MindSpore SPONGE SIG工作目录](https://gitee.com/mindspore/community/tree/master/sigs/mindspore_sponge) - -## CO-CHAIRS - -* 杨奕 (深圳湾实验室副研究员,MindSPONGE社区核心贡献者) -* 张骏 (昌平实验室研究员,MindSPONGE社区核心贡献者) -* 刘思睿 (昌平实验室研究员,MindSPONGE社区核心贡献者) - -## Maintainers - -* Yahao Ding (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Mengyun Chen (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Ningxi Ni (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* 夏义杰 (MindSPONGE社区核心贡献者) -* 陈迪青 (MindSPONGE社区核心贡献者) -* 黄渝鹏 (MindSPONGE社区核心贡献者) -* Haotian Chu (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Junbin Li (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Chenghao Wang (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Min Wang (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) -* Jialiang Yu (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) - -## 成果积累 - -* 蛋白质结构预测工具MEGA-Fold获得CAMEO-3D蛋白质结构预测赛道2022年4月月榜第一。 - -* MSA生成工具MEGA-EvoGen获得CAMEO-3D蛋白质结构预测赛道2022年7月月榜第一。 - -* 蛋白质结构评分工具MEGA-Assessment获得了CAMEO-QE结构质量评估赛道2022年7月月榜第一。 - -* 2022.8.11—2022.8.15举办了MindSPONGE SIG暑期学校活动,邀请到13位专家老师进行一场为期五天的授课,授课主题主要包括MindSpore基础,分子动力学以及AI × Science进阶课程三大主题 - -## 主要活动 - -### 1, 暑期学校活动 - -时间:每年暑假 - -主要内容:大型授课活动,MindSpore使用教学, MindSPONGE案例讲解,论文分享,前沿技术讲解 - -主讲人:SIG组内核心专家老师,业界专家教授 - -组织者:Maintainers - -### 2, 校园行活动 - -时间:不定期,一季度一次 - -主要内容:MindSPONGE介绍,MindSPONGE案例讲解 - -分享人:SIG成员、业界专家教授 - -参与者:Members,高校学生等 - -组织者:Maintainers - -### 3,开发任务发放 - -① [开源实习任务](https://gitee.com/mindspore/community/issues/I561LI?from=project-issue) - -② [社区普通任务]()(暂无) - -时间:每季度一次 - -负责人:Maintainers、Committers - -### 4,内部分享会 - -时间:每月一次 - -主要内容:Members交流已调研论文或正在开发内容 - -负责人:Maintainers、Committers轮流组织,或Members主动提出申请。 - -### 5,晋升选拔 - -时间:每半年一次 - -内容:选拔Committers、Maintainers。 - -负责人:Maintainers - -## 近期活动与例会预告 - -1. 即将公布12月初校园行活动预告 -2. SIG组例会 - -## 往期活动 - -1. 2022.8.11—2022.8.15, MindSPONGE SIG[暑期学校活动](https://www.bilibili.com/video/BV1pB4y167yS/?spm_id_from=333.999.0.0&vd_source=94e532d8ff646603295d235e65ef1453)。 +## SIG 简介 + +MindSPONGE是基于昇思MindSpore面向计算生物领域的套件,涵盖药物研发全流程。MindSPONGE中包含白质结构预测工具MEGA-Protein,分子动力学模拟等多种常用功能。 + +### MEGA-Protein + +MEGA-Protein包含MSA生成(MEGA-EvoGen)、蛋白质折叠训练推理流程(MEGA-Fold)、蛋白质结构打分(MEGA-Assessment)、蛋白质结构预测数据集PSP等关键技术,该工具提供了高精度高性能蛋白质结构和功能预测。 + +#### MEGA-EvoGen + +MEGA-EvoGen能够在MSA较少(few shot)甚至没有MSA(zero-shot,即单序列)的情况下,帮助MEGA-Fold/AlphaFold2等模型维持甚至提高推理精度,突破了在“孤儿序列”、高异变序列和人造蛋白等MSA匮乏场景下无法做出准确预测的限制,该方法获得了CAMEO-3D蛋白质结构预测赛道月榜第一。 + +#### MEGA-Fold + +MEGA-Fold网络模型部分与AlphaFold2相同,在数据预处理的多序列对比环节采用了MMseqs2进行序列检索,相比于原版端到端速度提升2-3倍;同时借助内存复用大幅提升内存利用效率,同硬件条件下支持更长序列的推理。其中在Ascend 910 32G硬件下支持3072推理长度。 + +#### MEGA-Assessment + +MEGA-Assessment可以评价蛋白质结构每个残基的准确性以及残基-残基之间的距离误差,从而达到跨模型挑选蛋白质结构,并且在CAMEO-QE结构质量评估赛道取得月榜第一, 同时可以基于评价结果对蛋白结构作出进一步的优化。 + +### 基于AI框架昇思MindSpore的MD模拟软件 + +分子动力学模拟软件是一种根据分子力场所描述的势能函数模拟分子的微观运动,从而计算分子体系的物理和化学性质的科学计算工具,在化学、生物、物理、制药、材料、环境等领域有着广泛的应用。基于AI框架昇思MindSpore的MD模拟软件具备自动微分,支持不同硬件,端到端可微等优点。 + +#### 自动微分 + +昇思MindSpore的“自动微分”功能,可以直接计算函数的导数,因此基于MindSpore编写分子力场只需编写势能函数的代码即可,原子受力即原子坐标对势能函数的负梯度可以直接通过“自动微分”计算,在很大程度上简化了MD模拟程序结构的复杂度。 + +#### 支持不同硬件 + +昇思MindSpore能在CPU、GPU和华为自主研发的“昇腾”(Ascend)AI加速芯片上运行,程序只需修改一行代码便可移植到不同的硬件设备上。此外,华为昇思MindSpore还具备“自动并行”的能力,只需简单修改代码就能自动实现程序的并行化计算。 + +#### 端到端可微 + +昇思MindSpore具备“高阶自动微分”的能力,可以自动求解函数的高阶导数。因此可以像运行AI优化算法那样,直接对MD模拟过程本身进行优化,从而获得理想的结果。这即是一种“元优化”(meta-optimization)过程。 + +## SIG 代码仓 + +1. [MindSPONGE 代码仓](https://gitee.com/mindspore/mindscience/tree/master/MindSPONGE) +2. [MindSpore SPONGE SIG工作目录](https://gitee.com/mindspore/community/tree/master/sigs/mindspore_sponge) + +## CO-CHAIRS + +* 杨奕 (深圳湾实验室副研究员,MindSPONGE社区核心贡献者) +* 张骏 (昌平实验室研究员,MindSPONGE社区核心贡献者) +* 刘思睿 (昌平实验室研究员,MindSPONGE社区核心贡献者) + +## Maintainers + +* Yahao Ding (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Mengyun Chen (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Ningxi Ni (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* 夏义杰 (MindSPONGE社区核心贡献者) +* 陈迪青 (MindSPONGE社区核心贡献者) +* 黄渝鹏 (MindSPONGE社区核心贡献者) +* Haotian Chu (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Junbin Li (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Chenghao Wang (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Min Wang (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) +* Jialiang Yu (MindSPONGE社区资深开发者,负责MindSPONGE生态推广、特性开发和需求收集等) + +## 成果积累 + +* 蛋白质结构预测工具MEGA-Fold获得CAMEO-3D蛋白质结构预测赛道2022年4月月榜第一。 + +* MSA生成工具MEGA-EvoGen获得CAMEO-3D蛋白质结构预测赛道2022年7月月榜第一。 + +* 蛋白质结构评分工具MEGA-Assessment获得了CAMEO-QE结构质量评估赛道2022年7月月榜第一。 + +* 2022.8.11—2022.8.15举办了MindSPONGE SIG暑期学校活动,邀请到13位专家老师进行一场为期五天的授课,授课主题主要包括MindSpore基础,分子动力学以及AI × Science进阶课程三大主题 + +## 主要活动 + +### 1, 暑期学校活动 + +时间:每年暑假 + +主要内容:大型授课活动,MindSpore使用教学, MindSPONGE案例讲解,论文分享,前沿技术讲解 + +主讲人:SIG组内核心专家老师,业界专家教授 + +组织者:Maintainers + +### 2, 校园行活动 + +时间:不定期,一季度一次 + +主要内容:MindSPONGE介绍,MindSPONGE案例讲解 + +分享人:SIG成员、业界专家教授 + +参与者:Members,高校学生等 + +组织者:Maintainers + +### 3,开发任务发放 + +① [开源实习任务](https://gitee.com/mindspore/community/issues/I561LI?from=project-issue) + +② [社区普通任务]()(暂无) + +时间:每季度一次 + +负责人:Maintainers、Committers + +### 4,内部分享会 + +时间:每月一次 + +主要内容:Members交流已调研论文或正在开发内容 + +负责人:Maintainers、Committers轮流组织,或Members主动提出申请。 + +### 5,晋升选拔 + +时间:每半年一次 + +内容:选拔Committers、Maintainers。 + +负责人:Maintainers + +## 近期活动与例会预告 + +1. 即将公布12月初校园行活动预告 +2. SIG组例会 + +## 往期活动 + +1. 2022.8.11—2022.8.15, MindSPONGE SIG[暑期学校活动](https://www.bilibili.com/video/BV1pB4y167yS/?spm_id_from=333.999.0.0&vd_source=94e532d8ff646603295d235e65ef1453)。 diff --git a/sigs/mindspore_sponge/sig-info.yaml b/archived_sigs/mindspore_sponge/sig-info.yaml similarity index 100% rename from sigs/mindspore_sponge/sig-info.yaml rename to archived_sigs/mindspore_sponge/sig-info.yaml diff --git a/sigs/modelzoo/README.md b/archived_sigs/modelzoo/README.md similarity index 100% rename from sigs/modelzoo/README.md rename to archived_sigs/modelzoo/README.md diff --git a/sigs/modelzoo/README_en.md b/archived_sigs/modelzoo/README_en.md similarity index 100% rename from sigs/modelzoo/README_en.md rename to archived_sigs/modelzoo/README_en.md diff --git a/sigs/modelzoo/docs/design-template.md b/archived_sigs/modelzoo/docs/design-template.md similarity index 100% rename from sigs/modelzoo/docs/design-template.md rename to archived_sigs/modelzoo/docs/design-template.md diff --git a/sigs/modelzoo/meetings/001-20200516.md b/archived_sigs/modelzoo/meetings/001-20200516.md similarity index 100% rename from sigs/modelzoo/meetings/001-20200516.md rename to archived_sigs/modelzoo/meetings/001-20200516.md diff --git a/sigs/mslite/README.md b/archived_sigs/mslite/README.md similarity index 100% rename from sigs/mslite/README.md rename to archived_sigs/mslite/README.md diff --git a/sigs/mslite/README_en.md b/archived_sigs/mslite/README_en.md similarity index 100% rename from sigs/mslite/README_en.md rename to archived_sigs/mslite/README_en.md diff --git a/sigs/mslite/docs/design-template.md b/archived_sigs/mslite/docs/design-template.md similarity index 100% rename from sigs/mslite/docs/design-template.md rename to archived_sigs/mslite/docs/design-template.md diff --git a/sigs/mslite/meetings/meeting-template.md b/archived_sigs/mslite/meetings/meeting-template.md similarity index 100% rename from sigs/mslite/meetings/meeting-template.md rename to archived_sigs/mslite/meetings/meeting-template.md diff --git a/sigs/mslite/sig-info.yaml b/archived_sigs/mslite/sig-info.yaml similarity index 100% rename from sigs/mslite/sig-info.yaml rename to archived_sigs/mslite/sig-info.yaml diff --git a/sigs/operators/README.md b/archived_sigs/operators/README.md similarity index 100% rename from sigs/operators/README.md rename to archived_sigs/operators/README.md diff --git a/sigs/operators/sig-info.yaml b/archived_sigs/operators/sig-info.yaml similarity index 96% rename from sigs/operators/sig-info.yaml rename to archived_sigs/operators/sig-info.yaml index dc675f7..e5172af 100644 --- a/sigs/operators/sig-info.yaml +++ b/archived_sigs/operators/sig-info.yaml @@ -1,29 +1,29 @@ -name: operators/ -description: This is the working repo for the Operators special interest group (SIG). This repo contains all the artifacts, materials, meeting notes and proposals regarding **ops - operators of computation** in MindSpore. -created_on: '2019-12-31' -mailing_list: NA -meeting_url: NA -mature_level: startup -mentors: -- gitee_id: liangchenghui - name: liangchenghui - organization: Huawei - email: liangchenghui@huawei.com -maintainers: -- gitee_id: liangchenghui - name: liangchenghui - organization: Huawei - email: liangchenghui@huawei.com -repositories: -- repo: - - mindspore/mindspore - committers: - - gitee_id: liangchenghui - name: liangchenghui - organization: Huawei - email: liangchenghui@huawei.com - contributors: - - gitee_id: zong-shuai - name: zongshuai - organization: Huawei +name: operators/ +description: This is the working repo for the Operators special interest group (SIG). This repo contains all the artifacts, materials, meeting notes and proposals regarding **ops - operators of computation** in MindSpore. +created_on: '2019-12-31' +mailing_list: NA +meeting_url: NA +mature_level: startup +mentors: +- gitee_id: liangchenghui + name: liangchenghui + organization: Huawei + email: liangchenghui@huawei.com +maintainers: +- gitee_id: liangchenghui + name: liangchenghui + organization: Huawei + email: liangchenghui@huawei.com +repositories: +- repo: + - mindspore/mindspore + committers: + - gitee_id: liangchenghui + name: liangchenghui + organization: Huawei + email: liangchenghui@huawei.com + contributors: + - gitee_id: zong-shuai + name: zongshuai + organization: Huawei email: zongshuai1@huawei.com \ No newline at end of file diff --git a/sigs/pynative/README.md b/archived_sigs/pynative/README.md similarity index 100% rename from sigs/pynative/README.md rename to archived_sigs/pynative/README.md diff --git a/sigs/pynative/sig-info.yaml b/archived_sigs/pynative/sig-info.yaml similarity index 100% rename from sigs/pynative/sig-info.yaml rename to archived_sigs/pynative/sig-info.yaml diff --git a/sigs/serving/README.md b/archived_sigs/serving/README.md similarity index 100% rename from sigs/serving/README.md rename to archived_sigs/serving/README.md diff --git a/sigs/serving/docs/design-template.md b/archived_sigs/serving/docs/design-template.md similarity index 100% rename from sigs/serving/docs/design-template.md rename to archived_sigs/serving/docs/design-template.md diff --git a/sigs/serving/meetings/001-20210805.md b/archived_sigs/serving/meetings/001-20210805.md similarity index 100% rename from sigs/serving/meetings/001-20210805.md rename to archived_sigs/serving/meetings/001-20210805.md diff --git a/sigs/serving/meetings/meeting-template.md b/archived_sigs/serving/meetings/meeting-template.md similarity index 100% rename from sigs/serving/meetings/meeting-template.md rename to archived_sigs/serving/meetings/meeting-template.md diff --git a/sigs/sig_info.yaml b/archived_sigs/sig_info.yaml similarity index 94% rename from sigs/sig_info.yaml rename to archived_sigs/sig_info.yaml index b9a637a..12a125d 100644 --- a/sigs/sig_info.yaml +++ b/archived_sigs/sig_info.yaml @@ -116,4 +116,12 @@ SIG list: - name: mindspore_reinforcement SIG links: https://gitee.com/mindspore/community/tree/master/sigs/mindspore_reinforcement/README.md introduction: Reinforcement learning - maintainer: Rongpeng Li(School of Information and Electronic Engineering, Zhejiang University) \ No newline at end of file + maintainer: Rongpeng Li(School of Information and Electronic Engineering, Zhejiang University) + - name: pynative SIG + links: https://gitee.com/mindspore/community/tree/master/sigs/pynative/README.md + introduction: pynative model + maintainer: chujinjin(huawei) + - name: heterogeneous_fusion SIG + links: https://gitee.com/mindspore/community/tree/master/sigs/heterogeneous_fusion/README.md + introduction: building open southbound interface, and supportting heterogeneous convergence acceleration capabilities + maintainer: limingqi107(huawei) diff --git a/sigs/sig_info_chinese.yaml b/archived_sigs/sig_info_chinese.yaml similarity index 93% rename from sigs/sig_info_chinese.yaml rename to archived_sigs/sig_info_chinese.yaml index 09109b3..5555245 100644 --- a/sigs/sig_info_chinese.yaml +++ b/archived_sigs/sig_info_chinese.yaml @@ -116,4 +116,12 @@ SIG list: - name: mindspore_reinforcement SIG links: https://gitee.com/mindspore/community/tree/master/sigs/mindspore_reinforcement/README.md introduction: 强化学习 - maintainer: 李荣鹏(浙江大学信息与电子工程学院) \ No newline at end of file + maintainer: 李荣鹏(浙江大学信息与电子工程学院) + - name: pynative SIG + links: https://gitee.com/mindspore/community/tree/master/sigs/pynative/README.md + introduction: MindSpore动态图模式 + maintainer: 褚金锦(华为) + - name: heterogeneous_fusion SIG + links: https://gitee.com/mindspore/community/tree/master/sigs/heterogeneous_fusion/README.md + introduction: 构建MindSpore开放的南向接口,支持异构融合加速能力 + maintainer: 黎明奇(华为) diff --git a/sigs/visualization/README.md b/archived_sigs/visualization/README.md similarity index 100% rename from sigs/visualization/README.md rename to archived_sigs/visualization/README.md diff --git a/sigs/visualization/README_en.md b/archived_sigs/visualization/README_en.md similarity index 100% rename from sigs/visualization/README_en.md rename to archived_sigs/visualization/README_en.md diff --git a/sigs/visualization/docs/design-template.md b/archived_sigs/visualization/docs/design-template.md similarity index 100% rename from sigs/visualization/docs/design-template.md rename to archived_sigs/visualization/docs/design-template.md diff --git a/sigs/visualization/meetings/001-20200515.md b/archived_sigs/visualization/meetings/001-20200515.md similarity index 100% rename from sigs/visualization/meetings/001-20200515.md rename to archived_sigs/visualization/meetings/001-20200515.md diff --git a/sigs/visualization/meetings/002-20200603.md b/archived_sigs/visualization/meetings/002-20200603.md similarity index 100% rename from sigs/visualization/meetings/002-20200603.md rename to archived_sigs/visualization/meetings/002-20200603.md diff --git a/sigs/visualization/meetings/003-20200806.md b/archived_sigs/visualization/meetings/003-20200806.md similarity index 100% rename from sigs/visualization/meetings/003-20200806.md rename to archived_sigs/visualization/meetings/003-20200806.md diff --git a/sigs/visualization/meetings/004-20200903.md b/archived_sigs/visualization/meetings/004-20200903.md similarity index 100% rename from sigs/visualization/meetings/004-20200903.md rename to archived_sigs/visualization/meetings/004-20200903.md diff --git a/sigs/visualization/meetings/005-20210113.md b/archived_sigs/visualization/meetings/005-20210113.md similarity index 100% rename from sigs/visualization/meetings/005-20210113.md rename to archived_sigs/visualization/meetings/005-20210113.md diff --git a/sigs/visualization/meetings/006-20210207.md b/archived_sigs/visualization/meetings/006-20210207.md similarity index 100% rename from sigs/visualization/meetings/006-20210207.md rename to archived_sigs/visualization/meetings/006-20210207.md diff --git a/sigs/visualization/meetings/007-20210416.md b/archived_sigs/visualization/meetings/007-20210416.md similarity index 100% rename from sigs/visualization/meetings/007-20210416.md rename to archived_sigs/visualization/meetings/007-20210416.md diff --git a/sigs/visualization/meetings/008-20210514.md b/archived_sigs/visualization/meetings/008-20210514.md similarity index 100% rename from sigs/visualization/meetings/008-20210514.md rename to archived_sigs/visualization/meetings/008-20210514.md diff --git a/sigs/visualization/meetings/009-20210810.md b/archived_sigs/visualization/meetings/009-20210810.md similarity index 100% rename from sigs/visualization/meetings/009-20210810.md rename to archived_sigs/visualization/meetings/009-20210810.md diff --git a/sigs/README.md b/sigs/README.md index c1dda06..b54bb58 100644 --- a/sigs/README.md +++ b/sigs/README.md @@ -1,60 +1,22 @@ # SIGs - Special Interest Groups -SIG的全称是Special Interest Groups,即“特别兴趣小组”。MindSpore社区成立各技术SIG的初衷是为该领域的专家、教授和学生提供一个开放交流的平台,通过会议分享、项目开发等活动 -促进技术交流、合作共赢,并使得SIG成员的影响力和技术能力得到提升。特别是对于高校的同学们,加入SIG后可以在专家的指导下参与MindSpore的项目开发活动, -掌握业界先进的技术,为将来工作做好准备;也可以和业界专家、教授面对面交流,解决自己在科研中遇到的疑惑,甚至遇到自己的伯乐。截止目前,MindSpore社区 -已经成立十多个SIG,不仅包含MindSpore框架本身的前端、后端技术,还包括AI安全、科学计算等上层算法研究,我们也欢迎有想法的的朋友们创建自己的SIG! - -## 目前的SIG组 - -| SIG name | 技术领域 | SIG 负责人 | -|:-------------------------------------------------------------|:--------------------------|:----------------------------------------------------------------------------------------------------------------| -| [DevelopereXperience](dx/README.md) | MindSpore-Gitee社区的开发者体验提升 | [@jiancao81](https://gitee.com/jiancao81)(cao-jian@cs.sjtu.edu.cn) | -| [Trusted AI](security/README.md) | AI安全和隐私保护技术 | [@randywangze](https://gitee.com/randywangze) | -| [Usability](usability/README.md) | MindSpore框架的易用性提升 | [@zhangtong](https://gitee.com/tong-zhang) | -| [FrontEnd](frontend/README.md) | MindSpore前端表达技术 | [@wangnan](https://gitee.com/wangnan39) | -| [Compiler](compiler/README.md) | MindSpore图编译技术 | [@zh_qh](https://gitee.com/zh_qh) | -| [Executor](executor/README.md) | MindSpore后端控制流技术 | [@kisnwang](https://gitee.com/kisnwang) | -| [ModelZoo](modelzoo/README.md) | AI模型的设计和训练 | [@chenhaozhe](https://gitee.com/c_34) | -| [Data](data/README.md) | 数据处理和增强技术 | [@liucunwei](https://gitee.com/liucunwei) | -| [Visualization](visualization/README.md) | 模型调试调优可视化技术 | [@liangyongxiong](https://gitee.com/liangyongxiong1024) | -| [MSLITE](mslite/README.md) | 端侧AI技术 | [@zhaizhiqiang](https://gitee.com/zhaizhiqiang) | -| [Parallel](parallel/README.md) | 自动并行技术 | [@baiyouhui](https://gitee.com/bert0108) | -| [DataCompliance](datacompliance/README.md) | 数据合规风险分析 | [@gopikrishnanrajbahadur](https://gitee.com/gopikrishnanrajbahadur) [@clement_li](https://gitee.com/clement_li) | -| [MindQuantum](mindquantum/README.md) | 量子计算软件与算法 | [@dorothy20212021](https://gitee.com/dorothy20212021) | -| [CulturalTourism](CulturalTourism/README.md) | AI与文旅行业的融合 | 孙增国(陕西师范大学计算机科学学院) | -| [DeviceAdapter](DeviceAdapter/README.md) | 三方芯片适配MindSpore | [@guoqi1024](https://gitee.com/guoqi1024) | -| [graphlearning](graphlearning/README.md) | 图机器学习 | Fengxun | -| [mdp](mdp/README.md) | 深度概率编程 | Jianfei Chen (清华大学) | -| [MedicalImaging](MedicalImaging/README.md) | 医疗影像辅助诊断 | 张旭明(华中科技大学生命科学与技术学院) | -| [mindelec](mindelec/README.md) | 电磁仿真计算 | 杨卫兵(东南大学科学院) | -| [mindflow](mindflow/README.md) | 流体仿真计算 | hsliu_ustc(Huawei) | -| [mindquantfinance](mindquantfinance/README.md) | 量化金融分析 | 鲁蔚征(中国人民大学) | -| [mindspore_reinforcement](mindspore_reinforcement/README.md) | 强化学习 | 李荣鹏(浙江大学信息与电子工程学院) | -| [mindspore_sponge](mindspore_sponge/README.md) | 生物仿真计算 | Yahao Ding | -| [RobotVision](RobotVision/README.md) | 机器人视觉技术 | 孙斌(湖南大学电气与信息工程学院) | -| [TimeSequence](TimeSequence/README.md) | 时间序列数据预测 | 周号益(北京航空航天大学软件学院) | +SIG 全称是 Special Interest Group,即“特别兴趣小组”。 +MindSpore社区按照不同的 SIG 来组织,以便更好地管理和改善工作流程。 -## 学习资源 - -你可以在MindSpore的哔哩哔哩官方账号观看之前的会议录屏. - - [links](https://space.bilibili.com/526894060/channel/seriesdetail?sid=675044) +## SIGs 的目录存储结构 -## 加入一个SIG +本目录下存放的是 MindSpore 社区中,所有代码仓与特别兴趣 小组 (Special Interest Group, +以下简称 SIG)的运作信息。 -如果你有兴趣加入某个SIG,那么你可以通过以下两种方式加入: +本目录下每一个子目录,代表一个 SIG。 每个 SIG 的目录中,SIG 的 描述、maintainer 和 +管理的代码仓信息都位于 sig-info.yaml 文件中。 -1, 添加MindSpore小助手微信“mindspore0328”,小助手会把你邀请进SIG微信群。 - -2, 关注MindSpore的微信公众号“MindSpore”,我们会把SIG线上会议的信息用公众号推送,参与线上会议后,你就可以通过SIG负责人分享的二维码加入微信群了。 - -## 建议一个新的SIG +## 学习资源 -当你和你的朋友有了非常好的技术idea,并且希望更多的人参与到你们的探索中,那么你就可以申请成立一个新的SIG了,点击下面的链接即可查看申请流程。 +你可以在MindSpore的哔哩哔哩官方账号观看之前的会议录屏. -[申请流程](https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/How%20to%20build%20a%20SIG%20or%20WG_cn.md) + [links](https://space.bilibili.com/526894060/channel/seriesdetail?sid=675044) -## 创建描述SIG的yaml文件 +## NOTE -为了将您创建的SIG在MindSpore官网展示,需要使用该目录下的create_sig_info_template.py创建一个yaml文件来描述SIG的相关信息,yaml文件的格式说明可以[参考这里](https://gitee.com/openeuler/community/blob/master/sig/README.md)。 \ No newline at end of file +历史不再维护SIG将被归档在本代码仓下的[archived_sigs](../archived_sigs)目录下 diff --git a/sigs/README_en.md b/sigs/README_en.md index 6c744fe..387c6d5 100644 --- a/sigs/README_en.md +++ b/sigs/README_en.md @@ -1,69 +1,25 @@ # SIGs - Special Interest Groups -The full name of SIG is "special interest group". We set up various technical sigs in MindSpore community to -provide an open communication platform for experts, professors and students in this field. -We hope that it can promote technical communication and win-win cooperation, and improve the influence and technical -ability of SIG members through meeting sharing, project development and other activities. -Especially for college students, after joining SIGs, they can participate in MindSpore's development activities -under the guidance of experts, in which they can master the advanced technology in the industry and prepare for future -work. They can also communicate face-to-face with industry experts and professors and meet their own Bole. Up to now, -more than ten sigs have been set up in MindSpore community, including not only the front-end and back-end technologies -of MindSpore framework itself, but also the research of upper algorithms such as AI security and scientific computing. -We also welcome friends with ideas to create their own sigs! +The MindSpore community is organized into different SIGs for better +management and workflow improvement. -## Current SIGs +## SIGs Directory Structure -| SIG name | Responsibilities | SIG Leads | -|:-------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------| -| [DevelopereXperience](dx/README.md) | Improving the experience of those who upstream contribute or develop applications for MindSpore community. | [@jiancao81](https://gitee.com/jiancao81)(cao-jian@cs.sjtu.edu.cn) | -| [Trusted AI](security/README.md) | The development of MindSpore security related tools. | [@randywangze](https://gitee.com/randywangze) | -| [Usability](usability/README.md) | Improving the usability of MindSpore for developers. | [@zhangtong](https://gitee.com/tong-zhang) | -| [FrontEnd](frontend/README.md) | The development of MindSpore front-end expression. | [@wangnan](https://gitee.com/wangnan39) | -| [Compiler](compiler/README.md) | The development of MindSpore high level graph compilation. | [@zh_qh](https://gitee.com/zh_qh) | -| [Executor](executor/README.md) | The development of MindSpore back-end support for pipeline. | [@kisnwang](https://gitee.com/kisnwang) | -| [ModelZoo](modelzoo/README.md) | The development of MindSpore modelzoo and additional ops. | [@chenhaozhe](https://gitee.com/c_34) | -| [Data](data/README.md) | The development of MindSpore data processing and data format transformation. | [@liucunwei](https://gitee.com/liucunwei) | -| [Visualization](visualization/README.md) | The development of Visualized debugging and optimization. | [@liangyongxiong](https://gitee.com/liangyongxiong1024) | -| [MSLITE](mslite/README.md) | The development of MindSpore lite. | [@zhaizhiqiang](https://gitee.com/zhaizhiqiang) | -| [Parallel](parallel/README.md) | The development of MindSpore's functionality of automatically finding the efficient parallel strategy for DNN training and inference. | [@baiyouhui](https://gitee.com/bert0108) | -| [DataCompliance](datacompliance/README.md) | Reduce the risk of license compliance and help developers to use and share datasets legally. | [@gopikrishnanrajbahadur](https://gitee.com/gopikrishnanrajbahadur) [@clement_li](https://gitee.com/clement_li) | -| [MindQuantum](mindquantum/README.md) | The development of MindSpore quantum software and algorithms. | [@dorothy20212021](https://gitee.com/dorothy20212021) | -| [CulturalTourism](CulturalTourism/README.md) | AI for Cultural tourism industry | Guozeng Sun(School of Computer Science, Shanxi Normal University) | -| [DeviceAdapter](DeviceAdapter/README.md) | Adapt third party chips to mindspore | [@guoqi1024](https://gitee.com/guoqi1024) | -| [graphlearning](graphlearning/README.md) | Graph machine learning | Fengxun | -| [mdp](mdp/README.md) | Deep Probabilistic Programming | Jianfei Chen (Tsinghua University) | -| [MedicalImaging](MedicalImaging/README.md) | Medical image-assisted diagnosis | Xuming Zhang(School of Life Science and Technology, Huazhong University of Science and Technology) | -| [mindelec](mindelec/README.md) | Electromagnetic simulation calculation | Weibing Yang(School of Science, Southeast University) | -| [mindflow](mindflow/README.en.md) | Fluid simulation calculation | hsliu_ustc(Huawei) | -| [mindquantfinance](mindquantfinance/README.md) | Quantitative financial analysis | Weizheng Lu(Renmin University of China) | -| [mindspore_reinforcement](mindspore_reinforcement/README.md) | Reinforcement learning | Rongpeng Li(School of Information and Electronic Engineering, Zhejiang University) | -| [mindspore_sponge](mindspore_sponge/README.md) | Simulation package towards next generation molecular modelling | Yahao Ding | -| [RobotVision](RobotVision/README.md) | Robot vision technology | Bin Sun(School of Electrical and Information Engineering, Hunan University) | -| [TimeSequence](TimeSequence/README.md) | Time-sequence data prediction | Haoyi Zhou(School of Software, Beijing University of Aeronautics and Astronautics) | +This directory stores operational information for all code repositories +and Special Interest Groups (SIGs) within the MindSpore community. -## Resources +Each subdirectory within this directory represents a SIG. +Within each SIG, the SIG's description, maintainer, and managed code +repository information are all located in the `sig-info.yaml` file. -You can view the screen recordings of the SIG regular meeting on the official bilibili account of MindSpore. +## Learning Resources - [links](https://space.bilibili.com/526894060/channel/seriesdetail?sid=675044) +You can watch previous meeting recordings on MindSpore's official +Bilibili account. -## Joining a SIG +[links](https://space.bilibili.com/526894060/channel/seriesdetail?sid=675044) -If you are interested in participating, here are 2 ways to join the above SIGs: +## NOTE -1, Add MindSpore assistant wechat "mindspore0328", and the assistant will invite you to SIG's WeChat group. - -2, Pay attention to MindSpore's WeChat public account "MindSpore", we will release the SIG regular meeting information on the public account, and the organizer will publish the WeChat group QR code in the meeting. - -## Proposing a new SIG - -New SIGs are created when there is sufficient interest in a topic area -and someone volunteers to be the lead for the group and submits a proposal to -the steering committee. The chair facilitates the discussion and helps -synthesize proposals and decisions. - -[Propose now!](https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/How%20to%20build%20a%20SIG%20or%20WG_cn.md) - -## Create a yaml file for description your SIG - -To display the SIG you created on MindSpore's official website, you need to use create_sig_info_template.py to create a yaml file to describe SIG related information. The format of the yaml file can be referred [here](https://gitee.com/openeuler/community/blob/master/sig/README.md). \ No newline at end of file +Historical SIGs will no longer be maintained and will be archived in +the [archived_sigs](../archived_sigs) directory under this code repository. diff --git a/sigs/mindspore_core/sig-info.yaml b/sigs/mindspore_core/sig-info.yaml index 8bb91d8..7e991f2 100644 --- a/sigs/mindspore_core/sig-info.yaml +++ b/sigs/mindspore_core/sig-info.yaml @@ -1,6 +1,6 @@ name: MindSpore Core -description: MindSpore Core SIG(MindSpore基础框架开发SIG)专注于推动MindSpore基础能力完善稳定: 构建Mindpore的底层基础能力和基础表达,提供nn、数学等计算算子,自动微分,设备管理等功能,提供张量、模型等基础表达,以及动态图执行、静态图加速能力。 -description_en: The MindSpore Core SIG focuses on improving and stabilizing MindSpore's fundamental capabilities: building the underlying capabilities and basic representations of MindSpore, providing computational operators such as nn and mathematical functions, providing automatic differentiation, device management and other functions, providing basic repesentations such as tensor and models, as well as dynamic graph execution and basic graph acceleration capabilities. +description: MindSpore Core SIG(MindSpore基础框架开发SIG)专注于推动MindSpore基础能力完善稳定, 构建Mindpore的底层基础能力和基础表达,提供nn、数学等计算算子,自动微分,设备管理等功能,提供张量、模型等基础表达,以及动态图执行、静态图加速能力。 +description_en: The MindSpore Core SIG focuses on improving and stabilizing MindSpore's fundamental capabilities, building the underlying capabilities and basic representations of MindSpore, providing computational operators such as nn and mathematical functions, providing automatic differentiation, device management and other functions, providing basic repesentations such as tensor and models, as well as dynamic graph execution and basic graph acceleration capabilities. created_on: '2025-11-17' mailing_list: dev@mindspore.cn meeting_url: NA @@ -31,7 +31,20 @@ repositories: - repo: - mindspore/mindspore directory: - - mindspore/ccsrc + - mindspore/ccsrc/backend + - mindspore/ccsrc/cluster + - mindspore/ccsrc/cmake + - mindspore/ccsrc/frontend + - mindspore/ccsrc/include + - mindspore/ccsrc/minddata + - mindspore/ccsrc/plugin + - mindspore/ccsrc/pybind_api + - mindspore/ccsrc/pynative + - mindspore/ccsrc/runtime + - mindspore/ccsrc/utils + - mindspore/core + - mindspore/include + - mindspore/ops - mindspore/python/mindspore repo_admin: - gitee_id: chujinjin diff --git a/work/README.md b/work/README.md new file mode 100644 index 0000000..2a3efec --- /dev/null +++ b/work/README.md @@ -0,0 +1,13 @@ + +# {{ community_name }} Community + +This repository hosts all community-related materials. For more information, please refer to the following sections: + +## Governance +Please see [governance.md](governance.md) for details on our community governance structure. + +## Code of Conduct +We provide both [Chinese](code-of-conduct_zh_cn.md) and [English](code-of-conduct_en.md) versions of our Code of Conduct, based on the CNCF Code of Conduct. + +## Contributor License Agreement +You can find both the [Individual](ICLA.pdf) and [Corporate](CCLA.pdf) Contributor License Agreements. \ No newline at end of file diff --git a/work/requirements.txt b/work/requirements.txt new file mode 100644 index 0000000..184d339 --- /dev/null +++ b/work/requirements.txt @@ -0,0 +1,5 @@ +python==3.9.25 +mindspore==2.7.0 +mindnlp==0.5.1 +gradio +tqdm \ No newline at end of file diff --git a/work/train_lora.py b/work/train_lora.py new file mode 100644 index 0000000..d1b8824 --- /dev/null +++ b/work/train_lora.py @@ -0,0 +1,373 @@ +# Copyright 2025 Huawei Technologies Co., Ltd +# +# Licensed under the Apache License, Version 2.0 (the "License"); +# you may not use this file except in compliance with the License. +# You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. +# ============================================================================ +import os + # 必须在导入其他库之前禁用 Tokenizers 并行,防止死锁 +os.environ["TOKENIZERS_PARALLELISM"] = "false" + +MODEL_PATH = os.getenv("MODEL_PATH", "./pretrained/Qwen/Qwen2.5-7B-Instruct") +ADAPTER_DIR = os.getenv("ADAPTER_DIR", "./final_lora_output") +MERGED_DIR = os.getenv("MERGED_DIR", "./merged_model") +DATA_DIR = os.getenv("DATA_DIR", "./data") + +import argparse +import json +import math +import mindspore as ms +from mindspore import context +from mindnlp.transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments, TrainerCallback, TextIteratorStreamer +from tqdm.auto import tqdm +from mindnlp.peft import LoraConfig, get_peft_model, TaskType, PeftModel +from threading import Thread + +# 设置上下文 +context.set_context(mode=ms.PYNATIVE_MODE, device_target="Ascend", device_id=0) + +def build_prompt(tokenizer, instruction, user_input): + """构造推理/训练时的提示词 + - 优先使用 `tokenizer.apply_chat_template` 以适配聊天模型格式 + - 无聊天模板时,退化为简单的指令-用户-助手三段式 + 参数: + tokenizer: 分词器对象 + instruction: 指令(必填) + user_input: 额外输入(可选) + """ + system = "你是严谨的中文法律助手。" + if hasattr(tokenizer, "apply_chat_template"): + content = instruction + ("\n" + user_input if user_input else "") + messages = [{"role": "system", "content": system}, {"role": "user", "content": content}] + return tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False) + prefix = "系统:你是严谨的中文法律助手。\n用户:" + if user_input: + return f"{prefix}{instruction}\n{user_input}\n助手:" + return f"{prefix}{instruction}\n助手:" + +def load_raw_dataset(json_path): + """加载 JSON 数据集 + - 优先使用 `datasets.load_dataset` 以支持大文件与切分 + - 失败时退回到原生 `json.load` + 返回:list[dict],每条包含 instruction/input/output + """ + try: + from datasets import load_dataset + ds = load_dataset("json", data_files=json_path, split="train") + return [dict(x) for x in ds] + except Exception: + with open(json_path, "r", encoding="utf-8") as f: + return json.load(f) + +def tokenize_examples(examples, tokenizer, max_length): + """将每条样本转为 token 序列并构造 label + - 拼接:prompt + output + eos + - 对 prompt 段落的 label 置为 -100 以忽略 loss + - 支持按 `max_length` 截断 + 返回:[{input_ids, labels}] + """ + tokenized = [] + for ex in examples: + inst = ex.get("instruction", "") + inp = ex.get("input", "") + out = ex.get("output", "") + prompt = build_prompt(tokenizer, inst, inp) + full_text = prompt + out + tokenizer.eos_token + + # 分词 + full_ids = tokenizer(full_text, max_length=max_length, truncation=True, padding=False)["input_ids"] + prompt_ids = tokenizer(prompt, max_length=max_length, truncation=True, padding=False)["input_ids"] + + # 制作 Label Mask + labels = full_ids.copy() + # 将 prompt 部分的 label 设为 -100 (不计算 loss) + prompt_len = len(prompt_ids) + if prompt_len < len(labels): + for i in range(prompt_len): + labels[i] = -100 + else: + # 异常情况保护:如果截断后全是 prompt + for i in range(len(labels)): + labels[i] = -100 + + tokenized.append({"input_ids": full_ids, "labels": labels}) + return tokenized + +def make_collate_fn(tokenizer): + """构造动态 padding 的 `data_collator` + - 以 batch 内最大长度对齐 + - `input_ids`/`attention_mask`/`labels` 均返回 MindSpore Tensor + - 张量移动到 `npu:0` + """ + pad_id = tokenizer.pad_token_id + def collate_fn(batch): + max_len = max(len(x["input_ids"]) for x in batch) + input_ids = [] + labels = [] + attention_mask = [] + for x in batch: + ids = x["input_ids"] + lbs = x["labels"] + pad_len = max_len - len(ids) + input_ids.append(ids + [pad_id] * pad_len) + attention_mask.append([1] * len(ids) + [0] * pad_len) + labels.append(lbs + [-100] * pad_len) + + return { + "input_ids": ms.Tensor(input_ids, dtype=ms.int64).to("npu:0"), + "attention_mask": ms.Tensor(attention_mask, dtype=ms.int64).to("npu:0"), + "labels": ms.Tensor(labels, dtype=ms.int64).to("npu:0"), + } + return collate_fn + +class ListDataset: + """最小化的数据集封装,用于将普通 list 数据适配为 MindNLP Trainer 所需的数据集格式""" + def __init__(self, data): + self.data = data + def __len__(self): + return len(self.data) + def __getitem__(self, idx): + return self.data[idx] + +class TqdmProgress(TrainerCallback): + """使用 tqdm 展示训练进度的回调""" + def __init__(self): + self.bar = None + def on_train_begin(self, args, state, control, **kwargs): + total = args.max_steps if getattr(args, "max_steps", 0) else None + self.bar = tqdm(total=total, desc="Training") + def on_step_end(self, args, state, control, **kwargs): + if self.bar is not None: + self.bar.update(1) + def on_train_end(self, args, state, control, **kwargs): + if self.bar is not None: + self.bar.close() + +def merge_weights(args): + """独立的合并逻辑,防止显存溢出""" + print(f"\n[Merge] Starting merge process...") + print(f"[Merge] Loading base model from: {args.model_path}") + + # 重新加载纯净的底座模型 + base_model = AutoModelForCausalLM.from_pretrained( + args.model_path, + ms_dtype=ms.float16, + low_cpu_mem_usage=True + ) + + print(f"[Merge] Loading adapter from: {args.adapter_dir}") + peft_model = PeftModel.from_pretrained(base_model, args.adapter_dir) + + print("[Merge] Merging weights (merge_and_unload)...") + # 真正合并权重 + merged_model = peft_model.merge_and_unload() + merged_model.set_train(False) + + print(f"[Merge] Saving full model to: {args.merged_dir}") + merged_model.save_pretrained(args.merged_dir) + + # 同时保存 tokenizer + tokenizer = AutoTokenizer.from_pretrained(args.model_path) + tokenizer.save_pretrained(args.merged_dir) + print("[Merge] Done successfully!") + +def train(args): + """主训练流程 + - 加载 tokenizer/底座模型并应用 LoRA + - 构造数据与 `Trainer` + - 断点续训与保存 Adapter + - 可选:释放显存后进行权重合并并保存全量模型 + """ + tokenizer = AutoTokenizer.from_pretrained(args.model_path) + if tokenizer.pad_token_id is None: + tokenizer.pad_token_id = tokenizer.eos_token_id + + base_model = AutoModelForCausalLM.from_pretrained(args.model_path, ms_dtype=ms.float16) + + peft_cfg = LoraConfig( + task_type=TaskType.CAUSAL_LM, + inference_mode=False, + r=args.lora_r, + lora_alpha=args.lora_alpha, + lora_dropout=args.lora_dropout, + target_modules=args.target_modules.split(","), + ) + + model = get_peft_model(base_model, peft_cfg) + model = model.to("npu:0") + try: + model.print_trainable_parameters() + except Exception: + pass + + raw = load_raw_dataset(args.dataset_json) + tok = tokenize_examples(raw, tokenizer, args.max_seq_length) + collate_fn = make_collate_fn(tokenizer) + + steps = args.max_steps if args.max_steps > 0 else math.ceil(len(tok) * args.num_train_epochs / (args.per_device_train_batch_size * args.gradient_accumulation_steps)) + + training_args = TrainingArguments( + output_dir=args.output_dir, + per_device_train_batch_size=args.per_device_train_batch_size, + gradient_accumulation_steps=args.gradient_accumulation_steps, + learning_rate=args.learning_rate, + num_train_epochs=args.num_train_epochs, + logging_steps=args.logging_steps, + save_steps=args.save_steps, + fp16=False, + save_total_limit=args.save_total_limit, + max_steps=steps, + disable_tqdm=False, + ) + + trainer = Trainer( + model=model, + args=training_args, + train_dataset=ListDataset(tok), + data_collator=collate_fn, + tokenizer=tokenizer, + callbacks=[TqdmProgress()], + ) + + resume_path = None + if args.resume_from_checkpoint: + resume_path = args.resume_from_checkpoint + elif args.resume_auto: + try: + ckpts = [d for d in os.listdir(args.output_dir) if d.startswith("checkpoint-")] + if ckpts: + last = sorted(ckpts, key=lambda x: int(x.split("-")[-1]))[-1] + resume_path = os.path.join(args.output_dir, last) + except Exception: + resume_path = None + trainer.train(resume_from_checkpoint=resume_path) + + # 保存 Adapter + print(f"Saving LoRA adapter to {args.adapter_dir}") + model.save_pretrained(args.adapter_dir) + + +def infer(args): + """推理流程 + - 优先加载已合并的全量模型;否则加载底座+Adapter + - 构造提示词与采样参数 + - 采用 `TextIteratorStreamer` 流式输出生成文本 + """ + use_merged = os.path.isdir(args.merged_dir) and bool(os.listdir(args.merged_dir)) if os.path.exists(args.merged_dir) else False + if use_merged: + print(f"Loading model for inference from: {args.merged_dir}") + tokenizer = AutoTokenizer.from_pretrained(args.merged_dir) + model = AutoModelForCausalLM.from_pretrained(args.merged_dir, ms_dtype=ms.float16) + else: + print(f"Loading model for inference from: {args.model_path} with adapter {args.adapter_dir}") + tokenizer = AutoTokenizer.from_pretrained(args.model_path) + base = AutoModelForCausalLM.from_pretrained(args.model_path, ms_dtype=ms.float16) + model = PeftModel.from_pretrained(base, args.adapter_dir) + model = model.to("npu:0") + model.set_train(False) + + prompt = build_prompt(tokenizer, args.infer_instruction, args.infer_input) + inputs = tokenizer(prompt, return_tensors="ms") + inputs = {k: v.to("npu:0") for k, v in inputs.items()} + + print("-" * 20) + print(f"Question: {args.infer_instruction}") + print("Answer: ", end="", flush=True) + + # 生成配置 + generate_kwargs = dict( + input_ids=inputs["input_ids"], + max_new_tokens=args.max_new_tokens, + do_sample=args.do_sample, + top_p=args.top_p, + top_k=getattr(args, "top_k", 50), + temperature=args.temperature, + repetition_penalty=args.repetition_penalty, + no_repeat_ngram_size=args.no_repeat_ngram_size, + pad_token_id=tokenizer.pad_token_id, + eos_token_id=tokenizer.eos_token_id + ) + + # 流式输出 + streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True) + generate_kwargs["streamer"] = streamer + + thread = Thread(target=model.generate, kwargs=generate_kwargs) + thread.start() + + for new_text in streamer: + print(new_text, end="", flush=True) + print("\n" + "-" * 20) + +def parse_args(): + """命令行参数定义 + - 路径/训练/LoRA/控制/推理参数分组 + - `no_stream`/`no_prewarm` 等参数为预留,当前未使用 + """ + p = argparse.ArgumentParser() + # 路径参数 + p.add_argument("--model_path", type=str, default="MODEL_PATH", help="底座模型路径") + p.add_argument("--dataset_json", type=str, default="DATA_PDIR") + p.add_argument("--adapter_dir", type=str, default="ADAPTER_DIR", help="LoRA权重保存路径") + p.add_argument("--merged_dir", type=str, default="MERGED_DIR", help="合并后全量模型保存路径") + + # 训练参数 + train_args = p.add_argument_group("Training Arguments") + train_args.add_argument("--learning_rate", type=float, default=2e-4) + train_args.add_argument("--num_train_epochs", type=float, default=3.0) + + lora_args = p.add_argument_group("LoRA Configuration") + lora_args.add_argument("--lora_r", type=int, default=32) + lora_args.add_argument("--lora_alpha", type=int, default=64) + + # LoRA 参数 + p.add_argument("--lora_dropout", type=float, default=0.1) + p.add_argument("--target_modules", type=str, default="q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj") + + # 控制参数 + p.add_argument("--max_steps", type=int, default=0) + p.add_argument("--merge_and_save", action="store_true", help="训练完是否合并权重") + p.add_argument("--resume_from_checkpoint", type=str, default="") + p.add_argument("--resume_auto", action="store_true") + p.add_argument("--do_train", action="store_true") + p.add_argument("--do_infer", action="store_true") + + # 推理参数 + p.add_argument("--infer_instruction", type=str, default="某人在交通事故中受到了腹壁穿透创伤,该如何鉴定他的人体损伤程度?") + p.add_argument("--infer_input", type=str, default="") + p.add_argument("--max_new_tokens", type=int, default=1024) + p.add_argument("--do_sample", action="store_true") + p.add_argument("--top_p", type=float, default=0.9) + p.add_argument("--top_k", type=int, default=50) + p.add_argument("--temperature", type=float, default=0.7) + p.add_argument("--repetition_penalty", type=float, default=1.1) + p.add_argument("--no_repeat_ngram_size", type=int, default=0) + p.add_argument("--no_stream", action="store_true") + p.add_argument("--no_prewarm", action="store_true") + p.add_argument("--warmup_tokens", type=int, default=1) + + return p.parse_args() + +# 入口:根据命令行开关执行训练与推理 +# - `--do_train`:执行训练并保存 Adapter(可选合并) +# - `--do_infer`:加载模型并进行流式推理 +if __name__ == "__main__": + args = parse_args() + + if args.do_train: + os.makedirs(args.output_dir, exist_ok=True) + os.makedirs(args.adapter_dir, exist_ok=True) + if args.merge_and_save: + os.makedirs(args.merged_dir, exist_ok=True) + train(args) + + if args.do_infer: + infer(args) diff --git a/work/web_infer.py b/work/web_infer.py new file mode 100644 index 0000000..98aff37 --- /dev/null +++ b/work/web_infer.py @@ -0,0 +1,117 @@ +# Copyright 2025 Huawei Technologies Co., Ltd +# +# Licensed under the Apache License, Version 2.0 (the "License"); +# you may not use this file except in compliance with the License. +# You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. +# ============================================================================ +import os +import threading +import mindspore as ms +from mindspore import context +from mindnlp.transformers import AutoTokenizer, AutoModelForCausalLM, TextIteratorStreamer +from mindnlp.peft import PeftModel +import gradio as gr + +# =================配置区域================= +os.environ["TOKENIZERS_PARALLELISM"] = "false" + +MODEL_PATH = os.getenv("MODEL_PATH", "./pretrained/Qwen/Qwen2.5-7B-Instruct") +ADAPTER_DIR = os.getenv("ADAPTER_DIR", "./final_lora_output") +MERGED_DIR = os.getenv("MERGED_DIR", "./merged_model") + + + +context.set_context(mode=ms.PYNATIVE_MODE, device_target="Ascend", device_id=0) + +# =================模型加载================= +print("正在加载模型...") +use_merged = os.path.isdir(MERGED_DIR) and bool(os.listdir(MERGED_DIR)) if os.path.exists(MERGED_DIR) else False + +if use_merged: + tokenizer = AutoTokenizer.from_pretrained(MERGED_DIR) + model = AutoModelForCausalLM.from_pretrained(MERGED_DIR, ms_dtype=ms.float16) +else: + tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH) + base_model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, ms_dtype=ms.float16) + model = PeftModel.from_pretrained(base_model, ADAPTER_DIR) + +model = model.to("npu:0") +model.set_train(False) +if tokenizer.pad_token_id is None: + tokenizer.pad_token_id = tokenizer.eos_token_id +print("模型加载完毕!") + +# =================推理逻辑================= + +def predict(message, history): + """ + 基于输入消息生成法律问答回复,使用流式输出。 + + 参数: + message (str): 用户当前输入的问题。 + history (list): 聊天历史记录(Gradio 传入,当前未使用)。 + + 生成: + str: 逐字生成的回答内容。 + """ + # 内部固定参数 + max_len = 1024 + temperature = 0.7 + top_p = 0.9 + + full_prompt = build_prompt(tokenizer, message) + + inputs = tokenizer(full_prompt, return_tensors="ms") + inputs = {k: v.to("npu:0") for k, v in inputs.items()} + + streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True) + + generation_kwargs = dict( + input_ids=inputs["input_ids"], + max_new_tokens=max_len, + do_sample=True, + temperature=temperature, + top_p=top_p, + pad_token_id=tokenizer.pad_token_id, + streamer=streamer + ) + + thread = threading.Thread(target=model.generate, kwargs=generation_kwargs) + thread.start() + + partial_message = "" + for new_token in streamer: + partial_message += new_token + yield partial_message + +# =================搭建网页================= +with gr.Blocks(title="法律大模型") as demo: + gr.Markdown("# ⚖️ 法律大模型助手 (MindSpore版)") + + chatbot_config = gr.Chatbot( + height=600, + bubble_full_width=False, + show_copy_button=True + ) + + gr.ChatInterface( + predict, + chatbot=chatbot_config, # 传入自定义的 chatbot + examples=[ + ["某人在交通事故中受到了腹壁穿透创伤,该如何鉴定?"], + ["盗窃罪的立案标准是什么?"], + ["请说明注册商标的申请流程?"] + ], + description="基于 Qwen2.5 + LoRA 微调的法律问答助手" + ) + +if __name__ == "__main__": + demo.queue().launch(share=True, server_name="0.0.0.0") \ No newline at end of file -- Gitee