2.3K Star 8K Fork 4.2K

GVPMindSpore / mindspore

 / 详情

【众智】【数据算子】YahooAnswersDataset

DONE
Requirement 成员
创建于  
2021-07-13 17:19

1 功能介绍
1.1 算子分析
YahooAnswers数据集来自雅虎问答截止2007年10月25日的语料库,隶属于雅虎研究联盟Webscope它包括所有问题及其相应的答案。语料库包含4483032个问题及其答案。
YahooAnswers主题分类数据集是由10个最大的主要类别构建的。从所有答案和信息中,挑选了最佳答案和类别主要信息。每个类别包含140000个训练样本和6000个测试样本。因此,该数据集中的训练样本总数为1400000个,测试样本总数为60000个。
目录结构
输入图片说明
数据集结构:
输入图片说明
YahooAnswers包含train.csv和test.csv两个数据集文件,分表是训练集和测试集,csv格式文件以“,”为分隔符,将每条样本分为四列(索引号、问题、问题内容、最佳答案),索引号为1-10,分别表示以下类别:
输入图片说明
2接口描述
2.1 Python层接口
输入图片说明
输入图片说明
2.2 C++层接口
输入图片说明
2.3 算子设计规格
输入图片说明
输入图片说明

附件

评论 (2)

hedongdong 创建了RFC
hedongdong 计划截止日期设置为2021-09-30
hedongdong 关联仓库设置为MindSpore/mindspore
hedongdong 负责人设置为杨旭华
hedongdong 计划开始日期设置为2021-07-13
hedongdong 添加了
 
sig/minddata
标签
hedongdong 添加协作者hedongdong
hedongdong 添加协作者xiaotianci
展开全部操作日志

Please add labels (comp or sig), also you can visit "https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md" to find more.
为了让问题更快得到响应,请您为该issue打上**组件(comp)或兴趣组(sig)**标签,打上标签的问题可以直接推送给责任人进行处理。更多的标签可以查看 https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md"
以组件问题为例,如果你发现问题是data组件造成的,你可以这样评论:
//comp/data
当然你也可以向data SIG组求助,可以这样写:
//comp/data
//sig/data
如果是一个简单的问题,你可以留给刚进入社区的小伙伴来回答,这时候你可以这样写:
//good-first-issue
恭喜你,你已经学会了使用命令来打标签,接下来就在下面的评论里打上标签吧!

hello, @hedongdong , Has this problem been resolved? If it is in progress, please change the status to WIP. If the issue was solved, please close this issue, thanks!
你好, @hedongdong , 这个问题是否已经解决了呢? 如果正在进行中,请把issue状态设置为WIP;如果问题已解决,请关闭这个issue, 谢谢!

hedongdong 添加了
 
mindspore-assistant
标签
hedongdong 移除了
 
mindspore-assistant
标签
杨旭华 添加协作者杨旭华
杨旭华 负责人杨旭华 修改为张凯磊
杨旭华 任务状态TODO 修改为WIP
张凯磊 上传了附件YahooAnswersDataset交付件.zip
张凯磊 删除了附件YahooAnswersDataset交付件.zip
张凯磊 上传了附件YahooAnswersDataset交付件.zip
张凯磊 删除了附件YahooAnswersDataset交付件.zip
张凯磊 上传了附件YahooAnswersDataset交付件.zip
杨旭华 修改了描述
xiaotianci 修改了描述
xiaotianci 任务状态WIP 修改为DONE
hedongdong 任务类型RFC 修改为Requirement
hedongdong 添加了
 
OCCM/review-passed
标签
hedongdong 添加了
 
OCCM/test-passed
标签
hedongdong 添加了
 
OCCM/pr-merged
标签

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(4)
8777557 test bot 1617846881
Python
1
https://gitee.com/mindspore/mindspore.git
git@gitee.com:mindspore/mindspore.git
mindspore
mindspore
mindspore

搜索帮助