1 功能介绍
1.1 算子分析
YahooAnswers数据集来自雅虎问答截止2007年10月25日的语料库,隶属于雅虎研究联盟Webscope它包括所有问题及其相应的答案。语料库包含4483032个问题及其答案。
YahooAnswers主题分类数据集是由10个最大的主要类别构建的。从所有答案和信息中,挑选了最佳答案和类别主要信息。每个类别包含140000个训练样本和6000个测试样本。因此,该数据集中的训练样本总数为1400000个,测试样本总数为60000个。
目录结构
数据集结构:
YahooAnswers包含train.csv和test.csv两个数据集文件,分表是训练集和测试集,csv格式文件以“,”为分隔符,将每条样本分为四列(索引号、问题、问题内容、最佳答案),索引号为1-10,分别表示以下类别:
2接口描述
2.1 Python层接口
2.2 C++层接口
2.3 算子设计规格
Please add labels (comp or sig), also you can visit "https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md" to find more.
为了让问题更快得到响应,请您为该issue打上**组件(comp)或兴趣组(sig)**标签,打上标签的问题可以直接推送给责任人进行处理。更多的标签可以查看 https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md"
以组件问题为例,如果你发现问题是data组件造成的,你可以这样评论:
//comp/data
当然你也可以向data SIG组求助,可以这样写:
//comp/data
//sig/data
如果是一个简单的问题,你可以留给刚进入社区的小伙伴来回答,这时候你可以这样写:
//good-first-issue
恭喜你,你已经学会了使用命令来打标签,接下来就在下面的评论里打上标签吧!
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
hello, @hedongdong , Has this problem been resolved? If it is in progress, please change the status to WIP. If the issue was solved, please close this issue, thanks!
你好, @hedongdong , 这个问题是否已经解决了呢? 如果正在进行中,请把issue状态设置为WIP;如果问题已解决,请关闭这个issue, 谢谢!
登录 后才可以发表评论