代码拉取完成,页面将自动刷新
ML Dataset数据集制作流程:
(0) 准备好存储因子的parquet文件,复制到S0_sourcedata文件夹中(决定了Dataset中有哪些因子)
准备csv格式的股票清单,复制到根目录下(决定了Dataset中有哪些股票)
(1) 打开每一个因子parquet文件,过滤出股票清单上股票的所有数据,并将多个因子横向合并于一张表中,删除含有缺失值的行,结果保存到S1_dataset文件夹中
使用方法:
1)将第(0)步骤所需的parquet文件复制到S0_sourcedata文件夹中,查看config.ini,确认输入输出路径及起止时间是否正确
2)运行Get_ML_Dataset.py
3)Dataset的结果将保存于S1_dataset文件夹中,也可以直接从内存中读取Dataset(line:187)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。