Ai
1 Star 0 Fork 0

红云缭乱/GetMLData
暂停

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
Readme.txt 568 Bytes
一键复制 编辑 原始数据 按行查看 历史
红云缭乱 提交于 2022-09-05 11:45 +08:00 . Update
ML Dataset数据集制作流程:
(0) 准备好存储因子的parquet文件,复制到S0_sourcedata文件夹中(决定了Dataset中有哪些因子)
准备csv格式的股票清单,复制到根目录下(决定了Dataset中有哪些股票)
(1) 打开每一个因子parquet文件,过滤出股票清单上股票的所有数据,并将多个因子横向合并于一张表中,删除含有缺失值的行,结果保存到S1_dataset文件夹中
使用方法:
1)将第(0)步骤所需的parquet文件复制到S0_sourcedata文件夹中,查看config.ini,确认输入输出路径及起止时间是否正确
2)运行Get_ML_Dataset.py
3)Dataset的结果将保存于S1_dataset文件夹中,也可以直接从内存中读取Dataset(line:187)
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/redcloudRC/GetMLData.git
git@gitee.com:redcloudRC/GetMLData.git
redcloudRC
GetMLData
GetMLData
master

搜索帮助