1 Star 2 Fork 0

Stephen/FinancialDatasets

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

FinancialDatasets

SmoothNLP 金融文本数据集(公开) | Public Financial Datasets for NLP Researches

API接口服务

数据一览

由于github存储有限, 如需全量数据集, 请联系: contact@smoothnlp.com

数据名称 数据字段 样本量 总量 下载链接
企业工商信息 名称,公司名称,公司介绍,工商,地址,工商注册id,成立时间,法人代表,注册资金,统一信用代码,网址 1万 50万 - (上市及中小型企业) 下载
金融讯息新闻 title-新闻标题,content-新闻内容,pub_ts-发稿日期 2万 210万 下载
专栏资讯 title-新闻标题,content-新闻内容,pub_ts-发稿日期 1万 58万 下载
投资机构信息 机构名称,介绍,行业,规模,轮次 1K 3万 下载
投资事件 事件资讯,投资方,融资方,融资事件,轮次,金额 2K 7万 下载
36氪新闻 title-新闻标题,content-新闻内容,url-网址 1万 11万 下载

推荐研究方向

  • Embedding (Word2Vec, Bert, 等)
  • 实体识别 - NER
  • 无监督聚类: 基于企业描述信息, 进行竞品聚类
  • 企业行业分类
  • 标题总结 - Text Summary
  • 序列分类 - Sequence Classification

数据展示

投资机构

机构

投资事件

投资事件

企业工商信息

工商

金融资讯新闻

新闻

专栏资讯

专栏

36氪新闻

36氪

空文件

简介

取消

发行版

暂无发行版

贡献者

全部

近期动态

不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/stephen1991/FinancialDatasets.git
git@gitee.com:stephen1991/FinancialDatasets.git
stephen1991
FinancialDatasets
FinancialDatasets
master

搜索帮助