AI 科学家系统 这个开源项目使用康奈尔大学公开的 arxiv 数据集(266.6万多篇文章),将每篇文章的 title+abstract 拼接后,使用 BGE-M3 进行嵌入,制作了一个规模大约 30 GB 的向量数据库。 使用这个向量数据库,用户可以快速检索相关文献,并调用 deepseek 进一步进行文献与问题的相关性分析,智能文献阅读,未来工作识别等任务。
最近更新: 2个月前MindScience is scientific computing kits for various industries based on the converged MindSpore framework.
最近更新: 3个月前