# trgpt **Repository Path**: yuanyihan/trgpt ## Basic Information - **Project Name**: trgpt - **Description**: tttkjhfdsojhg - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-09-24 - **Last Updated**: 2025-01-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 疑问 1. 代码中未剥离提示词,采用拼接方式,改成中文工程量比较乱,而且修改和业务耦合较高(工程修改?通用的?,,豆包,文心等差异提示词) 2. 代码中未剥离model..。。。。model资源,提示词资源?--以后有改成其他模型的需要么? 3. 目标是啥?工具?还是服务?还是离线处理的?(原始的貌似是个工具) 4. 文心,提示词要重写?--确定提示词修改的工作量和分工? 5. cuda。。AutoModel.from_pretrained("ncbi/MedCPT-Article-Encoder").to("cuda") 6. 训练数据资源? # todo - [x] CentOS Linux release 7.9.2009 - [x] git,lrzsz,vim基本环境安装 - [x] Python 3.9.13,含dev环境 - [x] 代码-git,做好代码记录 - [x] 构建阿里云翻墙,便于下载模型(代码内用到了hf模型) - [x] python3.9 -m pip install -r requirements.txt - [x] Datasets数据下载,加到.gitignore - [x] 模型已经下载-并且把hf-hub加入requirements.txt - [ ] 把原始版本跑起来【缺gpt4key】 - [ ] 把配置统一起来,不采用env,改动只一处 - [ ] 修改提示词部分,把这部分英文剥离出来(使用提示词模板)(便于改成中文提示词)--确定提示词修改的工作量和分工? - [ ] 修改model部分,把这部分英文剥离出来(base基类)(便于改成其他模型) - [ ] 其他模型,适配文心一言的模型修改 - [ ] 提示词改成中文 - [ ] 中文数据灌入,修改中文提示词 - [ ] --其余--todo # tmp ``` git add -A git commit -m "下载模型并添加" git push -u origin "master" ```