所有star的仓库都会放在这里。可以根据需求创建不同的星选集来管理它们。
PT-ALIGN:LLM 双安全自对齐开源方案,通过精修正负样本 + 话题引导红队策略,仅需少量人工标注即可实现模型安全对齐。
🔔 项目归属声明:本项目由许晶鑫独立开发,仅由 @MerrySunlight 协助在 Gitee 上进行开源托管。
最近更新:
9天前
PN-ALIGN:LLM 双安全自对齐开源方案,通过精修正负样本 + 话题引导红队策略,仅需少量人工标注即可实现模型安全对齐。
🔔 项目归属声明:本项目由许晶鑫独立开发,仅由 @MerrySunlight 协助在 Gitee 上进行开源托管。
最近更新:
9天前
Refining Positive and Toxic Samples for Dual Safety Self-Alignment of LLMs with Minimal Human Intervent论文开源仓库
最近更新:
暂未更新