@xjingxin
许晶鑫 no introduction.
PN-ALIGN:LLM 双安全自对齐开源方案,通过精修正负样本 + 话题引导红队策略,仅需少量人工标注即可实现模型安全对齐。 🔔 项目归属声明:本项目由许晶鑫独立开发,仅由 @MerrySunlight 协助在 Gitee 上进行开源托管。
Refining Positive and Toxic Samples for Dual Safety Self-Alignment of LLMs with Minimal Human Intervent论文开源仓库