代码拉取完成,页面将自动刷新
acctransformer是一个基于MindSpore框架以及昇腾 CANN 软件栈的transformer加速库,原生支持昇腾AI处理器NPU。
实现了一些对transformer模型中self-attention部分的加速算法,目前已支持:
如果您对MindSpore acctransformer有任何建议,请通过issue与我们联系,我们将及时处理。
算法支持列表如下:
名称 | 路径 | 文档 |
---|---|---|
FlashAttention2 | FlashAttention2 | 文档 |
TriangleAttention | TriangleAttention | 文档 |
首先需要准备包含昇腾AI处理器NPU的Linux服务器,并安装对应CANN版本的NPU驱动以及固件。
算法配套环境表如下:
名称 | 配套组件 | 版本要求 |
---|---|---|
FlashAttention2 | MindSpore CANN配套软件包 NPU: Ascend 910 |
MindSpore: 2.2.0 CANN配套软件包: 适配MindSpore版本 |
TriangleAttention | MindSpore CANN配套软件包 NPU: Ascend 910 |
MindSpore: 2.2.0 CANN配套软件包: 适配MindSpore版本 |
MindSpore官方网站:链接
各算法安装以及使用方法,参考算法支持列表各目录下README文档。
初始版本,后续待补充
参考每个算法模块下README指导文档。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
1. 开源生态
2. 协作、人、软件
3. 评估模型