38 Star 383 Fork 239

GVPAscend/MindSpeed-MM

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
.gitee
checkpoint
ci
docs
examples
JanusPro
cogvideox
deepseekvl2
diffusers
flux
hidream
kolors
README.md
infer_kolors_fp16.py
sana
sd3
sdxl
glm4.1v
hunyuanvideo
internvl2.5
internvl2
internvl3
llava1.5
mindspore
ming
opensora1.0
opensora1.2
opensora2.0
opensoraplan1.2
opensoraplan1.3
opensoraplan1.5
qihoo_t2x
qwen2.5omni
qwen2.5vl
qwen2vl
qwen3vl_dev
rl
stepvideo
vae
wan2.1
whisper
mindspeed_mm
sources
tests
.gitignore
LICENSE
MANIFEST.in
OWNERS
README.md
Third-Party Open Source Software Notice.txt
evaluate_gen.py
evaluate_vlm.py
inference_qihoo.py
inference_sora.py
inference_vlm.py
posttrain_qwen2vl_dpo.py
posttrain_sora_dpo.py
posttrain_vlm_grpo.py
pretrain_ae.py
pretrain_deepseekvl.py
pretrain_internvl.py
pretrain_llava.py
pretrain_qwen2vl.py
pretrain_sora.py
pretrain_vlm.py
pretrain_whisper.py
pyproject.toml
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

Diffusers

kolors

模型介绍

可图大模型是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。Kolors 在数十亿图文对下进行训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面,相比于开源/闭源模型,都展示出了巨大的优势。同时,Kolors 支持中英双语,在中文特色内容理解方面更具竞争力。

  • 参考实现:

    url=https://github.com/Kwai-Kolors/Kolors
    commit_id=0fafa56a76b7acf1e147b153d1e7b8fd65f9055b
    

推理

权重获取

1.联网情况下,预训练模型会自动下载。

2.无网络情况下,用户可以访问huggingface官方下载,namespace为 Kwai-Kolors/Kolors-diffusers。注意如果本地下载权重需要将权重路径传入到infer_kolors_fp16.py中。

环境搭建

请参考昇腾社区中《Pytorch框架训练环境准备》文档搭建昇腾环境,本仓已支持表2中软件版本。

表 2 昇腾软件版本支持表

【模型开发时推荐使用配套的环境版本】

请参考安装指南

  1. 三方件安装

    # python3.10
    conda create -n kolors python=3.10
    conda activate kolors
    
    # 安装 torch 
    pip install torch-2.7.1-cp310-cp310-manylinux_2_28_aarch64.whl
    # apex for Ascend 参考 https://gitee.com/ascend/apex
    # 建议从原仓编译安装
    pip install diffusers==0.30.0 accelerate==0.27.2 transformers==4.42.4  torchvision==0.16.0
    
  2. 克隆仓库到本地服务器

    # 克隆仓库
    git clone https://gitee.com/ascend/MindSpeed-MM.git
    cd examples/diffusers/kolors
    
  3. 运行推理的脚本

    
    

将下面环境变量路径修改为真实路径,下面为参考路径

source /usr/local/Ascend/ascend-toolkit/set_env.sh python infer_kolors_fp16.py


<a id="jump1"></a>

## 引用

### 公网地址说明

代码涉及公网地址参考 [公网地址](https://gitee.com/ascend/MindSpeed-MM/blob/master/docs/public_address_statement.md)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/ascend/MindSpeed-MM.git
git@gitee.com:ascend/MindSpeed-MM.git
ascend
MindSpeed-MM
MindSpeed-MM
master

搜索帮助