一、需求场景&价值
客户需要使用310系列卡,完成qwen系列的多模态大模型的推理验证及其实际数据测试
硬件:
300i pro
双卡
单卡可以正常跑纯模型推理,双卡报错如下
二、软件信息
mindie镜像:1.0.0-300I-Duo-py311-openeuler24.03-lts
三、测试流程
#vim Qwen2-VL-7B-Instruct/config.json修改为float16
##修改/usr/local/Ascend/atb-models/examples/models/qwen2_vl/run_pa.sh脚本
'''
model_path="/home/aicc/models/Qwen2-VL-7B-Instruct/"
max_batch_size=1
max_input_length=8192
max_output_length=80
input_image="/home/aicc/models/qwenvl-test.jpg"
input_text="Explain the details in the image."
--dataset_path $dataset_path \
dataset_path="/data/test_images"
shm_name_save_path="./shm_name.txt"
'''
#运行脚本
bash /usr/local/Ascend/atb-models/examples/models/qwen2_vl/run_pa.sh
设置芯片的BAR空间拷贝使能(1:使能),重启OS即可解决该问题。
参考文档:https://www.hiascend.com/doc_center/source/zh/Atlas 200I A2/23.0.RC3/re/npu/npusmi_098.html
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
已解决
登录 后才可以发表评论