14233130 aixcoder model 1712808031
73
aiXcoder 7B 代码大型语言模型的官方仓库
8个月前
1350936 grt1228 1676872126
57
讯飞星火大模型Java SDK 易开发,更灵活. Xun fei SparkDesk Java SDK. SparkDesk. xfyun SDK. xinghuo.星火.
Java
1年多前
56
CodeFuse-MFTCoder: Multitask Fine-Tuned Code LLMs
8个月前
6196683 tengxunkai 1591587685
55
随着模型规模的扩大,如何在保持高性能的同时优化资源消耗成为一个关键挑战。为了应对这一挑战,我们研究了混合专家(MoE)模型,当前亮相的Hunyuan-Large(Hunyuan-MoE-A50B)模型,这是目前业界待开源的基于Transformer的最大MoE模型,拥有3890亿总参数和520亿激活参数。
2个月前
45
简单、高效且低成本的预训练、微调与服务,惠及大众
13683957 jiutian ai 1719886881
43
九天-139MoE-Chat是中国移动自主研发的语言大模型,实现数据构建、预训练、微调、部署全链路核心技术自主创新;行业定向增强,数据上融合通信、能源等8大行业专业知识,提供定制化行业大模型;安全可靠,建立数据质量评估体系,加强数据处理和清洗,优化DPO算法,加强人类价值观对齐,实现指令安全响应。该模型在主流公开测试集测评结果上,已达GPT-4的90%水平,适配国产算力生态,助力企业实现智能化产业
5个月前
12 mirrors 1578989292
33
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型
Python
1年前
9090342 chairc 1646386758
29
IDDM(工业,景观,动画…),diffusion model,支持DDPM, DDIM, PLMS, web和多gpu分布式训练。Pytorch实现、生成模型、扩散模型、分布式训练
Python
9天前
5635863 ascend 1586517030
28
此仓库已转移,新仓见:https://gitee.com/ascend/mindxdl.git
10597042 deep spark 1664386531
24
本仓库为天数智芯Iluvatar Corex IxRT高性能推理引擎的开源代码部分,提供IxRT相关插件、部署工具和演示IxRT平台用法和能力的应用示例。
3个月前
6196683 tengxunkai 1591587685
15
Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding.
2个月前
13128775 iflytekopensource 1706589882
15
星火开源大模型13BGPU的模型权重
Python
10个月前
12 mirrors 1578989292
14
Skywork是由昆仑万维集团·天工团队开发的一系列大型模型,本次开源的模型有Skywork-13B-Base模型、Skywork-13B-Chat模型、Skywork-13B-M
Python
1年前
12
Provide high-performance model inference, mainly supporting the CodeFuse model from Ant Group.
8个月前
11952193 modelee 1684805277
9
1年多前

搜索帮助

0d507c66 1850385 C8b1a773 1850385