Yuan2.0 M32 : 高效能混合专家注意力路由语言模型

Yuan2.0 M32

Yuan2.0 M32

AI模型 AI语言模型 #混合专家 #注意力路由 #高效能 #编码 #数学 #专业领域普通产品开源

简介 :

Yuan2.0-M32是一个具有32个专家的混合专家(MoE)语言模型，其中2个是活跃的。提出了一种新的路由网络——注意力路由，用于更高效的专家选择，提高了3.8%的准确性。该模型从零开始训练，使用了2000B个token，其训练计算量仅为同等参数规模的密集模型所需计算量的9.25%。在编码、数学和各种专业领域表现出竞争力，仅使用3.7B个活跃参数，每个token的前向计算量仅为7.4 GFLOPS，仅为Llama3-70B需求的1/19。在MATH和ARC-Challenge基准测试中超越了Llama3-70B，准确率分别达到了55.9%和95.8%。

需求人群 :

Yuan2.0-M32适合需要在编码、数学和专业领域进行高效计算和推理的开发者和研究人员。其低计算量和高准确性使其成为大规模语言模型应用的理想选择。

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 54.6K

使用场景

用于开发自然语言理解的应用程序

在数学问题解决中提供精确的计算支持

作为专业领域知识获取和推理的辅助工具

产品特色

混合专家(MoE)模型，拥有32个专家，其中2个活跃

采用新的注意力路由网络，提高模型选择专家的效率

从零开始训练，使用了2000B个token，训练计算量低

在编码、数学和专业领域表现出色，具有竞争力

在MATH和ARC-Challenge基准测试中超越其他模型

模型操作仅使用3.7B个活跃参数，计算效率高

使用教程

1. 配置环境，推荐使用Yuan2.0-M32的最新docker镜像

2. 根据提供的脚本进行数据预处理

3. 使用示例脚本进行模型预训练

4. 参考vllm的详细部署计划进行推理服务部署

5. 查看GitHub仓库以获取更多信息和文档

精选AI产品推荐

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。

AI模型多模态

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AI模型图像生成

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24