Xiaomi MiMo
Xiaomi MiMo
Xiaomi MiMo适合需要高效推理能力的研究人员、开发者和企业。其强大的数学推理和代码生成能力使其在学术研究、软件开发、数据分析和教育等领域具有广泛的应用前景。对于研究人员来说,MiMo提供了强大的推理工具,有助于推动人工智能在推理领域
总访问量: 0
2,004
简介
Xiaomi MiMo是小米公司开源的首个推理大模型,专为推理任务设计,具备卓越的数学推理和代码生成能力。该模型在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上表现出色,仅用7B的参数规模就超越了OpenAI的o1-mini和阿里Qwen的QwQ-32B-Preview等更大规模的模型。MiMo通过预训练和后训练阶段的多层面创新,包括数据挖掘、训练策略和强化学习算法等,显著提升了推理能力。该模型的开源为研究人员和开发者提供了强大的工具,推动了人工智能在推理领域的进一步发展。
截图
产品特色
预训练阶段,着重挖掘富推理语料,合成约200B tokens推理数据,确保模型见过更多推理模式。
进行三阶段训练,逐步提升训练难度,总训练量达到25T tokens,全面提升模型的推理能力。
在后训练阶段,提出Test Difficulty Driven Reward策略,缓解困难算法问题中的奖励稀疏问题,引入Easy Data Re-Sampling策略,稳定RL训练。
设计Seamless Rollout系统,加速RL训练和验证,分别提升2.29倍和1.96倍的效率。
在数学推理和代码竞赛公开测评集上,MiMo-7B的性能显著领先于其他同规模模型。
MiMo-7B全系列已开源,提供4个模型至HuggingFace,方便研究人员和开发者使用。
技术细节已在GitHub公开,包括完整的训练报告和技术文档,方便社区交流和进一步研究。
MiMo模型由小米大模型Core团队开发,展示了小米在人工智能领域的创新能力和技术实力。
使用教程
访问HuggingFace上的MiMo模型页面:
下载并安装所需的MiMo模型版本。
使用HuggingFace提供的API或工具加载模型,并进行推理任务。
根据需要对模型进行微调,以适应特定的推理任务或数据集。
利用MiMo的技术报告和文档,深入了解模型的训练细节和使用技巧。
流量来源
直接访问0.00%外链引荐0.00%邮件0.00%
自然搜索0.00%社交媒体0.00%展示广告0.00%
最新流量情况
月访问量
0
平均访问时长
0.00
每次访问页数
0.00
跳出率
0
总流量趋势图
同类开源产品
Dmind
DMind-1 和 DMind-1-mini 是针对 Web3 任务的领域专用大型语言模型,提供比其他通用模型更高的领域准确性、指令跟随能力及专业理解。
AI模型#人工智能
Jules AI
国外精选
Jules 是一个异步编码代理,可以自动处理你不想做的编码任务,从而让你有更多时间专注于核心编程。
代码助手#开发编程
Basin MCP
Basin是首款为AI代码编辑器设计的可靠性MCP工具,通过即时识别和标记问题,停止代码生成幻觉,让您轻松高效地进行编码。
代码助手#可靠性
Windsurf Wave 9
SWE-1 是windsurf_ai首个为整个软件工程流程优化的模型家族,旨在加速软件开发 99%。
代码助手#模型
CodeBuddy
中文精选
腾讯云代码助手 CodeBuddy 是一款辅助编码工具,基于混元代码大模型,提供技术对话、代码补全、代码诊断和优化等能力。
代码助手#编程工具
Matter AI
Matter AI 是一款工程智能平台,可加速代码审查,帮助团队在Pull Requests中消除高达95%的错误、安全问题和漏洞。
代码助手#代码审查
Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理
Ghostcoder
Ghostcoder是一个AI编程助手,能够在技术面试中提供隐形支持,帮助用户解决编程问题并加速代码编写。
代码助手#编程助手
Seed Coder
Seed-Coder 是字节跳动 Seed 团队推出的开源代码大型语言模型系列,包含基础、指令和推理模型,旨在通过最小的人力投入,自主管理代码训练数据,从而显著提升编程能力。
代码助手#大型语言模型