# 推理能力
推理能力
Phi 4 Mini Instruct
Phi-4-mini-instruct 是微软推出的一款轻量级开源语言模型,属于 Phi-4 模型家族。
AI模型#多语言支持开源
660
Internvl2 5 26B MPO AWQ
InternVL2_5-26B-MPO-AWQ 是由 OpenGVLab 开发的多模态大型语言模型,旨在通过混合偏好优化提升模型的推理能力。
AI模型#大型语言模型开源
612
Eurus 2 7B PRIME
PRIME-RL/Eurus-2-7B-PRIME是一个基于PRIME方法训练的7B参数的语言模型,旨在通过在线强化学习提升语言模型的推理能力。
模型训练与部署#推理能力开源
600
Eurusprm Stage1
EurusPRM-Stage1是PRIME-RL项目的一部分,旨在通过隐式过程奖励来增强生成模型的推理能力。
AI模型#隐式过程奖励开源
300
PRIME RL
PRIME是一个开源的在线强化学习解决方案,通过隐式过程奖励来增强语言模型的推理能力。
模型训练与部署#推理能力开源
684
Rstar
rStar是一个自我博弈相互推理方法,它通过将推理过程分解为解决方案生成和相互验证,显著提升了小型语言模型(SLMs)的推理能力,无需微调或使用更高级的模型。
AI模型#自然语言处理开源
684
Internlm2.5 7B Chat 1M
InternLM2.5-7B-Chat-1M 是一个开源的70亿参数的对话模型,具有卓越的推理能力,在数学推理方面超越了同量级模型。
AI模型#对话模型开源
768
Internlm2.5 7B Chat
InternLM2.5-7B-Chat是一个开源的7亿参数的中文对话模型,专为实用场景设计,具有卓越的推理能力,在数学推理方面超越了Llama3和Gemma2-9B等模型。
AI聊天机器人#推理能力开源
792