# 推理模型
推理模型
混元T1
中文精选
混元T1 是腾讯推出的超大规模推理模型,基于强化学习技术,通过大量后训练显著提升推理能力。
AI模型#人工智能
2,460
Reka Flash 3
Reka Flash 3 是一款从零开始训练的 21 亿参数的通用推理模型,利用合成和公共数据集进行监督微调,结合基于模型和基于规则的奖励进行强化学习。
AI模型#自然语言处理开源
2,232
EXAONE Deep
EXAONE Deep 是 LG AI Research 推出的先进推理 AI 模型,标志着韩国在全球 AI 市场中的竞争力。
AI模型#推理模型开源
1,824
Steiner 32b Preview
Steiner 是由 Yichao 'Peak' Ji 开发的推理模型系列,专注于通过强化学习在合成数据上训练,能够在推理时探索多种路径并自主验证或回溯。
AI模型#强化学习开源
1,416
UIGEN T1 Qwen 7b
UIGEN-T1-Qwen-7b 是一个专注于 UI 推理生成的大型语言模型。
AI设计工具#前端开发开源
960
Openthinker 32B
OpenThinker-32B 是由 Open Thoughts 团队开发的一款开源推理模型。
AI模型#推理模型
4,332
S1 32B
s1是一个推理模型,专注于通过少量样本实现高效的文本生成能力。
写作助手#推理模型开源
1,212
Open Thoughts
Open Thoughts 是一个由 Bespoke Labs 和 DataComp 社区主导的项目,旨在整理高质量的开源推理数据集,用于训练先进的小模型。
AI模型#推理模型
1,092
Dolphin R1
Dolphin R1是一个由Cognitive Computations团队创建的数据集,旨在训练类似DeepSeek-R1 Distill模型的推理模型。
AI模型#推理模型开源
1,224
Openai O3 Mini
国外精选
OpenAI o3-mini 是 OpenAI 推出的最新推理模型,专为科学、技术、工程和数学(STEM)领域优化。
AI模型#推理模型
2,004
Deepseek R1 Distill Qwen 7B
DeepSeek-R1-Distill-Qwen-7B 是一个经过强化学习优化的推理模型,基于 Qwen-7B 进行了蒸馏优化。
模型训练与部署#推理模型开源
5,004
Deepseek R1 Zero
中文精选
DeepSeek-R1-Zero 是由 DeepSeek 团队开发的推理模型,专注于通过强化学习提升模型的推理能力。
AI模型#推理模型开源
2,604
Deepseek R1
中文精选
DeepSeek-R1 是 DeepSeek 团队推出的第一代推理模型,通过大规模强化学习训练,无需监督微调即可展现出卓越的推理能力。
AI模型#推理模型开源
19.72k
Openai O3
国外精选
OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。
AI模型#推理模型
1,692
Internthinker
中文精选
InternThinker是上海人工智能实验室(上海AI实验室)研发的一款强推理AI模型,致力于通过“通专融合”路径探索开放、可控、可信的通用人工智能(AGI)。
AI模型#通用人工智能
792
Marco O1
Marco-o1是一个开放的大型推理模型,旨在通过先进的技术如Chain-of-Thought (CoT) fine-tuning、Monte Carlo Tree Search (MCTS)、反射机制和创新的推理策略,优化复杂现实世界问题
#机器学习开源
1,068