简介
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。它基于 veRL 构建,支持多种强化学习方法和不同的 LLM 架构,使得在工具增强的推理研究和开发中具备高效性和可扩展性。
截图

产品特色
支持多种强化学习方法(如 PPO、GRPO、reinforce),满足不同训练需求。
兼容多种语言模型(如 Llama3、Qwen2.5),方便用户选择合适的基础模型。
可以使用本地稀疏 / 密集检索器及在线搜索引擎,灵活应对不同场景。
提供多节点训练,支持 30B 以上的 LLMs,提升训练效率。
开放源码,促进工具增强的 LLM 推理的研究与开发。
支持自定义数据集和搜索引擎,满足个性化需求。
记录完整的实验日志,便于复现与分析。
提供便捷的安装和快速启动指南,降低使用门槛。
使用教程
安装环境并准备依赖项。
下载索引和语料库。
处理训练数据集。
启动本地检索服务器。
运行强化学习训练脚本。
流量来源
直接访问 | 51.61% | 外链引荐 | 33.46% | 邮件 | 0.04% |
自然搜索 | 12.58% | 社交媒体 | 2.19% | 展示广告 | 0.11% |
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品

Appearonai
AppearOnAI致力于提升网站在AI聊天机器人中的可见性,通过专业建议和见解帮助用户优化其在线存在,以适应AI时代的发展。
AI搜索#AI优化

MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能

Synthanswer AI
SynthAnswer AI是一款AI问答助手,能够通过截图获取问题并在几秒内提供准确答案。
AI搜索#学习

AI Answer Generator
AI Answer Generator是一个由先进AI模型驱动的在线工具,可以即时生成与输入问题相关的准确答案。
AI搜索#研究

Unoffended Labs
Unoffended Labs是一个提供AI推荐和智能搜索功能的购物体验平台。
AI搜索#购物体验

百度AI开放计划
中文精选
百度搜索开放平台的AI开放计划为应用开发者提供亿级精准流量分发的机会。
AI搜索#AI 技术

Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理

Brave Search MCP Server
Brave Search MCP Server 是由 Brave Software 开发的网络搜索工具,拥有超过 100 亿网页的索引,支持本地搜索功能,能快速提供用户需要的信息,适合寻找实时、本地化的商家和服务。
AI搜索#本地搜索

Genprm
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。
模型训练与部署#生成推理
替代品

MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能

Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理

Brave Search MCP Server
Brave Search MCP Server 是由 Brave Software 开发的网络搜索工具,拥有超过 100 亿网页的索引,支持本地搜索功能,能快速提供用户需要的信息,适合寻找实时、本地化的商家和服务。
AI搜索#本地搜索

Arthur Engine
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。
模型训练与部署#机器学习

Factorio学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。
模型训练与部署#Factorio游戏

Light R1
Light-R1 是一个由 Qihoo360 开发的开源项目,旨在通过课程式监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)训练长链推理模型。
模型训练与部署#长链推理

Awesome LLM Post Training
Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。
模型训练与部署#后训练

Bytedance Flux
Flux 是由字节跳动开发的一个高性能通信重叠库,专为 GPU 上的张量和专家并行设计。
模型训练与部署#并行计算

Aot
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。
模型训练与部署#推理框架
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k