Search R1
适合研究人员和开发者,他们需要高效的工具增强推理模型,能够灵活调用搜索引擎以获取信息和提高模型性能。
总访问量: 492,133,528
占比最多地区: US(19.34%)
1,080
简介
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。它基于 veRL 构建,支持多种强化学习方法和不同的 LLM 架构,使得在工具增强的推理研究和开发中具备高效性和可扩展性。
截图
产品特色
支持多种强化学习方法(如 PPO、GRPO、reinforce),满足不同训练需求。
兼容多种语言模型(如 Llama3、Qwen2.5),方便用户选择合适的基础模型。
可以使用本地稀疏 / 密集检索器及在线搜索引擎,灵活应对不同场景。
提供多节点训练,支持 30B 以上的 LLMs,提升训练效率。
开放源码,促进工具增强的 LLM 推理的研究与开发。
支持自定义数据集和搜索引擎,满足个性化需求。
记录完整的实验日志,便于复现与分析。
提供便捷的安装和快速启动指南,降低使用门槛。
使用教程
安装环境并准备依赖项。
下载索引和语料库。
处理训练数据集。
启动本地检索服务器。
运行强化学习训练脚本。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
Appearonai
AppearOnAI致力于提升网站在AI聊天机器人中的可见性,通过专业建议和见解帮助用户优化其在线存在,以适应AI时代的发展。
AI搜索#AI优化
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Synthanswer AI
SynthAnswer AI是一款AI问答助手,能够通过截图获取问题并在几秒内提供准确答案。
AI搜索#学习
AI Answer Generator
AI Answer Generator是一个由先进AI模型驱动的在线工具,可以即时生成与输入问题相关的准确答案。
AI搜索#研究
Unoffended Labs
Unoffended Labs是一个提供AI推荐和智能搜索功能的购物体验平台。
AI搜索#购物体验
百度AI开放计划
中文精选
百度搜索开放平台的AI开放计划为应用开发者提供亿级精准流量分发的机会。
AI搜索#AI 技术
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Brave Search MCP Server
Brave Search MCP Server 是由 Brave Software 开发的网络搜索工具,拥有超过 100 亿网页的索引,支持本地搜索功能,能快速提供用户需要的信息,适合寻找实时、本地化的商家和服务。
AI搜索#本地搜索
Genprm
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。
模型训练与部署#生成推理
替代品
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Brave Search MCP Server
Brave Search MCP Server 是由 Brave Software 开发的网络搜索工具,拥有超过 100 亿网页的索引,支持本地搜索功能,能快速提供用户需要的信息,适合寻找实时、本地化的商家和服务。
AI搜索#本地搜索
Arthur Engine
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。
模型训练与部署#机器学习
Factorio学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。
模型训练与部署#Factorio游戏
Light R1
Light-R1 是一个由 Qihoo360 开发的开源项目,旨在通过课程式监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)训练长链推理模型。
模型训练与部署#长链推理
Awesome LLM Post Training
Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。
模型训练与部署#后训练
Bytedance Flux
Flux 是由字节跳动开发的一个高性能通信重叠库,专为 GPU 上的张量和专家并行设计。
模型训练与部署#并行计算
Aot
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。
模型训练与部署#推理框架