简介
DeepScaleR-1.5B-Preview 是一个经过强化学习优化的大型语言模型,专注于提升数学问题解决能力。该模型通过分布式强化学习算法,显著提高了在长文本推理场景下的准确率。其主要优点包括高效的训练策略、显著的性能提升以及开源的灵活性。该模型由加州大学伯克利分校的 Sky Computing Lab 和 Berkeley AI Research 团队开发,旨在推动人工智能在教育领域的应用,尤其是在数学教育和竞赛数学领域。模型采用 MIT 开源许可,完全免费供研究人员和开发者使用。
截图

产品特色
使用分布式强化学习算法优化模型性能
支持长文本上下文(最长可达24K),提升复杂问题解决能力
基于大规模数学问题数据集进行训练,覆盖 AIME、AMC 等竞赛题目
提供高效的推理服务支持,兼容多种高性能推理系统
开源模型架构和训练方法,便于开发者二次开发和研究
使用教程
1. 访问 Hugging Face 网站并下载 DeepScaleR-1.5B-Preview 模型文件。
2. 安装支持的推理系统(如 vLLM 或 Hugging Face Text Generation Inference)。
3. 将模型加载到推理系统中,配置合适的参数(如上下文长度、采样策略等)。
4. 使用模型进行数学问题的推理和解答,通过 API 接口调用模型服务。
5. 根据实际需求对模型输出进行解析和处理,例如提取答案、生成解题步骤等。
流量来源
直接访问 | 48.39% | 外链引荐 | 35.85% | 邮件 | 0.03% |
自然搜索 | 12.76% | 社交媒体 | 2.96% | 展示广告 | 0.02% |
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图
同类开源产品

MIT MAIA
优质新品
MAIA(Multimodal Automated Interpretability Agent)是由MIT计算机科学与人工智能实验室(CSAIL)开发的一个自动化系统,旨在提高人工智能模型的解释性。
研究工具#自动化

Migo AI文献阅读助手
中文精选
Migo AI文献阅读助手是一个集成了先进 AI 技术的文献阅读工具,旨在提升学术研究和文献阅读效率。
学习教育#教育

Coguide
CoGuide是一款AI驱动的教育平台,为教育工作者节省大量时间,从单词输入中生成教学内容。
学习教育#AI

Arxiv Summarizer
该产品是一个 Python 脚本,利用 Gemini API 从 arXiv 获取和总结研究论文。
研究工具#论文摘要

Kazu Navi (かずナビ)
Kazu Navi是一款人工智能辅助学习工具,通过解析语法结构和句子,帮助用户更好地掌握日语数字和语法,提高学习效率。
学习教育#语法分析

Speakingai
SpeakingAI是一个通过与AI导师进行真实对话来提高口语能力的工具。
学习教育#口语练习

Surfsense
SurfSense 是一款开源的 AI 研究助手,它将多种外部资源(如搜索引擎、Slack、Notion 等)整合在一起,帮助用户高效地进行研究和信息管理。
研究工具#信息管理

Deerflow
DeerFlow 是一个深度研究框架,旨在结合语言模型与如网页搜索、爬虫及 Python 执行等专用工具,以推动深入研究工作。
研究工具#开源

Gyata
Gyata.AI是一款个性化AI课程创建平台,利用人工智能技术将视频转化为个性化课程,帮助学习者更高效地学习。
学习教育#人工智能
替代品

Arxiv Summarizer
该产品是一个 Python 脚本,利用 Gemini API 从 arXiv 获取和总结研究论文。
研究工具#论文摘要

Surfsense
SurfSense 是一款开源的 AI 研究助手,它将多种外部资源(如搜索引擎、Slack、Notion 等)整合在一起,帮助用户高效地进行研究和信息管理。
研究工具#信息管理

Deerflow
DeerFlow 是一个深度研究框架,旨在结合语言模型与如网页搜索、爬虫及 Python 执行等专用工具,以推动深入研究工作。
研究工具#开源

Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动

Smoldocling
SmolDocling-256M-preview是由ds4sd推出的一个具有256M参数的语言模型,专注于医学领域。
研究工具#医学文本处理

LBM
该产品是基于格子玻尔兹曼方法(LBM)的项目,格子玻尔兹曼方法是一种用于计算流体动力学的数值技术,通过模拟微观粒子的运动来描述宏观流体行为。
研究工具#流体动力学

Google CameraTrapAI
Google CameraTrapAI 是一个用于野生动物图像分类的 AI 模型集合。
研究工具#野生动物

Shandu
Shandu是一个基于AI的研究系统,能够通过多源信息合成和深度迭代探索生成全面的研究报告。
研究工具#多源信息合成

Deep Research Web UI
该产品是一个基于Web的AI研究工具,旨在帮助用户快速、深入地进行主题研究。
研究工具#研究
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k