Awesome LLM Post Training
Awesome LLM Post Training
该资源库适合从事自然语言处理、人工智能研究的学者、开发者以及对大型语言模型后训练感兴趣的专业人士。它为研究人员提供了丰富的研究论文和代码实现,帮助他们快速了解和应用最新的后训练技术;为开发者提供了实用的框架和工具,便于他们在实际项目中快速实
总访问量: 492,133,528
占比最多地区: US(19.34%)
1,332
简介
Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。它提供了关于 LLM 后训练的深入研究,包括教程、调查和指南。该资源库基于论文《LLM Post-Training: A Deep Dive into Reasoning Large Language Models》,旨在帮助研究人员和开发者更好地理解和应用 LLM 后训练技术。该资源库免费开放,适合学术研究和工业应用。
截图
产品特色
提供关于 LLM 后训练的最新研究论文和资源。
包含详细的调查和教程,帮助用户快速上手。
提供多种 LLM 后训练方法的代码实现和框架。
支持多种语言模型和后训练技术的实验。
提供丰富的基准测试和应用场景,验证后训练效果。
支持社区贡献,用户可以提交自己的研究和代码。
提供详细的文档和教程,帮助新手快速入门。
使用教程
1. 访问项目主页,浏览 README 文件了解项目概览。
2. 根据需求选择相关的论文、代码或教程资源。
3. 如果需要使用代码,克隆仓库到本地,并按照文档中的说明进行安装和配置。
4. 使用提供的框架和工具进行实验,验证后训练效果。
5. 如果有新的研究成果或代码,可以提交 Pull Request 贡献到项目中。
6. 参与社区讨论,与其他研究人员和开发者交流经验。
7. 利用提供的基准测试和应用场景,评估和优化自己的后训练方法。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品
MIT MAIA
优质新品
MAIA(Multimodal Automated Interpretability Agent)是由MIT计算机科学与人工智能实验室(CSAIL)开发的一个自动化系统,旨在提高人工智能模型的解释性。
研究工具#自动化
Arxiv Summarizer
该产品是一个 Python 脚本,利用 Gemini API 从 arXiv 获取和总结研究论文。
研究工具#论文摘要
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Surfsense
SurfSense 是一款开源的 AI 研究助手,它将多种外部资源(如搜索引擎、Slack、Notion 等)整合在一起,帮助用户高效地进行研究和信息管理。
研究工具#信息管理
Deerflow
DeerFlow 是一个深度研究框架,旨在结合语言模型与如网页搜索、爬虫及 Python 执行等专用工具,以推动深入研究工作。
研究工具#开源
Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Genprm
GenPRM 是一种新兴的过程奖励模型(PRM),通过生成推理来提高在测试时的计算效率。
模型训练与部署#生成推理
Atypica.ai
中文精选
Atypica.AI 是一个专注于商业研究的智能体框架,利用语言模型来分析和理解消费者情绪、市场认知与决策偏好。
研究工具#消费者行为
替代品
Arxiv Summarizer
该产品是一个 Python 脚本,利用 Gemini API 从 arXiv 获取和总结研究论文。
研究工具#论文摘要
MNN LLM Android App
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。
模型训练与部署#人工智能
Surfsense
SurfSense 是一款开源的 AI 研究助手,它将多种外部资源(如搜索引擎、Slack、Notion 等)整合在一起,帮助用户高效地进行研究和信息管理。
研究工具#信息管理
Deerflow
DeerFlow 是一个深度研究框架,旨在结合语言模型与如网页搜索、爬虫及 Python 执行等专用工具,以推动深入研究工作。
研究工具#开源
Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动
Search R1
Search-R1 是一个强化学习框架,旨在训练能够进行推理和调用搜索引擎的语言模型(LLMs)。
模型训练与部署#自然语言处理
Arthur Engine
Arthur Engine 是一个旨在监控和治理 AI/ML 工作负载的工具,利用流行的开源技术和框架。
模型训练与部署#机器学习
Smoldocling
SmolDocling-256M-preview是由ds4sd推出的一个具有256M参数的语言模型,专注于医学领域。
研究工具#医学文本处理
Factorio学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。
模型训练与部署#Factorio游戏