# 评估工具

SFR Judge
SFR-Judge 是 Salesforce AI Research 推出的一系列评估模型,旨在通过人工智能技术加速大型语言模型(LLMs)的评估和微调过程。
AI模型#评估工具
324

1X World Model
1X 世界模型是一种机器学习程序,能够模拟世界如何响应机器人的行为。
模型训练与部署#虚拟模拟
408

Weavel
优质新品
Weavel是一个AI提示工程师,它通过追踪、数据集管理、批量测试和评估等功能,帮助用户优化大型语言模型(LLM)的应用。
开发与工具#数据集管理
372

Ragelo
优质新品
RAGElo是一个工具集,使用Elo评分系统帮助选择最佳的基于检索增强生成(RAG)的大型语言模型(LLM)代理。
AI模型#RAG开源
768

TC Bench
优质新品
TC-Bench是一个专门用于评估视频生成模型的时间组合性的工具。
AI视频生成#评估工具开源
708

Prometheus Eval
Prometheus-Eval 是一个用于评估大型语言模型(LLM)在生成任务中表现的开源工具集。
AI模型#语言模型开源
672

Multi Modal Large Language Models
该工具旨在通过对最新专有和开源MLLMs进行定性研究,从文本、代码、图像和视频四个模态的角度,评估其泛化能力、可信度和因果推理能力,以提高MLLMs的透明度。
AI模型评测#评估工具开源
516

Unitxt
Unitxt是一款创新的库,专为生成式语言模型量身定制,用于定制文本数据准备和评估。
AI开发助手#生成式AI开源
480

Openlayer
Openlayer是一个评估工具,适用于您的开发和生产流程,帮助您自信地发布高质量的模型。
模型训练与部署#模型测试
348
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k