# 性能评估
性能评估
Procyon AI Computer Vision Benchmark
Procyon AI Computer Vision Benchmark是由UL Solutions开发的一款专业基准测试工具,旨在帮助用户评估不同AI推理引擎在Windows PC或Apple Mac上的性能表现。
开发与工具#性能评估
468
Procyon AI Image Generation Benchmark
Procyon AI Image Generation Benchmark 是一款由 UL Solutions 开发的基准测试工具,旨在为专业用户提供一个一致、准确且易于理解的工作负载,用以测量设备上 AI 加速器的推理性能。
AI模型#图像生成
864
P MMEval
P-MMEval是一个多语言基准测试,覆盖了基础和能力专业化的数据集。
研究工具#基准测试
588
Solidroad
Solidroad是一个AI优先的训练和评估平台,它将公司的知识库转化为沉浸式培训项目,易于培训者管理,同时为员工提供更吸引人的学习体验。
学习教育#培训
384
Geekbench AI
国外精选
Geekbench AI 是一款使用真实世界机器学习任务来评估AI工作负载性能的跨平台AI基准测试工具。
AI模型#性能评估
708
DCLM
优质新品
DataComp-LM (DCLM) 是一个为构建和训练大型语言模型(LLMs)而设计的综合性框架,提供了标准化的语料库、基于open_lm框架的高效预训练配方,以及超过50种评估方法。
AI模型#数据集构建开源
624
Video MME
Video-MME是一个专注于多模态大型语言模型(MLLMs)在视频分析领域性能评估的基准测试。
AI视频分析#视频分析开源
1,584
Opencompass Multi Modal Leaderboard
OpenCompass多模态排行榜是一个实时更新的平台,用于评估和排名不同的多模态模型(VLMs)。
AI信息平台#性能评估
11.15k
Artificial Analysis
国外精选
Artificial Analysis是一个专注于AI语言模型和API提供商的独立分析平台。
AI信息平台#模型比较
1,620
Insight Bridge
Insight Bridge是一个数据分析工具,它能够通过简单的问题,帮助用户理解和分析数据。
数据分析#自助式洞察力
480