# 高效推理
高效推理
Inception Labs
国外精选
Inception Labs 是一家专注于开发扩散式大语言模型(dLLMs)的公司。
AI模型#语言模型
1,968
AI21 Jamba Large 1.6
AI21-Jamba-Large-1.6 是由 AI21 Labs 开发的混合 SSM-Transformer 架构基础模型,专为长文本处理和高效推理而设计。
模型训练与部署#高效推理开源
768
Deepseek Japanese
DeepSeek 是由 High-Flyer 基金支持的中国 AI 实验室开发的先进语言模型,专注于开源模型和创新训练方法。
AI模型#语言模型
1,116
Moonlight
Moonlight是基于Muon优化器训练的16B参数混合专家模型(MoE),在大规模训练中表现出色。
AI模型#模型优化开源
564
Qwen2.5 1M
Qwen2.5-1M 是一款开源的人工智能语言模型,专为处理长序列任务而设计,支持最多100万Token的上下文长度。
AI模型#开源模型开源
816
Mistral Small 24B Instruct 2501
Mistral Small 24B 是一款由 Mistral AI 团队开发的大型语言模型,拥有 240 亿参数,支持多语言对话和指令处理。
聊天机器人#多语言开源
384
Pengchengstarling
PengChengStarling 是一个专注于多语言自动语音识别(ASR)的开源工具包,基于 icefall 项目开发。
语音识别#自动语音识别开源
948
Doubao 1.5 Pro
中文精选
Doubao-1.5-pro 是由豆包团队开发的高性能稀疏 MoE(Mixture of Experts)大语言模型。
AI模型#多模态
6,456
Qwq 32B Preview Gptqmodel 4bit Vortex V3
该产品是一个基于Qwen2.5-32B的4位量化语言模型,通过GPTQ技术实现高效推理和低资源消耗。
聊天机器人#量化开源
816
Minicpm O 2 6
MiniCPM-o 2.6是MiniCPM-o系列中最新且功能最强大的模型。
AI模型#语言模型开源
1,452
Moondream AI
Moondream AI是一个开源的视觉语言模型,具有强大的多模态处理能力。
AI模型#开源
516
Smollm
优质新品
SmolLM是一系列最新的小型语言模型,包含135M、360M和1.7B参数的版本。
AI模型#本地设备开源
2,052
Asyncdiff
AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。
AI图像生成#文本到图像开源
612
Universal 1
探索 AssemblyAI 当前的研究、新闻和有关语音 AI 技术的更新。
AI语音识别#研究
1,584