# 开源模型

Camerabench
CameraBench 是一个用于分析视频中相机运动的模型,旨在通过视频理解相机的运动模式。
研究工具#相机运动开源
396

Hidream I1
HiDream-I1 是一款新型的开源图像生成基础模型,拥有 170 亿个参数,能够在几秒内生成高质量图像。
AI模型#开源模型开源
8,124

Together Chat
Together Chat 是一个安全的 AI 聊天平台,提供 100 条免费消息每天,适合需要私密对话和高质量交互的用户。
聊天机器人#隐私保护
972

Wan 2.1 AI
Wan 2.1 AI 是由阿里巴巴开发的开源大规模视频生成 AI 模型。
视频生成#文本到视频
1,908

CSM 1B
CSM 1B 是一个基于 Llama 架构的语音生成模型,能够从文本和音频输入中生成 RVQ 音频代码。
语音生成#文本到语音开源
2,568

Gemma 3
Gemma 3 是 Google 推出的最新开源模型,基于 Gemini 2.0 的研究和技术开发。
AI模型#开源模型
3,408

Hunyuanvideo I2V
HunyuanVideo-I2V 是腾讯开源的图像到视频生成模型,基于 HunyuanVideo 架构开发。
视频生成#人工智能开源
1,452

Wan2.1 T2V 14B
Wan2.1-T2V-14B 是一款先进的文本到视频生成模型,基于扩散变换器架构,结合了创新的时空变分自编码器(VAE)和大规模数据训练。
视频生成#文本到视频开源
1,476

Wan
中文精选
Wan是阿里巴巴通义实验室开发的先进视觉生成模型,具备强大的视频生成能力。
视频生成#人工智能
600

PIKE RAG
PIKE-RAG 是微软开发的一种领域知识和推理增强生成模型,旨在通过知识提取、存储和推理逻辑增强大型语言模型(LLM)的能力。
研究工具#推理增强开源
1,416

Skyreels V1 Hunyuan I2V
SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。
视频生成#人工智能开源
1,716

Skyreels V1
SkyReels-V1 是一个开源的人类中心视频基础模型,基于高质量影视片段微调,专注于生成高质量的视频内容。
视频生成#人工智能开源
1,392

Deepscaler 1.5B Preview
DeepScaleR-1.5B-Preview 是一个经过强化学习优化的大型语言模型,专注于提升数学问题解决能力。
学习教育#强化学习开源
1,200

Lumina Video
Lumina-Video 是 Alpha-VLLM 团队开发的一个视频生成模型,主要用于从文本生成高质量的视频内容。
视频生成#人工智能开源
1,284

Zonos V0.1
Zonos-v0.1 是 Zyphra 团队开发的实时文本转语音(TTS)模型,具备高保真语音克隆功能。
语音克隆#语音克隆
984

Hibiki
Hibiki 是一款专注于流式语音翻译的先进模型。
翻译#实时翻译开源
960

Qwen2.5 1M
Qwen2.5-1M 是一款开源的人工智能语言模型,专为处理长序列任务而设计,支持最多100万Token的上下文长度。
AI模型#开源模型开源
816

BEN2
BEN2(Background Erase Network)是一个创新的图像分割模型,采用了Confidence Guided Matting(CGM)流程。
图片编辑#背景擦除开源
852

Yue
优质新品
YuE 是由香港科技大学和多模态艺术投影团队开发的开源音乐生成模型。
音乐生成#人工智能开源
1,920

Llasa 1B
Llasa-1B 是一个由香港科技大学音频实验室开发的文本转语音模型。
文本转声音#语音合成开源
1,596

Llasa 3B
Llasa-3B 是一个强大的文本到语音(TTS)模型,基于 LLaMA 架构开发,专注于中英文语音合成。
文本转声音#语音合成开源
3,144

Minirag
MiniRAG是一个针对小型语言模型设计的检索增强生成系统,旨在简化RAG流程并提高效率。
模型训练与部署#小型语言模型开源
708

Mattergen
MatterGen是微软研究院推出的一种生成式AI工具,用于材料设计。
研究工具#材料设计
2,472

Kokoro 82M
Kokoro-82M是一个由hexgrad创建并托管在Hugging Face上的文本到语音(TTS)模型。
文本转声音#语音合成开源
3,480

Llama 3 Patronus Lynx 8B Instruct
Llama-3-Patronus-Lynx-8B-Instruct是由Patronus AI开发的一个基于meta-llama/Meta-Llama-3-8B-Instruct模型的微调版本,主要用于检测在RAG设置中的幻觉。
模型训练与部署#幻觉检测开源
336

Meta Video Seal
Meta Video Seal是一个先进的开源视频水印模型,能够在视频编辑后仍嵌入持久、不可见的水印。
视频编辑#版权保护
900

Olmo 2 1124 13B Instruct
OLMo-2-1124-13B-Instruct是由Allen AI研究所开发的一款大型语言模型,专注于文本生成和对话任务。
聊天机器人#对话系统开源
468

Olmo 2 1124 7B Instruct
OLMo-2-1124-7B-Instruct是由Allen人工智能研究所开发的一个大型语言模型,专注于对话生成任务。
聊天机器人#对话生成开源
312

Allegro TI2V
Allegro-TI2V是一个文本图像到视频生成模型,它能够根据用户提供的提示和图像生成视频内容。
视频生成#视频生成开源
840

Llama 3.1 Tulu 3 70B DPO
Llama-3.1-Tulu-3-70B-DPO是Tülu3模型家族的一部分,专为现代后训练技术提供全面指南。
#文本生成开源
408

Llama 3.1 Tulu 3 70B
Llama-3.1-Tulu-3-70B是Tülu3模型家族中的一员,专为现代后训练技术提供全面的指南。
#文本生成开源
396

Qwen2.5 Coder 1.5B Instruct GPTQ Int4
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。
#代码推理开源
240

Qwen2.5 Coder 1.5B Instruct AWQ
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、推理和修复而设计。
#代码推理开源
228

Qwen2.5 Coder 3B Instruct GPTQ Int8
Qwen2.5-Coder-3B-Instruct-GPTQ-Int8是Qwen2.5-Coder系列中的一种大型语言模型,专门针对代码生成、代码推理和代码修复进行了优化。
#代码推理开源
336

Qwen2.5 Coder 3B Instruct GGUF
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。
#代码推理开源
312

Qwen2.5 Coder 32B Instruct GPTQ Int8
Qwen2.5-Coder-32B-Instruct-GPTQ-Int8是Qwen系列中针对代码生成优化的大型语言模型,拥有32亿参数,支持长文本处理,是当前开源代码生成领域最先进的模型之一。
#长文本处理开源
576

Qwen2.5 Coder 32B Instruct AWQ
Qwen2.5-Coder是一系列针对代码生成优化的大型语言模型,覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。
#代码推理开源
456

Qwen2.5 Coder 1.5B
Qwen2.5-Coder-1.5B是Qwen2.5-Coder系列中的一款大型语言模型,专注于代码生成、代码推理和代码修复。
代码助手#代码推理开源
432

Qwen2.5 Coder 1.5B Instruct
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。
代码助手#代码推理开源
276

Qwen2.5 Coder 3B Instruct
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。
代码助手#代码推理开源
636
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k