# 文本到视频

Wan 2.1 AI
Wan 2.1 AI 是由阿里巴巴开发的开源大规模视频生成 AI 模型。
视频生成#文本到视频
1,908

Wan2gp
Wan2GP 是基于 Wan2.1 的改进版本,旨在为低配置 GPU 用户提供高效、低内存占用的视频生成解决方案。
视频生成#AI开源
1,404

Wan2.1 T2V 14B
Wan2.1-T2V-14B 是一款先进的文本到视频生成模型,基于扩散变换器架构,结合了创新的时空变分自编码器(VAE)和大规模数据训练。
视频生成#文本到视频开源
1,476

Flashvideo
FlashVideo 是一款专注于高效高分辨率视频生成的深度学习模型。
视频生成#高效计算开源
624

Magic 1 For 1
Magic 1-For-1 是一个专注于高效视频生成的模型,其核心功能是将文本和图像快速转换为视频。
视频生成#AI 模型开源
1,428

STAR
STAR是一种创新的视频超分辨率技术,通过将文本到视频扩散模型与视频超分辨率相结合,解决了传统GAN方法中存在的过度平滑问题。
视频生成#文本到视频开源
1,668

Clipvideo AI
ClipVideo AI是一个专业的AI视频生成平台,它利用人工智能技术将照片或简单的文本提示转换成引人入胜的视频。
视频生成#文本到视频
1,632

Videovaeplus
这是一个视频变分自编码器(VAE),旨在减少视频冗余并促进高效视频生成。
视频生成#变分自编码器开源
360

Zebracat
Zebracat是一个利用人工智能技术,帮助用户将文本、博客内容快速转换成专业视频的平台。
视频生成#文本到视频
960

Pollo AI
国外精选
Pollo AI是一个创新的AI视频生成器,它允许用户轻松创建令人惊叹的视频。
视频生成#文本到视频
2,844

Consisid
ConsisID是一个基于频率分解的身份保持文本到视频生成模型,它通过在频域中使用身份控制信号来生成与输入文本描述一致的高保真度视频。
视频生成#身份保持开源
1,056

Allegro TI2V
Allegro-TI2V是一个文本图像到视频生成模型,它能够根据用户提供的提示和图像生成视频内容。
视频生成#视频生成开源
840

Pyramid Flow Miniflux
Pyramid Flow miniFLUX是一个基于流匹配的自回归视频生成方法,专注于训练效率和开源数据集的使用。
#流匹配开源
720

Cogvideox1.5 5B SAT
CogVideoX1.5-5B-SAT是由清华大学知识工程与数据挖掘团队开发的开源视频生成模型,是CogVideoX模型的升级版。
视频生成#文本到视频开源
1,572

Hailuo AI.org
Hailuo AI是由MiniMax开发的一款先进的人工智能生产力工具,旨在改变视频内容创作的方式。
视频生成#文本到视频
1,836

Viral Video
Viral Video是一个利用人工智能技术帮助用户快速创建病毒式视频的在线平台。
视频生成#文本到视频
1,284

Mochi 1
国外精选
Mochi 1 是 Genmo 公司推出的一款研究预览版本的开源视频生成模型,它致力于解决当前AI视频领域的基本问题。
视频生成#开源模型
756

Allegro
Allegro是由Rhymes AI开发的高级文本到视频模型,它能够将简单的文本提示转换成高质量的短视频片段。
视频生成#文本到视频开源
744

Dream Machine API
Dream Machine API是一个创意智能平台,它提供了一系列先进的视频生成模型,通过直观的API和开源SDKs,用户可以构建和扩展创意AI产品。
AI视频生成#创意智能
804

AI Youtube Shorts Generator
AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。
AI视频编辑#视频编辑开源
960

Cogvideo
CogVideo是由清华大学团队开发的文本到视频生成模型,它通过深度学习技术将文本描述转换为视频内容。
AI视频生成#深度学习开源
1,044

Cogvideox 5B
CogVideoX是一个开源的视频生成模型,由清华大学团队开发,支持从文本描述生成视频。
AI视频生成#人工智能开源
1,740

Dream Machine AI.online
Dream Machine AI是一个利用尖端技术将文字和图片转化为高质量视频的AI平台。
视频生成#高质量视频
2,016

Cogvideox
优质新品
CogVideoX是一个开源的视频生成模型,与商业模型同源,支持通过文本描述生成视频内容。
AI视频生成#文本到视频开源
1,272

Open Sora Plan V1.2
Open-Sora Plan v1.2是一个开源的视频生成模型,专注于文本到视频的转换任务。
AI视频生成#文本到视频开源
2,556

Asyncdiff
AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。
AI图像生成#文本到图像开源
612

Sharegpt4video
ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。
AI视频生成#文本到视频开源
1,596

Videotetris
优质新品
VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。
AI视频生成#视频生成开源
1,860

Dream Machine AI
优质新品
Dream Machine是由Luma Labs开发的一款先进的人工智能模型,旨在快速从文本和图片生成高质量的、逼真的视频。
视频生成#文本到视频
1,164

Motionclone
优质新品
MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。
AI视频生成#运动克隆开源
1,320

Follow Your Pose
Follow-Your-Pose是一个文本到视频生成的模型,它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。
AI视频生成#姿势引导开源
2,628

Open Sora Plan V1.1.0
Open-Sora-Plan是一个由北京大学元组团队开发的文本到视频生成模型。
AI视频生成#视频生成开源
3,900

Lumina T2X
Lumina-T2X是一个先进的文本到任意模态生成框架,它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。
AI图像生成#文本到视频开源
1,056

AI Video Generator Text To Video By Sora
AI视频生成器让每个人都能通过文本创作出令人惊叹的视频。
AI视频生成#AI视频
2,148

Mira
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。
AI视频生成#文本到视频开源
1,824

Cameractrl
CameraCtrl 致力于为文本生成视频模型提供精准相机姿态控制,通过训练相机编码器实现参数化相机轨迹,从而实现视频生成过程中的相机控制。
AI视频生成#相机控制开源
1,980

Animatediff Lightning
ByteDance的AnimateDiff-Lightning项目通过特定的模型和设置,实现了比原始AnimateDiff快速十倍以上的文本到视频生成。
AI视频生成#AI视频生成开源
16.63k

VLOGGER
VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。
AI视频生成#人体合成开源
12.64k

Tavus Phoenix
国外精选
Tavus提供了一系列的AI模型,特别是在生成高度逼真的说话头部视频方面,其Phoenix模型通过神经辐射场(NeRFs)技术,能够产生自然面部动作和表情,并与输入同步。
AI视频生成#AI模型
5,928

Hotshot ACT 1
ACT 1(Advanced Cinematic Transformer)是一个由Hotshot Research开发的直接文本到视频合成系统,它能够生成高清晰度的视频,具有多种宽高比且无水印,提供引人入胜的用户体验。
AI视频生成#文本到视频
2,700
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k