# 文本到视频
文本到视频
Wan 2.1 AI
Wan 2.1 AI 是由阿里巴巴开发的开源大规模视频生成 AI 模型。
视频生成#文本到视频
1,908
Wan2gp
Wan2GP 是基于 Wan2.1 的改进版本,旨在为低配置 GPU 用户提供高效、低内存占用的视频生成解决方案。
视频生成#AI开源
1,404
Wan2.1 T2V 14B
Wan2.1-T2V-14B 是一款先进的文本到视频生成模型,基于扩散变换器架构,结合了创新的时空变分自编码器(VAE)和大规模数据训练。
视频生成#文本到视频开源
1,476
Flashvideo
FlashVideo 是一款专注于高效高分辨率视频生成的深度学习模型。
视频生成#高效计算开源
624
Magic 1 For 1
Magic 1-For-1 是一个专注于高效视频生成的模型,其核心功能是将文本和图像快速转换为视频。
视频生成#AI 模型开源
1,428
STAR
STAR是一种创新的视频超分辨率技术,通过将文本到视频扩散模型与视频超分辨率相结合,解决了传统GAN方法中存在的过度平滑问题。
视频生成#文本到视频开源
1,668
Clipvideo AI
ClipVideo AI是一个专业的AI视频生成平台,它利用人工智能技术将照片或简单的文本提示转换成引人入胜的视频。
视频生成#文本到视频
1,632
Videovaeplus
这是一个视频变分自编码器(VAE),旨在减少视频冗余并促进高效视频生成。
视频生成#变分自编码器开源
360
Zebracat
Zebracat是一个利用人工智能技术,帮助用户将文本、博客内容快速转换成专业视频的平台。
视频生成#文本到视频
960
Pollo AI
国外精选
Pollo AI是一个创新的AI视频生成器,它允许用户轻松创建令人惊叹的视频。
视频生成#文本到视频
2,844
Consisid
ConsisID是一个基于频率分解的身份保持文本到视频生成模型,它通过在频域中使用身份控制信号来生成与输入文本描述一致的高保真度视频。
视频生成#身份保持开源
1,056
Allegro TI2V
Allegro-TI2V是一个文本图像到视频生成模型,它能够根据用户提供的提示和图像生成视频内容。
视频生成#视频生成开源
840
Pyramid Flow Miniflux
Pyramid Flow miniFLUX是一个基于流匹配的自回归视频生成方法,专注于训练效率和开源数据集的使用。
#流匹配开源
720
Cogvideox1.5 5B SAT
CogVideoX1.5-5B-SAT是由清华大学知识工程与数据挖掘团队开发的开源视频生成模型,是CogVideoX模型的升级版。
视频生成#文本到视频开源
1,572
Hailuo AI.org
Hailuo AI是由MiniMax开发的一款先进的人工智能生产力工具,旨在改变视频内容创作的方式。
视频生成#文本到视频
1,836
Viral Video
Viral Video是一个利用人工智能技术帮助用户快速创建病毒式视频的在线平台。
视频生成#文本到视频
1,284
Mochi 1
国外精选
Mochi 1 是 Genmo 公司推出的一款研究预览版本的开源视频生成模型,它致力于解决当前AI视频领域的基本问题。
视频生成#开源模型
756
Allegro
Allegro是由Rhymes AI开发的高级文本到视频模型,它能够将简单的文本提示转换成高质量的短视频片段。
视频生成#文本到视频开源
744
Dream Machine API
Dream Machine API是一个创意智能平台,它提供了一系列先进的视频生成模型,通过直观的API和开源SDKs,用户可以构建和扩展创意AI产品。
AI视频生成#创意智能
804
AI Youtube Shorts Generator
AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。
AI视频编辑#视频编辑开源
960
Cogvideo
CogVideo是由清华大学团队开发的文本到视频生成模型,它通过深度学习技术将文本描述转换为视频内容。
AI视频生成#深度学习开源
1,044
Cogvideox 5B
CogVideoX是一个开源的视频生成模型,由清华大学团队开发,支持从文本描述生成视频。
AI视频生成#人工智能开源
1,740
Dream Machine AI.online
Dream Machine AI是一个利用尖端技术将文字和图片转化为高质量视频的AI平台。
视频生成#高质量视频
2,016
Cogvideox
优质新品
CogVideoX是一个开源的视频生成模型,与商业模型同源,支持通过文本描述生成视频内容。
AI视频生成#文本到视频开源
1,272
Open Sora Plan V1.2
Open-Sora Plan v1.2是一个开源的视频生成模型,专注于文本到视频的转换任务。
AI视频生成#文本到视频开源
2,556
Asyncdiff
AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。
AI图像生成#文本到图像开源
612
Sharegpt4video
ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。
AI视频生成#文本到视频开源
1,596
Videotetris
优质新品
VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。
AI视频生成#视频生成开源
1,860
Dream Machine AI
优质新品
Dream Machine是由Luma Labs开发的一款先进的人工智能模型,旨在快速从文本和图片生成高质量的、逼真的视频。
视频生成#文本到视频
1,164
Motionclone
优质新品
MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。
AI视频生成#运动克隆开源
1,320
Follow Your Pose
Follow-Your-Pose是一个文本到视频生成的模型,它利用姿势信息和文本描述来生成可编辑、可控制姿势的角色视频。
AI视频生成#姿势引导开源
2,628
Open Sora Plan V1.1.0
Open-Sora-Plan是一个由北京大学元组团队开发的文本到视频生成模型。
AI视频生成#视频生成开源
3,900
Lumina T2X
Lumina-T2X是一个先进的文本到任意模态生成框架,它能够将文本描述转换为生动的图像、动态视频、详细的多视图3D图像和合成语音。
AI图像生成#文本到视频开源
1,056
AI Video Generator Text To Video By Sora
AI视频生成器让每个人都能通过文本创作出令人惊叹的视频。
AI视频生成#AI视频
2,148
Mira
Mira(Mini-Sora)是一个实验性的项目,旨在探索高质量、长时视频生成领域,特别是在模仿Sora风格的视频生成方面。
AI视频生成#文本到视频开源
1,824
Cameractrl
CameraCtrl 致力于为文本生成视频模型提供精准相机姿态控制,通过训练相机编码器实现参数化相机轨迹,从而实现视频生成过程中的相机控制。
AI视频生成#相机控制开源
1,980
Animatediff Lightning
ByteDance的AnimateDiff-Lightning项目通过特定的模型和设置,实现了比原始AnimateDiff快速十倍以上的文本到视频生成。
AI视频生成#AI视频生成开源
16.63k
VLOGGER
VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。
AI视频生成#人体合成开源
12.64k
Tavus Phoenix
国外精选
Tavus提供了一系列的AI模型,特别是在生成高度逼真的说话头部视频方面,其Phoenix模型通过神经辐射场(NeRFs)技术,能够产生自然面部动作和表情,并与输入同步。
AI视频生成#AI模型
5,928
Hotshot ACT 1
ACT 1(Advanced Cinematic Transformer)是一个由Hotshot Research开发的直接文本到视频合成系统,它能够生成高清晰度的视频,具有多种宽高比且无水印,提供引人入胜的用户体验。
AI视频生成#文本到视频
2,700