Open Sora Plan V1.1.0 : 文本到视频生成的开源模型，性能卓越。

Open Sora Plan V1.1.0

Open Sora Plan V1.1.0

Open-Sora-Plan的目标受众主要是视频生成领域的研究人员和开发者。它适合需要生成高质量视频内容的个人和团队，无论是在学术研究、内容创作还是商业应用中。该模型的开源特性使得社区成员能够自由地访问和改进模型，促进了技术的发展和创新。

AI视频生成 AI内容生成 #文本到视频 #视频生成 #开源 #AI模型普通产品开源

总访问量： 29,742,941

占比最多地区： US(17.94%)

3,900

简介

Open-Sora-Plan是一个由北京大学元组团队开发的文本到视频生成模型。它在2024年4月首次推出v1.0.0版本，以其简单高效的设计和显著的性能在文本到视频生成领域获得了广泛认可。v1.1.0版本在视频生成质量和持续时间上进行了显著改进，包括更优的压缩视觉表示、更高的生成质量和更长的视频生成能力。该模型采用了优化的CausalVideoVAE架构，具有更强的性能和更高的推理效率。此外，它还保持了v1.0.0版本的极简设计和数据效率，并且与Sora基础模型的性能相似，表明其版本演进与Sora展示的扩展法则一致。

截图

产品特色

优化的CausalVideoVAE架构，提升性能和推理效率。

使用高质量视觉数据和字幕，增强模型对世界的理解。

保持极简设计和数据效率，与Sora基础模型性能相似。

开源发布，包括代码、数据和模型，促进社区发展。

引入GAN损失，帮助保留高频信息，减少网格伪影。

采用时间回滚平铺卷积方法，专门设计用于CausalVideoVAE。

使用教程

访问Open-Sora-Plan的GitHub页面，了解项目详情。

阅读文档，获取代码、数据和模型的访问权限。

根据文档指导，设置开发环境，安装必要的依赖项。

下载并运行训练脚本，开始使用模型生成视频。

利用提供的样本脚本，进行个性化的视频生成实验。

参与社区讨论，贡献代码或提出改进建议，共同推动项目发展。

流量来源

直接访问	48.39%	外链引荐	35.85%	邮件	0.03%
自然搜索	12.76%	社交媒体	2.96%	展示广告	0.02%

最新流量情况

月访问量

25296.55k

平均访问时长

285.77

每次访问页数

5.83

跳出率

43.31%

总流量趋势图

地理流量分布情况

美国

17.94%

中国

17.08%

印度

8.40%

俄罗斯

4.58%

日本

3.42%

地理流量分布全球图

同类开源产品

吱秘AI创作中心是一个集成了多种AI大模型的创作平台，提供文本、PPT、教学等多种模板，支持一键生成高质量内容，帮助用户提升创作效率。

AI内容生成#文案生成

京亦智能AI视频生成

京亦智能AI视频生成神器是一款利用人工智能技术，将静态的老照片转化为动态视频的产品。

AI视频生成#老照片

TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。

AI视频生成#手势识别

Vmotionize是一个领先的AI动画和3D动画软件，它能够将视频、音乐、文本、图片等内容转换成令人惊叹的3D动画。

AI视频生成#3D动画

Coverr AI Workflows

Coverr AI Workflows是一个专注于AI视频生成的平台，提供多种AI工具和工作流程，帮助用户通过简单的步骤生成高质量的视频内容。

AI视频生成#视频编辑

AI视频生成神器

AI视频生成神器是一款利用人工智能技术，将图片或文字转换成视频内容的在线工具。

AI视频生成#视频制作

DreamMesh4D是一个结合了网格表示与稀疏控制变形技术的新型框架，能够从单目视频中生成高质量的4D对象。

AI视频生成#4D对象

Pyramid Flow 是一种高效的视频生成建模技术，它基于流匹配方法，通过自回归视频生成模型来实现。

AI视频生成#自回归模型

AI Hug Video Generator是一个在线平台，使用先进的机器学习技术将静态照片转换成动态、逼真的拥抱视频。

AI视频生成#视频生成

替代品

TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。

AI视频生成#手势识别

DreamMesh4D是一个结合了网格表示与稀疏控制变形技术的新型框架，能够从单目视频中生成高质量的4D对象。

AI视频生成#4D对象

Pyramid Flow 是一种高效的视频生成建模技术，它基于流匹配方法，通过自回归视频生成模型来实现。

AI视频生成#自回归模型

PhysGen是一个创新的图像到视频生成方法，它能够将单张图片和输入条件（例如，对图片中物体施加的力和扭矩）转换成现实、物理上合理且时间上连贯的视频。

AI视频生成#物理模拟

MIMO是一个通用的视频合成模型，能够模仿任何人在复杂动作中与物体互动。

AI视频生成#动画制作

Robust Dual Gaussian Splatting (DualGS) 是一种新型的基于高斯的体积视频表示方法，它通过优化关节高斯和皮肤高斯来捕捉复杂的人体表演，并实现鲁棒的跟踪和高保真渲染。

AI视频生成#VR/AR

LVCD 是一种基于参考的线稿视频上色技术，采用大规模预训练的视频扩散模型，生成色彩化动画视频。

AI视频生成#动画制作

AI Faceless Video Generator

AI-Faceless-Video-Generator是一个利用人工智能技术，根据话题生成视频脚本、语音和会说话头像的项目。

AI视频生成#面部动画

Gomaxai Pro版 (ChatGPT Midjourney)

GoMaxAI Pro版是一个基于Node.js、Vue3、uniapp开发的AIGC平台，提供ChatGPT、Midjourney绘画、Suno音乐、Pika/Runway/Sora视频服务。

AI内容生成#ChatGPT

精选AI产品推荐

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。

开发平台#应用开发

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。

音频生成#AI

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。

AI设计工具#创意工具

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。

AI模型#图像处理开源

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。

文章摘要#AI

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。

视频编辑#视频处理开源

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。

音频生成#文本转语音

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。

AI模型#图像生成

AIbase

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门AI产品

Deepseek R1 0528

Migo AI文献阅读助手

热门AI产品分类

开发与工具

聊天机器人

热门标签

生产力工具

© 2025AIbase 备案号：闽ICP备08105208号-24