Step Video TI2V : 一款基于30B参数的图生视频模型，支持运动幅度可控和多种运镜效果

Step Video TI2V

Step Video TI2V

视频生成 AI模型 #"视频生成、人工智能、多模态、动漫、特效、运镜"优质新品开源

简介 :

Step-Video-TI2V是由上海阶跃星辰智能科技有限公司开发的一款先进的图生视频模型。它基于30B参数的Step-Video-T2V训练而成，能够根据文本和图像输入生成长达102帧的视频。该模型的核心优势在于其运动幅度可控和镜头运动可控两大特点，能够平衡视频生成结果的动态性和稳定性。此外，它在动漫风格视频生成方面表现出色，非常适合动画创作、短视频制作等应用场景。该模型的开源为视频生成领域提供了强大的技术支持，推动了多模态生成技术的发展。

需求人群 :

该产品适用于视频创作者、动画制作人员、广告设计师、短视频博主以及对高质量视频生成有需求的个人和企业。它能够帮助创作者快速生成高质量的视频内容，提高创作效率，降低制作成本，同时为动画和特效制作提供强大的技术支持。

总访问量： 492.1M

占比最多地区： US(19.34%)

本站浏览量： 141.0K

使用场景

生成动漫风格的视频：用户可以上传一张动漫角色的图片，并通过文本描述角色的动作和场景，生成具有动态效果的动漫视频。

创建电影级运镜效果：用户可以指定运镜方式，如镜头环绕、推进或拉远，生成具有电影质感的视频片段，用于视频制作或广告宣传。

制作特效视频：利用模型的特效生成能力，用户可以生成雷电、灵兽等特效场景，为视频增添奇幻效果。

产品特色

支持运动幅度可控：用户可以通过调整运动分数（motion score）来控制视频的动态程度，从静态稳定画面到高动态动作场景都能满足创作者需求，运动分数越高，视频的动态性越强，为创作者提供了灵活的创作空间。

多种运镜控制：支持固定镜头、平移、摇移、缩放、推进、拉远、旋转、跟踪拍摄和环绕拍摄等多种运镜方式，能够生成具有电影级质感的视频，满足不同场景下的拍摄需求。

动漫效果优异：在动漫风格视频生成方面表现出色，能够生成具有虚化背景、眨眼动作、飞吻动作以及特效场景的视频，非常适合动画创作和短视频制作等应用场景。

支持多尺寸生成：支持多种尺寸的图生视频，无论是横屏的宽阔视野、竖屏的沉浸体验，还是方屏的经典复古，都能轻松驾驭，用户可以根据不同的创作需求和平台特性自由选择图片尺寸。

高质量视频生成：生成的视频具有高分辨率和流畅的动态效果，能够满足专业创作者和普通用户的需求，为视频创作提供了强大的技术支持。

开源与社区支持：模型已开源，用户可以在GitHub上下载模型权重和推理代码，方便开发者进行二次开发和优化，推动技术的进一步发展。

技术领先：在VBench-I2V基准测试中，Step-Video-TI2V取得了state-of-the-art级别的表现，验证了其在动态性打分对生成视频稳定性和一致性控制能力方面的优势。

使用教程

1. 下载模型：访问GitHub页面，下载Step-Video-TI2V的模型权重和推理代码。

2. 安装依赖：使用conda创建环境并安装所需的Python包，确保环境配置正确。

3. 准备输入：准备好需要生成视频的图片和文本描述，图片作为视频的第一帧，文本描述用于指导视频内容。

4. 调整参数：根据需求设置运动分数（motion score）、运镜方式等参数，以控制视频的动态程度和镜头效果。

5. 运行模型：执行推理脚本，模型将根据输入生成视频，并保存到指定路径。

6. 查看结果：打开生成的视频文件，检查视频内容是否符合预期，如有需要可进一步调整参数并重新生成。

精选AI产品推荐

Pika是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。主要功能有:支持多种创意想法转视频,视频效果专业,操作简单易用。平台采用免费试用模式,定位面向创意者和视频爱好者。

视频生成人工智能

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。

AI模型多模态

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24