Cogvideox 2B
该产品适合需要生成视频内容的创意专业人士,如视频编辑、动画制作者、游戏开发者等。它可以帮助用户快速将文本描述转化为视觉内容,提高创作效率,丰富创意表达。
总访问量: 29,742,941
占比最多地区: US(17.94%)
2,064
简介
CogVideoX-2B是一个开源的视频生成模型,由清华大学团队开发。它支持使用英语提示语言生成视频,具有36GB的推理GPU内存需求,并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入,目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署,能够根据文本提示生成视频,具有高度的创造性和应用潜力。
截图
产品特色
支持英语提示生成视频
需要36GB GPU内存进行推理
生成6秒长的视频,每秒8帧
视频分辨率为720*480
使用正弦位置嵌入技术
基于Hugging Face diffusers库部署
使用教程
安装必要的依赖项
导入torch和diffusers库
从预训练模型中加载CogVideoXPipeline
将文本提示编码为模型可以理解的嵌入
使用模型生成视频帧
将生成的视频帧导出为视频文件
流量来源
直接访问48.39%外链引荐35.85%邮件0.03%
自然搜索12.76%社交媒体2.96%展示广告0.02%
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图