# 文本引导
文本引导
Videopainter
VideoPainter 是一款基于深度学习的视频修复和编辑工具,采用预训练的扩散变换器模型,结合轻量级背景上下文编码器和 ID 重采样技术,能够实现高质量的视频修复和编辑。
视频编辑#文本引导开源
1,056
Melodyflow
优质新品
MelodyFlow是一个基于文本控制的高保真音乐生成和编辑模型,它使用连续潜在表示序列,避免了离散表示的信息丢失问题。
音乐生成#文本引导开源
528
Diffree
Diffree是一个基于文本引导的图像修复模型,它能够通过文本描述来添加新对象到图像中,同时保持背景的一致性、空间适宜性和对象的相关性和质量。
AI图像编辑#文本引导开源
2,400
Clothedreamer
优质新品
ClotheDreamer是一个基于3D高斯的文本引导服装生成模型,能够从文本描述生成高保真的、可穿戴的3D服装资产。
AI服装生成工具#文本引导开源
1,620
Dreamwalk
DreamWalk是一种基于扩散指引的文本感知图像生成方法,可对图像的风格和内容进行细粒度控制,无需对扩散模型进行微调或修改内部层。
AI图像生成#图像生成开源
1,320
Scenewiz3d
SceneWiz3D是一种新颖的方法,可以从文本中合成高保真的3D场景。
AI图像生成#文本引导开源
480
RERENDER A VIDEO
RERENDER A VIDEO是一种新颖的零样本文本引导的视频到视频翻译框架,用于将图像模型应用于视频领域。
视频编辑#渲染
1,152
Magicavatar
MagicAvatar是一个多模态框架,能够将各种输入模式(文本、视频和音频)转换为运动信号,从而生成/动画化头像。
AI头像生成#头像动画开源
1,080