# 扩散变换器
扩散变换器
Instantcharacter
InstantCharacter 是一个基于扩散变换器的角色个性化框架,旨在克服现有学习基础自定义方法的局限性。
AI角色生成#图像处理开源
852
Transpixar
TransPixar 是一种先进的文本到视频生成模型,能够生成包含透明度通道的 RGBA 视频。
视频生成#透明度开源
684
Ditctrl
DiTCtrl是一种基于多模态扩散变换器(MM-DiT)架构的视频生成模型,它专注于无需额外训练即可生成具有多个连续提示的连贯场景视频。
视频生成#多模态开源
312
Melodyflow
优质新品
MelodyFlow是一个基于文本控制的高保真音乐生成和编辑模型,它使用连续潜在表示序列,避免了离散表示的信息丢失问题。
音乐生成#文本引导开源
528
In Context LoRA For Diffusion Transformers
In-Context LoRA是一种用于扩散变换器(DiTs)的微调技术,它通过结合图像而非仅仅文本,实现了在保持任务无关性的同时,对特定任务进行微调。
图片生成#扩散变换器开源
924
3dtopia XL
3DTopia-XL 是一个基于扩散变换器(DiT)构建的高质量3D资产生成技术,使用一种新颖的3D表示方法 PrimX。
AI图像生成#扩散变换器开源
372
Qihoo T2X
Qihoo-T2X是由360CVGroup开发的一个开源项目,它代表了一种创新的文本到任意任务(Text-to-Any)的扩散变换器(DiT)架构范式。
AI模型#扩散变换器开源
540
Tora
优质新品
Tora是一种基于扩散变换器(DiT)的视频生成模型,它通过集成文本、视觉和轨迹条件,实现了对视频内容动态的精确控制。
AI视频生成#动态控制开源
4,068
PIXART
PIXART-Σ是一个直接生成4K分辨率图像的扩散变换器模型,相较于前身PixArt-α,它提供了更高的图像保真度和与文本提示更好的对齐。
AI图像生成#AI艺术开源
19.69k