# 潜在扩散模型

Diffrhythm
DiffRhythm 是一种创新的音乐生成模型,利用潜在扩散技术实现了快速且高质量的全曲生成。
音乐生成#人工智能开源
1,452

Structldm
StructLDM是一个结构化潜在扩散模型,用于从2D图像学习3D人体生成。
3D建模#潜在扩散模型开源
456

SHMT
SHMT是一种自监督的层次化化妆迁移技术,通过潜在扩散模型实现。
AI设计工具#自监督学习开源
396

Anydressing
AnyDressing 是一种创新的虚拟试穿技术,通过潜在扩散模型实现多服装的个性化定制。
AI设计工具#潜在扩散模型开源
2,172

Latentsync
LatentSync 是由字节跳动开发的一款基于音频条件的潜在扩散模型的唇部同步框架。
视频生成#唇部同步开源
960

VISION XL
VISION XL是一个利用潜在扩散模型解决高清视频逆问题的框架。
视频生成#逆问题求解开源
10.76k

Layerdiffusion
LayerDiffusion 是一种使大规模预训练潜在扩散模型能够生成透明图像的方法。
AI图像生成#图像生成器开源
7,332

Stable Video Diffusion 1.1 Image To Video
Stable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型,通过将静止图像作为条件帧,生成相应的视频。
AI视频生成#图像到视频开源
16.32k

Stable Signature
Stable Signature是一种将水印嵌入图像中的方法,它使用潜在扩散模型(LDM)来提取和嵌入水印。
AI图像编辑#图像处理开源
1,176
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k