# 高保真
Taoavatar
TaoAvatar 是一种高保真、轻量级的 3D 高斯喷溅技术(3DGS)全身虚拟人头像,能够生成个性化的全身动态头像,广泛应用于增强现实等场景。
数字人#增强现实开源
5,988
Animate Anyone 2
Animate Anyone 2 是一种基于扩散模型的角色图像动画技术,能够生成与环境高度适配的动画。
AI设计工具#环境适配开源
2,064
Gaussianspeech
GaussianSpeech是一种新颖的方法,它能够从语音信号中合成高保真度的动画序列,创建逼真、个性化的3D人头化身。
视频生成#语音合成开源
444
Melodyflow
优质新品
MelodyFlow是一个基于文本控制的高保真音乐生成和编辑模型,它使用连续潜在表示序列,避免了离散表示的信息丢失问题。
音乐生成#文本引导开源
528
CHANGER
CHANGER是一个创新的工业级头部混合技术,通过色键技术实现高保真度的头部混合效果,特别适用于视觉效果(VFX)、数字人物创建和虚拟头像等领域。
AI设计工具#色键技术开源
360
Mochi 1 Preview
这是一个先进的视频生成模型,采用 AsymmDiT 架构,可免费试用。
视频生成#开源开源
840
Hellomeme
HelloMeme是一个集成了空间编织注意力的扩散模型,旨在将高保真和丰富的条件嵌入到图像生成过程中。
AI图像生成#视频生成开源
840
Stable Hair
优质新品
Stable-Hair 是一种新颖的基于扩散模型的发型转移方法,能够稳健地将真实世界的多样化发型转移到用户提供的面部图像上,用于虚拟试戴。
AI头像生成#虚拟试戴开源
744
Freditor
Freditor是一种基于频域分解的NeRF编辑方法。
AI图像生成#频域分解开源
456
Musev
优质新品
MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。
AI视频生成#无限长度生成开源
18.62k
Stability AI Text To Speech Models
Stability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。
文本转声音#高保真
2,040
4D Fy
4D-fy是一种文本到4D生成方法,通过混合分数蒸馏采样技术,结合了多种预训练扩散模型的监督信号,实现了高保真的文本到4D场景生成。
AI图像生成#4D场景开源
1,104
Magicedit
MagicEdit是一款高保真、时间连贯的视频编辑模型,通过明确分离外观和运动的学习,支持视频风格化、局部编辑、视频混合和视频外扩等多种编辑应用。
AI视频编辑#高保真开源
1,092