# 高保真

Taoavatar
TaoAvatar 是一种高保真、轻量级的 3D 高斯喷溅技术(3DGS)全身虚拟人头像,能够生成个性化的全身动态头像,广泛应用于增强现实等场景。
数字人#增强现实开源
5,988

Animate Anyone 2
Animate Anyone 2 是一种基于扩散模型的角色图像动画技术,能够生成与环境高度适配的动画。
AI设计工具#环境适配开源
2,064

Gaussianspeech
GaussianSpeech是一种新颖的方法,它能够从语音信号中合成高保真度的动画序列,创建逼真、个性化的3D人头化身。
视频生成#语音合成开源
444

Melodyflow
优质新品
MelodyFlow是一个基于文本控制的高保真音乐生成和编辑模型,它使用连续潜在表示序列,避免了离散表示的信息丢失问题。
音乐生成#文本引导开源
528

CHANGER
CHANGER是一个创新的工业级头部混合技术,通过色键技术实现高保真度的头部混合效果,特别适用于视觉效果(VFX)、数字人物创建和虚拟头像等领域。
AI设计工具#色键技术开源
360

Mochi 1 Preview
这是一个先进的视频生成模型,采用 AsymmDiT 架构,可免费试用。
视频生成#开源开源
840

Hellomeme
HelloMeme是一个集成了空间编织注意力的扩散模型,旨在将高保真和丰富的条件嵌入到图像生成过程中。
AI图像生成#视频生成开源
840

Stable Hair
优质新品
Stable-Hair 是一种新颖的基于扩散模型的发型转移方法,能够稳健地将真实世界的多样化发型转移到用户提供的面部图像上,用于虚拟试戴。
AI头像生成#虚拟试戴开源
744

Freditor
Freditor是一种基于频域分解的NeRF编辑方法。
AI图像生成#频域分解开源
456

Musev
优质新品
MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。
AI视频生成#无限长度生成开源
18.62k

Stability AI Text To Speech Models
Stability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。
文本转声音#高保真
2,040

4D Fy
4D-fy是一种文本到4D生成方法,通过混合分数蒸馏采样技术,结合了多种预训练扩散模型的监督信号,实现了高保真的文本到4D场景生成。
AI图像生成#4D场景开源
1,104

Magicedit
MagicEdit是一款高保真、时间连贯的视频编辑模型,通过明确分离外观和运动的学习,支持视频风格化、局部编辑、视频混合和视频外扩等多种编辑应用。
AI视频编辑#高保真开源
1,092
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k