# 无需训练

Story Adapter
Story-Adapter是一个无需训练的迭代框架,专为长篇故事可视化设计。
图片生成#图像生成开源
3,096

Ditctrl
DiTCtrl是一种基于多模态扩散变换器(MM-DiT)架构的视频生成模型,它专注于无需额外训练即可生成具有多个连续提示的连贯场景视频。
视频生成#多模态开源
312

Enhance A Video
Enhance-A-Video 是一个致力于提高视频生成质量的项目,它通过调整视频模型中的时序注意力参数来增强视频帧间的一致性和视觉质量。
视频编辑#时序注意力开源
1,992

Fastercache
FasterCache是一种创新的无需训练的策略,旨在加速视频扩散模型的推理过程,并生成高质量的视频内容。
模型训练与部署#扩散模型开源
672

Magicface
MagicFace是一种无需训练即可实现个性化人像合成的技术,它能够根据给定的多个概念生成高保真度的人像图像。
AI图像生成#个性化定制开源
648

Asyncdiff
AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。
AI图像生成#文本到图像开源
612

Sketchdeco
优质新品
SketchDeco是一个创新的在线工具,它能够将黑白草图、遮罩和色彩调色板转化为逼真的彩色图像,无需用户定义文本提示。
AI图像生成#色彩化开源
2,352

RB Modulation
优质新品
RB-Modulation是谷歌发布的一种基于随机最优控制的新型训练免费个性化扩散模型解决方案。
AI图像生成#风格迁移开源
1,788

FIFO Diffusion
优质新品
FIFO-Diffusion是一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成。
AI视频生成#AI技术开源
3,864

Fouriscale
FouriScale从频域分析的角度探讨从预先训练的扩散模型生成高分辨率图像,通过创新的、无需训练的方法,通过将预先训练的扩散模型中的原始卷积层替换为结合膨胀技术和低通操作的方法,通过填充然后裁剪策略进一步增强,实现了灵活处理各种宽高比文本
AI图像生成#频率分析开源
1,116

Anyv2v
AnyV2V是一个创新的视频到视频编辑框架,允许用户使用任何现成的图像编辑工具编辑视频的第一帧,然后使用现有的图像到视频生成模型进行图像到视频的重建。
AI视频编辑#无需训练开源
2,172

Segmoe
SegMoE 是一个强大的框架,能够在几分钟内将稳定扩散模型动态组合成专家混合体,无需训练。
AI图像生成#图像生成开源
2,868
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k