# 视觉生成
视觉生成
Unitok
UniTok是一种创新的视觉分词技术,旨在弥合视觉生成和理解之间的差距。
AI模型#视觉生成开源
732
Comfyui PyramidFlowWrapper
ComfyUI-PyramidFlowWrapper是基于Pyramid-Flow模型的一套包装节点,旨在通过ComfyUI提供更高效的用户界面和更便捷的操作流程。
AI图像生成#视觉生成开源
636
ACE: All Round Creator And Editor Following Instructions Via Diffusion Transformer
ACE是一个基于扩散变换的全能创造者和编辑器,它能够通过统一的条件格式Long-context Condition Unit (LCU)输入,实现多种视觉生成任务的联合训练。
AI图像生成#扩散模型开源
720
Saze AI
SazeAI是一个AI助手工具,旨在帮助作家和创作者创作出引人注目的内容,生成令人惊叹的视觉效果,以及打造有影响力的演讲。
写作助手#内容生成
2,592
Vqascore
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Benc
AI图像生成#视觉生成开源
840
Fable Prism
Fable Prism 是一款基于人工智能的视觉生成设计工具,帮助用户使用自然语言描述生成插画、logo、产品模型等视觉效果。
AI设计工具#视觉生成
5,148
Magicvideo V2
中文精选
MagicVideo-V2是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成管道。
AI视频生成#文本到视频开源
293.40k