# PyTorch

Bytedance Flux
Flux 是由字节跳动开发的一个高性能通信重叠库,专为 GPU 上的张量和专家并行设计。
模型训练与部署#并行计算开源
1,464

Profiling Data In DeepSeek Infra
DeepSeek Profile Data 是一个专注于深度学习框架性能分析的项目。
模型训练与部署#性能分析开源
492

Inspiremusic
InspireMusic 是一个专注于音乐、歌曲和音频生成的 AIGC 工具包和模型框架,采用 PyTorch 开发。
音乐生成#音频处理开源
2,916

Olmo 2 1124 7B DPO
OLMo-2-1124-7B-DPO是由Allen人工智能研究所开发的一个大型语言模型,经过特定的数据集进行监督式微调,并进一步进行了DPO训练。
聊天机器人#自然语言处理开源
300

RMBG 2.0
RMBG-2.0是由BRIA AI开发的背景移除模型,旨在有效分离图像中的前景和背景。
#背景移除开源
2,016

Llama O1
LLaMA-O1是一个大型推理模型框架,它结合了蒙特卡洛树搜索(MCTS)、自我强化学习、PPO等技术,并借鉴了AlphaGo Zero的双重策略范式以及大型语言模型。
研究工具#蒙特卡洛树搜索开源
504

Sparsh
Sparsh是一系列通过自监督算法(如MAE、DINO和JEPA)训练的通用触觉表示。
研究工具#触觉传感开源
276

Meta Lingua
Meta Lingua 是一个轻量级、高效的大型语言模型(LLM)训练和推理库,专为研究而设计。
模型训练与部署#PyTorch开源
384

Torchao
优质新品
torchao是PyTorch的一个库,专注于自定义数据类型和优化,支持量化和稀疏化权重、梯度、优化器和激活函数,用于推理和训练。
AI开发助手#量化开源
648

Fluxmusic
FluxMusic是一个基于PyTorch实现的文本到音乐生成模型,它通过扩散式修正流变换器探索了一种简单的文本到音乐生成方法。
AI音乐生成#生成模型开源
1,008

Zero To Gpt
zero_to_gpt是一个旨在帮助用户从零基础学习深度学习,并最终实现训练自己的GPT模型的教程。
AI教程#神经网络开源
456

Ml Mdm
ml-mdm是一个Python包,用于高效训练高质量的文本到图像扩散模型。
AI图像生成#深度学习开源
576

Aurasr V2
AuraSR-v2是一个基于生成对抗网络(GAN)的图像超分辨率模型,专为放大生成的图像而设计,是GigaGAN论文的一个变体。
AI图像增强#GAN开源
1,080

Dit MoE
DiT-MoE是一个使用PyTorch实现的扩散变换器模型,能够扩展到160亿参数,与密集网络竞争的同时展现出高度优化的推理能力。
AI模型#扩散模型开源
732

Comfyui Fast Style Transfer
ComfyUI-Fast-Style-Transfer是一个基于PyTorch框架开发的快速神经风格迁移插件,它允许用户通过简单的操作实现图像的风格转换。
AI图像生成#图像处理开源
924

Toucantts
优质新品
ToucanTTS是由德国斯图加特大学自然语言处理研究所开发的多语言且可控的文本到语音合成工具包。
AI文本转语音#语音合成开源
1,680

Audiolcm
AudioLCM是一个基于PyTorch实现的文本到音频生成模型,它通过潜在一致性模型来生成高质量且高效的音频。
AI文本转语音#语音合成开源
2,028

Kan Gpt
kan-gpt是一个基于PyTorch的Generative Pre-trained Transformers (GPTs) 实现,它利用Kolmogorov-Arnold Networks (KANs) 进行语言建模。
AI模型#文本生成开源
468

Lerobot
LeRobot 是一个旨在降低进入机器人领域的门槛,让每个人都能贡献并从共享数据集和预训练模型中受益的开源项目。
AI开发助手#强化学习开源
3,972

Stable Audio Tools
stable-audio-tools是一个开源的PyTorch库,提供了用于条件音频生成的生成模型的训练和推理代码。
AI音乐生成#PyTorch开源
1,872

Honeybee
Honeybee是一个适用于多模态语言模型的局部性增强预测器。
AI模型#语言模型开源
816

MLX
MLX是一种类似NumPy的数组框架,专为在苹果芯片上进行高效灵活的机器学习而设计,由苹果机器学习研究团队提供。
AI开发助手#机器学习开源
1,704

YOLO NAS Pose
YOLO-NAS Pose是一款免费的、开源的库,用于训练基于PyTorch的计算机视觉模型。
模型训练与部署#深度学习
2,424

Lightning AI
国外精选
Lightning AI是一个基于PyTorch的平台,可以帮助用户无痛地在本地机器和云环境之间进行AI模型的训练和部署。
开发与工具#开发编程
2,064

Runpod
RunPod是一个可扩展的云GPU基础设施,用于训练和推理。
开发与工具#TensorFlow
1,296
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k