# NVIDIA

Parakeet Tdt 0.6b V2
parakeet-tdt-0.6b-v2 是一个 600 百万参数的自动语音识别(ASR)模型,旨在实现高质量的英语转录,具有准确的时间戳预测和自动标点符号、大小写支持。
语音识别#深度学习开源
588

NVIDIA Project DIGITS
优质新品
NVIDIA Project DIGITS 是一款基于 NVIDIA GB10 Grace Blackwell 超级芯片的桌面超级计算机,旨在为 AI 开发者提供强大的 AI 性能。
开发平台#超级计算机
1,116

Sana 600M 512px
Sana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
1,296

Sana 600M 1024px
Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
528

Sana 1600M 1024px MultiLing
Sana是一个由NVIDIA开发的文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
600

Sana 1600M 512px MultiLing
Sana是一个由NVIDIA开发的文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
264

Sana 1600M 1024px
Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的高清晰度、高文本-图像一致性的图像,并且速度极快,可以在笔记本电脑GPU上部署。
图片生成#高分辨率开源
492

Sana 1600M 512px
Sana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。
图片生成#高分辨率开源
516

Sana 1.6B
Sana-1.6B是一个高效的高分辨率图像合成模型,它基于线性扩散变换器技术,能够生成高质量的图像。
图片生成#AI
504

Star Attention
Star-Attention是NVIDIA提出的一种新型块稀疏注意力机制,旨在提高基于Transformer的大型语言模型(LLM)在长序列上的推理效率。
模型训练与部署#大型语言模型开源
456

Fugatto
Fugatto(全称Foundational Generative Audio Transformer Opus 1)是由NVIDIA推出的一款生成式AI声音模型,能够通过文本和音频输入生成或转换任何描述的音乐、声音和语音组合。
#AI
804

Llama 3.1 Nemotron 70B Instruct
Llama-3.1-Nemotron-70B-Instruct是NVIDIA定制的大型语言模型,专注于提升大型语言模型(LLM)生成回答的帮助性。
AI模型#大型语言模型开源
756

Llama 3.1 Nemotron 51B
Llama-3.1-Nemotron-51B是由NVIDIA基于Meta的Llama-3.1-70B开发的新型语言模型,通过神经架构搜索(NAS)技术优化,实现了高准确率和高效率。
AI模型#语言模型
564

NVIDIA App
优质新品
NVIDIA App 是一款专为PC游戏玩家和创作者设计的应用程序,它可以帮助用户及时升级到最新的NVIDIA驱动程序和技术。
AI游戏助手#游戏优化
408

Llama3 70B SteerLM RM
Llama3-70B-SteerLM-RM是一个70亿参数的语言模型,用作属性预测模型,一个多方面的奖励模型,它在多个方面对模型响应进行评分,而不是传统奖励模型中的单一分数。
AI模型#语言模型开源
636

Nemotron 4 340B Base
优质新品
Nemotron-4-340B-Base是由NVIDIA开发的大型语言模型,拥有3400亿参数,支持4096个token的上下文长度,适用于生成合成数据,帮助研究人员和开发者构建自己的大型语言模型。
AI模型#多语言支持开源
480

NVIDIA RTX Remix
优质新品
NVIDIA RTX Remix 是一款由NVIDIA推出的开源模组创作工具包,它允许创作者和游戏开发者利用NVIDIA RTX技术的强大功能来增强他们的游戏和创作体验。
AI图像生成#RTX
708

NVIDIA ACE
NVIDIA ACE提供了一套先进的生成式AI模型和微服务,易于部署且性能优越。
AI模型#AI非玩家角色
792

Llama3 ChatQA 1.5 8B
Llama3-ChatQA-1.5-8B是一款由NVIDIA开发的高级对话问答和检索增强生成(RAG)模型。
AI模型#对话系统开源
1,116
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k