# 高性能计算
高性能计算
Coreweave GPU 云计算
CoreWeave GPU 云计算是一个专为人工智能工作负载打造的云平台,提供灵活且高效的 GPU 集群,能够满足企业在大规模计算和存储方面的需求。
GPU#人工智能
1,032
Bytedance Flux
Flux 是由字节跳动开发的一个高性能通信重叠库,专为 GPU 上的张量和专家并行设计。
模型训练与部署#并行计算开源
1,464
3FS
3FS是一个专为AI训练和推理工作负载设计的高性能分布式文件系统。
开发与工具#分布式文件系统开源
480
Deepseek V3/R1 推理系统
优质新品
DeepSeek-V3/R1 推理系统是 DeepSeek 团队开发的高性能推理架构,旨在优化大规模稀疏模型的推理效率。
模型训练与部署#高性能计算开源
444
Thunder Compute
Thunder Compute是一个专注于AI/ML开发的GPU云服务平台,通过虚拟化技术,帮助用户以极低的成本使用高性能GPU资源。
开发平台#机器学习
420
Evo 2
Evo 2 是由 NVIDIA 推出的 AI 基础模型,旨在通过深度学习技术解析生物分子的遗传密码。
AI模型#生物医学
684
Deepgemm
优质新品
DeepGEMM是一个专注于高效FP8矩阵乘法的CUDA库。
开发与工具#矩阵乘法开源
624
Flexheadfa
FlexHeadFA 是一个基于 FlashAttention 的改进模型,专注于提供快速且内存高效的精确注意力机制。
模型训练与部署#注意力机制开源
492
NVIDIA Project DIGITS
优质新品
NVIDIA Project DIGITS 是一款基于 NVIDIA GB10 Grace Blackwell 超级芯片的桌面超级计算机,旨在为 AI 开发者提供强大的 AI 性能。
开发平台#超级计算机
1,116
Flashinfer
FlashInfer是一个专为大型语言模型(LLM)服务而设计的高性能GPU内核库。
开发与工具#GPU开源
924
Llama 3 Patronus Lynx 70B Instruct Q4 K M GGUF
PatronusAI/Llama-3-Patronus-Lynx-70B-Instruct-Q4_K_M-GGUF是一个基于70B参数的大型量化语言模型,使用了4-bit量化技术,以减少模型大小并提高推理效率。
AI模型#Transformers开源
336
Flagcx
FlagCX是由北京人工智能研究院(BAAI)支持开发的可扩展和自适应的跨芯片通信库。
开发与工具#跨芯片通信开源
696
EXAONE 3.5 32B Instruct AWQ
EXAONE-3.5-32B-Instruct-AWQ是LG AI Research开发的一系列指令调优的双语(英语和韩语)生成模型,参数从2.4B到32B不等。
AI模型#多语言开源
576
Deepseek V3
中文精选
DeepSeek-V3是一个强大的Mixture-of-Experts (MoE) 语言模型,拥有671B的总参数量,每次激活37B参数。
AI模型#深度学习开源
30.35k
Fastvideo
FastVideo是一个开源框架,旨在加速大型视频扩散模型。
视频生成#蒸馏开源
1,068
Trillium TPU
Trillium TPU是Google Cloud的第六代Tensor Processing Unit(TPU),专为AI工作负载设计,提供增强的性能和成本效益。
模型训练与部署#机器学习
540
Deepseek V2.5 1210
DeepSeek-V2.5-1210是DeepSeek-V2.5的升级版本,它在多个能力方面进行了改进,包括数学、编码和写作推理。
代码助手#混合专家开源
1,284
Rain AI
Rain AI专注于开发高能效的人工智能硬件。
#硬件
264
Falcon Mamba 7b
tiiuae/falcon-mamba-7b是由TII UAE开发的高性能因果语言模型,基于Mamba架构,专为生成任务设计。
AI模型#自然语言处理开源
216
AMD Instinct MI325X Accelerators
AMD Instinct MI325X加速器基于AMD CDNA 3架构,专为AI任务设计,包括基础模型训练、微调和推理,提供卓越的性能和效率。
AI模型#加速器
252
Intel Gaudi 3 AI Accelerator
Intel® Gaudi® 3 AI Accelerator是英特尔推出的一款高性能人工智能加速器,它基于高效的英特尔® Gaudi® 平台构建,具备出色的MLPerf基准性能,旨在处理要求苛刻的训练和推理任务。
AI模型推理训练#加速器
348
Sifive
SiFive是RISC-V架构的领导者,提供高性能、高效率的计算解决方案,适用于汽车、AI、数据中心等应用。
开发与工具#高性能计算
456
Groq
Groq是一家提供高性能AI芯片和云服务的公司,专注于为AI模型提供超低延迟的推理服务。
开发与工具#云服务
10.14k
Qwen2.5 LLM
Qwen2.5系列语言模型是一系列开源的decoder-only稠密模型,参数规模从0.5B到72B不等,旨在满足不同产品对模型规模的需求。
AI模型#机器学习开源
468
Azure Quantum
优质新品
Azure Quantum 是微软推出的量子计算平台,旨在通过先进的量子计算技术加速科学研究和材料科学领域的发现。
AI开发助手#人工智能
312
Cerebras Inference
国外精选
Cerebras Inference是Cerebras公司推出的AI推理平台,提供20倍于GPU的速度和1/5的成本。
模型训练与部署#高性能计算
756
Graphcore
国外精选
Graphcore是一家专注于人工智能硬件加速器的公司,其产品主要面向需要高性能计算的人工智能领域。
AI模型#机器学习
504
Skywork MoE Base FP8
Skywork-MoE是一个具有146亿参数的高性能混合专家(MoE)模型,拥有16个专家和22亿激活参数。
AI模型#大规模模型开源
300
Crusoe Cloud
Crusoe提供可扩展的、气候对齐的数字基础设施,专为高性能计算和人工智能优化。
AI模型#人工智能
912
Tensordock
国外精选
TensorDock 是一个为需要无可妥协可靠性的工作负载而构建的专业云服务提供商。
开发与工具#GPU 云服务
840
Llama 3 70B Gradient 524K Adapter
Llama-3 70B Gradient 524K Adapter是一个基于Llama-3 70B模型的适配器,由Gradient AI Team开发,旨在通过LoRA技术扩展模型的上下文长度至524K,从而提升模型在处理长文本数据时的性能
AI模型#Transformers开源
384
WSE 3
Cerebras Systems宣布推出其第三代5纳米晶圆级引擎(WSE-3),这是一款专为训练业界最大AI模型而设计的芯片。
模型训练与部署#晶圆级引擎
672
WEKA
WEKA是一个数据平台,帮助组织在云和本地存储、处理和管理数据,为下一代工作负载提供支持。
数据分析#云
696
Solidus Ai Tech
Solidus Ai Tech是一个提供人工智能即服务(AIAAS)、区块链即服务(BAAS)、高性能计算能力(HPC)和人工智能市场的创新科技公司。
开发平台#区块链
516
Stablecode
StableCode是稳定AI发布的首个面向编程的生成AI产品。
AI代码生成#人工智能
396