Transformers

# Transformers

EXAONE 3.5 7.8B Instruct AWQ

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于小型或资源受限设备的部署；2) 7.8B模型，与前代模型大小相匹配，但提供改进的性能；3) 32B模型，提供强大的性能。

AI模型Transformers

Llama 3 Patronus Lynx 70B Instruct Q4 K M GGUF

PatronusAI/Llama-3-Patronus-Lynx-70B-Instruct-Q4_K_M-GGUF是一个基于70B参数的大型量化语言模型，使用了4-bit量化技术，以减少模型大小并提高推理效率。该模型属于PatronusAI系列，是基于Transformers库构建的，适用于需要高性能自然语言处理的应用场景。模型遵循cc-by-nc-4.0许可协议，意味着可以非商业性地使用和分享。

AI模型Transformers

Llama 3 Patronus Lynx 8B V1.1 Instruct Q8 GGUF

PatronusAI/Llama-3-Patronus-Lynx-8B-v1.1-Instruct-Q8-GGUF是一个基于Llama模型的量化版本，专为对话和幻觉检测设计。该模型使用了GGUF格式，拥有8.03亿参数，属于大型语言模型。它的重要性在于能够提供高质量的对话生成和幻觉检测能力，同时保持模型的高效运行。该模型是基于Transformers库和GGUF技术构建的，适用于需要高性能对话系统和内容生成的应用场景。

聊天机器人量化

EXAONE 3.5 2.4B Instruct AWQ

EXAONE-3.5-2.4B-Instruct-AWQ是由LG AI Research开发的一系列双语（英语和韩语）指令调优生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并且在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。该模型在部署到小型或资源受限设备上进行了优化，并且采用了AWQ量化技术，实现了4位群组权重量化（W4A16g128）。

AI模型Transformers

Llama Lynx 70b 4bit Quantized

Llama-Lynx-70b-4bit-Quantized是由PatronusAI开发的一个大型文本生成模型，具有70亿参数，并且经过4位量化处理，以优化模型大小和推理速度。该模型基于Hugging Face的Transformers库构建，支持多种语言，特别是在对话生成和文本生成领域表现出色。它的重要性在于能够在保持较高性能的同时减少模型的存储和计算需求，使得在资源受限的环境中也能部署强大的AI模型。

AI模型对话系统

EXAONE 3.5 7.8B Instruct

EXAONE-3.5-7.8B-Instruct是由LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。

AI模型Transformers

EXAONE 3.5 2.4B Instruct

EXAONE-3.5-2.4B-Instruct是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的通用领域中保持竞争力。该模型特别适合需要处理长文本和多语言需求的场景，如自动翻译、文本摘要、对话系统等。

翻译Transformers

EXAONE 3.5 7.8B Instruct GGUF

EXAONE 3.5是LG AI Research开发的一系列双语（英语和韩语）指令调优的生成模型，参数从2.4B到32B不等。这些模型支持长达32K令牌的长上下文处理，在真实世界用例和长上下文理解方面展现出了最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于部署在小型或资源受限的设备上；2) 7.8B模型，与前代模型大小匹配但提供改进的性能；3) 32B模型，提供强大的性能。

AI模型Transformers

InternVL2_5-4B是一个先进的多模态大型语言模型（MLLM），在InternVL 2.0的基础上进行了核心模型架构的维护，并在训练和测试策略以及数据质量上进行了显著增强。该模型在处理图像、文本到文本的任务中表现出色，特别是在多模态推理、数学问题解决、OCR、图表和文档理解等方面。作为开源模型，它为研究人员和开发者提供了强大的工具，以探索和构建基于视觉和语言的智能应用。

AI模型大型语言模型

InternVL2_5-8B是由OpenGVLab开发的一款多模态大型语言模型（MLLM），它在InternVL 2.0的基础上进行了显著的训练和测试策略增强，以及数据质量提升。该模型采用'ViT-MLP-LLM'架构，集成了新增量预训练的InternViT与多种预训练语言模型，如InternLM 2.5和Qwen 2.5，使用随机初始化的MLP projector。InternVL 2.5系列模型在多模态任务上展现出卓越的性能，包括图像和视频理解、多语言理解等。

AI模型大型语言模型

OLMo 2 7B是由Allen Institute for AI (Ai2)开发的一款7B参数的大型语言模型，它在多个自然语言处理任务上展现出色的表现。该模型通过在大规模数据集上的训练，能够理解和生成自然语言，支持多种语言模型相关的科研和应用。OLMo 2 7B的主要优点包括其大规模的参数量，使得模型能够捕捉到更加细微的语言特征，以及其开源的特性，促进了学术界和工业界的进一步研究和应用。

AI模型自然语言处理

SmolVLM是一个小型但功能强大的视觉语言模型（VLM），拥有2B参数，以其较小的内存占用和高效性能在同类模型中处于领先地位。SmolVLM完全开源，包括所有模型检查点、VLM数据集、训练配方和工具均在Apache 2.0许可下发布。该模型适合在浏览器或边缘设备上进行本地部署，降低推理成本，并允许用户自定义。

AI模型多模态AI

Qwq 32B Preview

QwQ-32B-Preview是一个由Qwen团队开发的实验性研究模型，旨在提高人工智能的推理能力。该模型展示了有前景的分析能力，但也存在一些重要的限制。模型在数学和编程方面表现出色，但在常识推理和细微语言理解方面还有提升空间。该模型使用了transformers架构，具有32.5B个参数，64层，以及40个注意力头（GQA）。产品背景信息显示，QwQ-32B-Preview是基于Qwen2.5-32B模型的进一步开发，具有更深层次的语言理解和生成能力。

AI模型Transformers

Qwen2.5 Coder 0.5B Instruct GPTQ Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该系列模型通过增加训练令牌至5.5万亿，包括源代码、文本代码接地、合成数据等，显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，编码能力与GPT-4o相匹配。此外，Qwen2.5-Coder还为真实世界应用提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

代码助手代码推理

AlphaQubit是由Google DeepMind和Quantum AI团队共同开发的人工智能系统，它能够以最先进的准确性识别量子计算机中的错误。这项技术结合了机器学习和量子纠错的专业知识，旨在推动可靠量子计算机的构建，这对于解决复杂问题、实现科学突破和探索新领域具有重要意义。AlphaQubit的主要优点包括高准确性和对大规模量子计算的适用性。

Qwen2.5 Coder 32B Instruct GGUF

Qwen2.5-Coder 是针对代码生成的模型，在代码生成等方面显著提升，参数规模多样，支持量化。免费，面向开发者提高效率和质量。

Qwen2.5 Coder 7B

Qwen2.5-Coder-7B是基于Qwen2.5的大型语言模型，专注于代码生成、代码推理和代码修复。它在5.5万亿的训练令牌上进行了扩展，包括源代码、文本代码接地、合成数据等，是目前开源代码语言模型的最新进展。该模型不仅在编程能力上与GPT-4o相匹配，还保持了在数学和一般能力上的优势，并支持长达128K令牌的长上下文。

代码助手代码推理

Qwen2.5 Coder 7B Instruct

Qwen2.5-Coder-7B-Instruct是Qwen2.5-Coder系列中的一款代码特定大型语言模型，覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此外，该模型还支持长达128K令牌的长上下文，并为实际应用如代码代理提供了更全面的基础。

代码助手代码推理

Qwen2.5 Coder 14B

Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型，覆盖了0.5到32亿参数的不同模型尺寸，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此外，它还为现实世界应用如代码代理提供了更全面的基础，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。

代码助手代码推理

Qwen2.5 Coder 14B Instruct

Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型通过扩展训练令牌到5.5万亿，包括源代码、文本代码接地、合成数据等，成为当前开源代码LLM的最新技术。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，并支持长达128K令牌的长上下文。

代码助手代码推理

Qwen2.5 Coder 32B

Qwen2.5-Coder-32B是基于Qwen2.5的代码生成模型，拥有32亿参数，是目前开源代码语言模型中参数最多的模型之一。它在代码生成、代码推理和代码修复方面有显著提升，能够处理长达128K tokens的长文本，适用于代码代理等实际应用场景。该模型在数学和通用能力上也保持了优势，支持长文本处理，是开发者在进行代码开发时的强大助手。

代码助手代码推理

Qwen2.5 Coder 32B Instruct

Qwen2.5-Coder是一系列专为代码生成设计的Qwen大型语言模型，包含0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型，其编码能力与GPT-4o相匹配。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，并支持长达128K令牌的长上下文。

代码助手代码推理

Transformers.js

transformers.js 是一个JavaScript库，旨在为网页提供先进的机器学习能力。它允许用户在浏览器中直接运行预训练的Transformers模型，无需服务器支持。该库使用ONNX Runtime作为后端，支持将PyTorch、TensorFlow或JAX模型转换为ONNX格式。transformers.js 与 Hugging Face 的 transformers Python 库功能等价，提供相似的API，使得开发者能够轻松地将现有代码迁移到网页端。

AI开发助手Transformers

Llama 3 70B Gradient 524K Adapter

Llama-3 70B Gradient 524K Adapter是一个基于Llama-3 70B模型的适配器，由Gradient AI Team开发，旨在通过LoRA技术扩展模型的上下文长度至524K，从而提升模型在处理长文本数据时的性能。该模型使用了先进的训练技术，包括NTK-aware插值和RingAttention库，以高效地在高性能计算集群上进行训练。

AI模型Transformers

TinyLlama项目旨在在3万亿令牌上预训练一个1.1B Llama模型。通过一些适当的优化，我们可以在“仅”90天内使用16个A100-40G GPU完成。训练已于2023-09-01开始。我们采用了与Llama 2完全相同的架构和分词器。这意味着TinyLlama可以在许多建立在Llama基础上的开源项目中使用。此外，TinyLlama只有1.1B个参数，紧凑性使其能够满足许多对计算和内存占用有限的应用需求。

精选AI产品推荐

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。该平台提供实时预览和一键部署功能，非常适合非技术背景的用户，帮助他们将想法转化为现实。

开发平台应用开发

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果，使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度，还兼容移动端，便于用户在不同场合使用。产品定位为高效的信息获取工具，适合广泛的听众需求。

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程，节省时间并提升创意灵感。Lovart 当前处于测试阶段，用户可加入等候名单，随时体验设计的乐趣。

AI设计工具创意工具

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器，减少了高分辨率图像的编码时间和输出的 token 数量，使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力，适用于各种应用场景，尤其在需要快速响应的移动设备上表现优异。

AI模型图像处理

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。它适合需要快速获取文档要点的用户，如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型，支持多种语言，是提高工作效率的理想选择，完全免费使用。

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题，同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果，适用于自动配音等实际应用场景。

视频编辑视频处理

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景，如内容创作、教育、商业和娱乐制作等，旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用，适合不同层次的用户。

音频生成文本转语音

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AI模型图像生成

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24