# 长文本处理

GPT 4.1
GPT-4.1 是一系列新模型,提供了显著的性能提升,特别是在编码、指令跟随和处理长文本上下文方面。
AI模型#AI 助手
2,520

Jamba 1.6
Jamba 1.6 是 AI21 推出的最新语言模型,专为企业私有部署而设计。
AI模型#长文本处理
792

AI21 Jamba Large 1.6
AI21-Jamba-Large-1.6 是由 AI21 Labs 开发的混合 SSM-Transformer 架构基础模型,专为长文本处理和高效推理而设计。
模型训练与部署#高效推理开源
768

Qwq 32B
QwQ-32B 是 Qwen 系列的推理模型,专注于复杂问题的思考和推理能力。
AI模型#文本生成开源
1,668

Gemini 2.0 Flash Lite
优质新品
Gemini 2.0 Flash-Lite 是 Google 推出的高效语言模型,专为长文本处理和复杂任务优化。
AI模型#语言模型
804

Moba
MoBA(Mixture of Block Attention)是一种创新的注意力机制,专为长文本上下文的大语言模型设计。
模型训练与部署#注意力机制开源
576

Modernbert Base
ModernBERT-base是一个现代化的双向编码器Transformer模型,预训练于2万亿英文和代码数据,原生支持长达8192个token的上下文。
AI模型#长文本处理开源
648

EXAONE 3.5
EXAONE 3.5是LG AI Research发布的一系列人工智能模型,这些模型以其卓越的性能和成本效益而著称。
AI模型#长文本处理
396

Aria Base 64K
Aria-Base-64K是Aria系列的基础模型之一,专为研究目的和继续训练而设计。
AI模型#长文本处理开源
264

Qwen2.5 Coder 0.5B Instruct GGUF
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。
#代码推理开源
264

Qwen2.5 Turbo
中文精选
Qwen2.5-Turbo是阿里巴巴开发团队推出的一款能够处理超长文本的语言模型,它在Qwen2.5的基础上进行了优化,支持长达1M个token的上下文,相当于约100万英文单词或150万中文字符。
#高性能
816

Qwen2.5 Coder 3B Instruct GPTQ Int4
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、推理和修复而设计。
#代码推理开源
420

Qwen2.5 Coder 32B Instruct GPTQ Int8
Qwen2.5-Coder-32B-Instruct-GPTQ-Int8是Qwen系列中针对代码生成优化的大型语言模型,拥有32亿参数,支持长文本处理,是当前开源代码生成领域最先进的模型之一。
#长文本处理开源
576

Qwen2.5 Coder 32B Instruct GPTQ Int4
Qwen2.5-Coder-32B-Instruct-GPTQ-Int4是基于Qwen2.5的代码生成大型语言模型,具有32.5亿参数量,支持长文本处理,最大支持128K tokens。
#代码推理开源
408

Qwen2.5 Coder 32B Instruct AWQ
Qwen2.5-Coder是一系列针对代码生成优化的大型语言模型,覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。
#代码推理开源
456

Qwen2.5 Coder 32B
Qwen2.5-Coder-32B是基于Qwen2.5的代码生成模型,拥有32亿参数,是目前开源代码语言模型中参数最多的模型之一。
代码助手#代码推理开源
276

Mistral Small Instruct 2409
Mistral-Small-Instruct-2409是由Mistral AI Team开发的一个具有22B参数的指令式微调AI模型,支持多种语言,并能够支持高达128k的序列长度。
AI模型#自然语言处理开源
468

Reader LM
Reader-LM是Jina AI开发的小型语言模型,旨在将网络中的原始、杂乱的HTML内容转换为清洁的Markdown格式。
AI文本转语音#Markdown
744

AI21 Jamba 1.5 Mini
优质新品
AI21-Jamba-1.5-Mini是AI21实验室开发的最新一代混合SSM-Transformer指令跟随基础模型。
AI模型#长文本处理开源
408

Jamba 1.5 Open Model Family
国外精选
Jamba 1.5 Open Model Family是AI21公司推出的最新AI模型系列,基于SSM-Transformer架构,具有超长文本处理能力、高速度和高质量,是市场上同类产品中表现最优的。
AI模型#长文本处理
576

Internlm XComposer2.5
InternLM-XComposer2.5是一款专注于文本图像理解与合成应用的大型语言模型,具有7B参数的后端支持,能够处理长达96K的长文本上下文,适合需要广泛输入输出的复杂任务。
AI模型#长文本处理开源
684

Internlm2.5 7B Chat 1M
InternLM2.5-7B-Chat-1M 是一个开源的70亿参数的对话模型,具有卓越的推理能力,在数学推理方面超越了同量级模型。
AI模型#对话模型开源
768

Internlm2.5 7B Chat
InternLM2.5-7B-Chat是一个开源的7亿参数的中文对话模型,专为实用场景设计,具有卓越的推理能力,在数学推理方面超越了Llama3和Gemma2-9B等模型。
AI聊天机器人#推理能力开源
792

Qwen2
Qwen2是一系列经过预训练和指令调整的模型,支持多达27种语言,包括英语和中文。
AI模型#预训练模型开源
5,052

GLM 4 9B Chat 1M
优质新品
GLM-4-9B-Chat-1M 是智谱 AI 推出的新一代预训练模型,属于 GLM-4 系列的开源版本。
AI模型#多轮对话开源
972

GLM 4 9B Chat
优质新品
GLM-4-9B-Chat是智谱AI推出的新一代预训练模型GLM-4系列中的开源版本,具备多轮对话、网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。
AI模型#多语言支持开源
1,080

Llama 3 70B Gradient 524K Adapter
Llama-3 70B Gradient 524K Adapter是一个基于Llama-3 70B模型的适配器,由Gradient AI Team开发,旨在通过LoRA技术扩展模型的上下文长度至524K,从而提升模型在处理长文本数据时的性能
AI模型#Transformers开源
384

Llama 3 70B Instruct Gradient 1048k
Llama-3 70B Instruct Gradient 1048k是一款由Gradient AI团队开发的先进语言模型,它通过扩展上下文长度至超过1048K,展示了SOTA(State of the Art)语言模型在经过适当调整后能够
AI模型#长文本处理开源
720

Unichat Llama3 Chinese
Unichat-llama3-Chinese是中国联通AI创新中心发布的业界首个基于Meta Llama 3模型的中文指令微调模型。
AI聊天机器人#自然语言处理开源
996

Llama 3 8B Instruct 262k
Llama-3 8B Instruct 262k是一款由Gradient AI团队开发的文本生成模型,它扩展了LLama-3 8B的上下文长度至超过160K,展示了SOTA(State of the Art)大型语言模型在学习长文本操作时的
AI模型#长文本处理开源
792
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k