Qwen2.5 Coder 1.5B Instruct GGUF
简介
Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5,通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本,采用GGUF格式,具有因果语言模型、预训练和后训练阶段、transformers架构等特点。
截图

产品特色
代码生成:显著提升代码生成能力,包括源代码生成、文本代码基础和合成数据。
代码推理:增强模型对代码逻辑和结构的理解能力。
代码修复:提高模型识别和修复代码中错误和缺陷的能力。
全面应用:适用于实际应用场景,如代码代理,不仅增强编码能力,还保持数学和通用能力。
模型参数:1.54B参数,其中非嵌入参数为1.31B,28层,12个注意力头用于Q,2个用于KV。
上下文长度:支持完整的32,768个token,是目前支持长序列处理的模型之一。
量化:支持多种量化级别,如q2_K, q3_K_M, q4_0, q4_K_M, q5_0, q5_K_M, q6_K, q8_0。
使用教程
1. 安装huggingface_hub和llama.cpp,以便下载和运行模型。
2. 使用huggingface-cli下载所需的GGUF文件。
3. 根据官方指南安装llama.cpp,并确保跟随最新版本。
4. 使用llama-cli启动模型,并通过指定的命令行参数进行配置。
5. 在聊天模式下运行模型,以实现类似聊天机器人的交互体验。
6. 根据需要调整参数,如GPU内存和吞吐量,以适应不同的使用场景。
流量来源
直接访问 | 48.39% | 外链引荐 | 35.85% | 邮件 | 0.03% |
自然搜索 | 12.76% | 社交媒体 | 2.96% | 展示广告 | 0.02% |
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k