GLM 4V 9B
目标受众为需要进行多模态语言处理和理解的研究者、开发者以及企业用户。该产品适合那些寻求高性能、多语言支持和视觉理解能力的AI模型来提升其应用或服务的企业和个人。
总访问量: 29,742,941
占比最多地区: US(17.94%)
1,896
简介
GLM-4V-9B是智谱AI推出的新一代预训练模型,支持1120*1120高分辨率下的中英双语多轮对话,以及视觉理解能力。在多模态评测中,GLM-4V-9B展现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的卓越性能。
截图
产品特色
支持8K上下文长度的模型仓库
具备视觉理解能力,能够处理图像并生成描述
中英双语多轮对话能力
在综合能力、感知推理、文字识别、图表理解等方面表现出色
支持使用Python进行模型调用和生成文本
提供模型权重的使用协议,确保合规使用
使用教程
导入必要的Python库,如torch、PIL和transformers
使用AutoTokenizer从THUDM/glm-4v-9b获取分词器
准备输入的文本和图像,并将图像转换为RGB格式
通过tokenizer应用聊天模板,生成输入
将输入转换为模型需要的格式,并设置生成参数
调用AutoModelForCausalLM生成文本
解码生成的文本输出
流量来源
直接访问48.39%外链引荐35.85%邮件0.03%
自然搜索12.76%社交媒体2.96%展示广告0.02%
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图