Nemotron 4 340B Base
Nemotron 4 340B Base
目标受众为研究人员和开发者,尤其是那些需要构建或训练自己的大型语言模型的专业人士。该模型的多语言和编程语言支持,使其成为开发多语言应用程序和代码生成工具的理想选择。
总访问量: 29,742,941
占比最多地区: US(17.94%)
480
简介
Nemotron-4-340B-Base是由NVIDIA开发的大型语言模型,拥有3400亿参数,支持4096个token的上下文长度,适用于生成合成数据,帮助研究人员和开发者构建自己的大型语言模型。模型经过9万亿token的预训练,涵盖50多种自然语言和40多种编程语言。NVIDIA开放模型许可允许商业使用和派生模型的创建与分发,不声明对使用模型或派生模型生成的任何输出拥有所有权。
截图
产品特色
支持50+自然语言和40+编程语言的文本生成。
兼容NVIDIA NeMo框架,提供参数高效微调和模型对齐工具。
采用Grouped-Query Attention和Rotary Position Embeddings技术。
经过9万亿token的预训练,包括多样化的英文基础文本。
支持BF16推理,可在多种硬件配置上部署。
提供5-shot和Zero-shot性能评估,展现多语言理解和代码生成能力。
使用教程
1. 下载并安装NVIDIA NeMo框架。
2. 准备所需的硬件环境,包括支持BF16推理的GPU。
3. 创建Python脚本以与部署的模型进行交互。
4. 创建Bash脚本来启动推理服务器。
5. 使用Slurm作业调度器在多个节点上分配模型并关联推理服务器。
6. 通过Python脚本发送文本生成请求,并获取模型生成的响应。
流量来源
直接访问48.39%外链引荐35.85%邮件0.03%
自然搜索12.76%社交媒体2.96%展示广告0.02%
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图