Shieldgemma
ShieldGemma模型适用于需要对文本内容进行安全审核的开发者和企业,例如社交媒体平台、在线论坛和内容发布系统。这些模型可以帮助他们过滤掉违反安全政策的内容,提高内容的质量和合规性。
总访问量: 29,742,941
占比最多地区: US(17.94%)
768
简介
ShieldGemma是由Google开发的一系列基于Gemma 2构建的安全内容审核模型,专注于四个危害类别(儿童不宜内容、危险内容、仇恨和骚扰)。它们是文本到文本的解码器仅大型语言模型,仅包含英文版本,具有开放权重,包括2B、9B和27B参数大小的模型。这些模型旨在作为负责任的生成AI工具包的一部分,提高AI应用的安全性。
截图
产品特色
文本到文本的解码器仅大型语言模型,专注于内容审核。
提供三种不同规模的模型:2B、9B和27B参数。
使用特定模式格式化输入,以实现最佳性能。
输出文本字符串,表示用户输入或模型输出是否违反提供的政策。
在公平性特征上进行了安全评估,符合内部指导方针。
作为负责任的生成AI工具包的一部分,用于改善AI应用的安全性。
使用教程
安装必要的库:`pip install -U transformers[accelerate]`。
从Hugging Face导入AutoTokenizer和AutoModelForCausalLM。
使用AutoTokenizer和AutoModelForCausalLM加载ShieldGemma模型。
根据需要格式化提示(prompt),包括前文、用户提示、安全政策描述等。
将格式化后的提示输入模型,并使用模型进行内容审核。
根据模型输出的'Yes'或'No'判断内容是否违反安全政策。
根据需要调整模型参数或提示格式,以优化审核效果。
流量来源
直接访问48.39%外链引荐35.85%邮件0.03%
自然搜索12.76%社交媒体2.96%展示广告0.02%
最新流量情况
月访问量
25296.55k
平均访问时长
285.77
每次访问页数
5.83
跳出率
43.31%
总流量趋势图
地理流量分布情况
美国
17.94%
中国
17.08%
印度
8.40%
俄罗斯
4.58%
日本
3.42%
地理流量分布全球图
同类开源产品
Seyft AI
Seyft AI 是一个实时的多模态内容审核平台,能够过滤文本、图像和视频中的有害和不相关内容,确保合规性,并为不同的语言和文化背景提供个性化解决方案。
AI内容检测#多模态
Censorfy
Censorfy是一个利用人工智能技术进行即时内容审核的平台,它能够对文本和图像进行审核,确保内容的合规性。
AI内容检测#人工智能
Omni Moderation Latest
omni-moderation-latest 是基于 GPT-4o 构建的新一代多模态内容审核模型,它在文本和图像内容的有害信息检测方面更加精确,帮助开发者构建更强大的审核系统。
AI内容检测#多模态
知网个人AIGC检测服务
中文精选
知网个人AIGC检测服务系统利用结构化、碎片化和知识元化的高质量文献大数据资源,结合知识增强AIGC检测技术和多种检测算法,从语言模式和语义逻辑两个维度,使用AI技术检测AIGC生成的内容,旨在帮助用户快速、准确地识别学术文本中的AI生成内
AI内容检测#AI技术
5118 AI内容检测器
中文精选
AI内容检测器是一款能够自动识别文本内容是由人工撰写还是AI生成的工具。
AI内容检测#文本分析
HUMN 1 Certification
优质新品
HUMN-1 Certification是一个由Winston AI推出的网站认证服务,旨在验证网站内容是否由人类创作,而非AI生成。
AI内容检测#原创性
知网查重
中文精选
知网个人查重服务是中国知网提供的一项专业文档查重服务,它通过先进的技术手段,帮助用户检测文档中的重复内容,优化了对自动洗稿、机器降重行为的甄别能力,有效应对AI改写行为。
AI内容检测#学术
Shieldgemma
ShieldGemma是由Google开发的一系列基于Gemma 2构建的安全内容审核模型,专注于四个危害类别(儿童不宜内容、危险内容、仇恨和骚扰)。
AI内容检测#文本生成
无忧智能审核系统
无忧智能审核系统是一款基于大数据、人工智能(AI)和自然语言处理技术(NLP)的文本自动查错与智能纠错系统。
AI内容检测#NLP