简介
emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。
截图

产品特色
收集了5329个表情包,用于视觉标注和多模态学习。
使用 glm-4v api 和 step-free-api 进行图像解析和标注。
可以用于创建智能体,提高自然语言处理和图像识别的准确性。
提供了一个绘图接口,方便用户直接调用获取表情包。
数据集支持多模态学习,有助于提升模型对图像和文本的理解能力。
提供了完整的文件下载链接,方便用户获取和使用数据集。
使用教程
访问 emo-visual-data 的 GitHub 页面,了解数据集的基本信息和使用条件。
根据需要选择合适的下载方式,例如通过 Google Drive 下载完整的数据集文件。
阅读 README 文件,了解数据集的结构和如何使用数据集中的文件。
使用 glm-free-api 绘图接口调用获取表情包,注意修改 model 参数以适应不同的需求。
将数据集应用于自己的项目中,例如训练模型或开发应用程序。
根据项目进展和需求,不断迭代和优化使用数据集的方法。
流量来源
直接访问 | 51.61% | 外链引荐 | 33.46% | 邮件 | 0.04% |
自然搜索 | 12.58% | 社交媒体 | 2.19% | 展示广告 | 0.11% |
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
同类开源产品

Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR

Image Describer
Image Describer图像描述生成器是一款利用人工智能技术,通过上传图像并根据用户需求输出图像描述的工具。
AI图像检测识别#文本转语音

Viewly
Viewly是一款强大的AI图片识别应用,它能够识别图片中的内容,并通过AI技术进行作诗和翻译成多国语言。
AI图像检测识别#图像识别

Pimeyes
PimEyes是一个利用面部识别技术提供反向图片搜索服务的网站,用户可以通过上传照片来查找互联网上与该照片相似的图片或个人信息。
AI图像检测识别#反向图片搜索

YOLO11
Ultralytics YOLO11是基于之前YOLO系列模型的进一步发展,引入了新特性和改进,以提高性能和灵活性。
AI图像检测识别#机器学习

Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索

Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别

Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习

GOT OCR2.0
GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。
AI图像检测识别#深度学习
替代品

Esearch
eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。
AI图像检测识别#OCR

Revisit Anything
Revisit Anything 是一个视觉位置识别系统,通过图像片段检索技术,能够识别和匹配不同图像中的位置。
AI图像检测识别#图像检索

Joy Caption Alpha One
Joy Caption Alpha One 是一款基于人工智能的图像描述生成器,能够将图片内容转化为文字描述。
AI图像检测识别#图像识别

Open Source Computer Vision Library
OpenCV是一个跨平台的开源计算机视觉和机器学习软件库,它提供了一系列编程功能,包括但不限于图像处理、视频分析、特征检测、机器学习等。
AI图像检测识别#机器学习

GOT OCR2.0
GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。
AI图像检测识别#深度学习

Bonding W Geimini
bonding_w_geimini是一个基于Streamlit框架开发的图像处理应用,它允许用户上传图片,通过Gemini API进行物体检测,并在图片上直接绘制出物体的边界框。
AI图像检测识别#物体检测

Labelu Kit
labelU-Kit 是一个开源的前端标注组件库,提供图片、视频和音频的标注功能,支持2D框、点、线、多边形、立体框等多种标注方式。
AI图像检测识别#机器学习

Labelu
优质新品
LabelU是一个开源的数据标注工具,适用于需要对图像、视频、音频等数据进行高效标注的场景,以提升机器学习模型的性能和质量。
AI图像检测识别#机器学习

SAM Graph
SAM-guided Graph Cut for 3D Instance Segmentation是一种利用3D几何和多视图图像信息进行3D实例分割的深度学习方法。
AI图像检测识别#深度学习
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k