Video LLaVA
简介 :
Video-LLaVA 是一个用于学习联合视觉表示的模型,通过对齐前投影进行训练。它可以将视频和图像表示进行对齐,从而实现更好的视觉理解。该模型具有高效的学习和推理速度,适用于视频处理和视觉任务。
需求人群 :
视频处理、视觉任务
总访问量: 1.5M
占比最多地区: US(13.62%)
本站浏览量 : 67.9K
使用场景
使用 Video-LLaVA 进行视频分类
利用 Video-LLaVA 进行图像检索
应用 Video-LLaVA 进行目标跟踪
产品特色
学习联合视觉表示
对齐前投影
高效的学习和推理速度
AIbase
智启未来,您的人工智能解决方案智库
简体中文