# 多任务学习

Π0
π0是一个通用型机器人基础模型,旨在通过实体化训练让AI系统获得物理智能,能够执行各种任务,就像大型语言模型和聊天机器人助手一样。
智能体#机器人
816

GR 2
GR-2是一个先进的通用机器人代理,专为多样化和可泛化的机器人操作而设计。
AI模型#人工智能开源
348

Gemma 2 9b It
优质新品
Gemma-2-9b-it是由Google开发的一系列轻量级、最先进的开放模型,基于与Gemini模型相同的研究和技术构建而成。
AI模型#自然语言处理开源
612

Florence 2 Base Ft
Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。
AI图像生成#视觉-语言模型开源
1,200

Florence 2 Large Ft
Florence-2-large-ft是由微软开发的高级视觉基础模型,使用基于提示的方法来处理广泛的视觉和视觉-语言任务。
AI图像生成#自然语言处理开源
1,500

Florence 2 Base
Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。
AI图像生成#多任务学习开源
912

Florence 2 Large
Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。
AI图像生成#多任务学习开源
780

Florence 2
优质新品
Florence-2是一个新型的视觉基础模型,它通过统一的、基于提示的表示方式,能够处理多种计算机视觉和视觉-语言任务。
AI图像生成#多任务学习开源
840

Streamspeech
优质新品
StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。
AI翻译#多任务学习开源
2,376

Pile T5
优质新品
Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。
模型训练与部署#机器学习
756

VSP LLM
VSP-LLM是一个结合视觉语音处理(Visual Speech Processing)与大型语言模型(LLMs)的框架,旨在通过LLMs的强大能力最大化上下文建模能力。
AI模型#大型语言模型开源
5,952

Internlm2
「书生·浦语2.0」InternLM2是一个面向中文和英文的大型多语言预训练语言模型。
AI模型#预训练语言模型开源
11.95k

Emu Edit
Emu Edit是一款多任务图像编辑模型,通过识别和生成任务完成精准图像编辑,并在此领域内取得了最新的技术突破。
AI图像编辑#多任务学习
3,456
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k