# 人机交互

Magentic UI
Magentic-UI 是一个基于多代理系统的研究原型,允许用户通过透明且可控的界面进行网络浏览和任务自动化。
自动化工作流#人机交互开源
672

Omnitalker
中文精选
OmniTalker 是由阿里巴巴 Tongyi 实验室提出的一种统一框架,旨在实时生成音频和视频,提升人机交互体验。
视频生成#人机交互开源
9,912

Conversational Video Interface
Conversational Video Interface(CVI)是Tavus推出的一种情感智能对话视频界面。
聊天机器人#情感智能
1,140

Project Mariner
Project Mariner是Google DeepMind基于Gemini 2.0模型开发的早期研究原型,旨在探索未来的人机交互方式,特别是在网络浏览器中的应用。
AI搜索#人机交互
888

Showui
ShowUI是一个轻量级的视觉-语言-行动模型,专为GUI代理设计。
AI模型#GUI自动化开源
792

Ant Design X
优质新品
Ant Design X 是由Ant Design团队推出的AI界面解决方案,它基于RICH设计范式(角色、意图、会话和混合界面),延续Ant Design的设计语言,提供了全新的AGI混合界面(Hybrid-UI)解决方案。
AI设计工具#界面设计
1,104

Gyges Labs
Gyges Labs致力于创造AI时代的智能穿戴设备,结合了独特的先进光学技术和协作AI技术。
#视网膜投影
1,020

PARTNR
PARTNR是由Meta FAIR发布的一个大规模基准测试,包含100,000个自然语言任务,旨在研究多智能体推理和规划。
研究工具#多智能体
480

Agent S
Agent S是一个开放的代理框架,旨在通过图形用户界面(GUI)实现与计算机的自主交互,通过自动化复杂多步骤任务来转变人机交互。
智能体#自动化
780

心辰lingo语音大模型
中文精选
心辰Lingo语音大模型是一款先进的人工智能语音模型,专注于提供高效、准确的语音识别和处理服务。
AI语音识别#自然语言处理
1,164

LSLM
Listening-while-Speaking Language Model (LSLM)是一款旨在提升人机交互自然度的人工智能对话模型。
聊天机器人#语音识别
1,752

Controlmm
ControlMM是一个全身运动生成框架,具有即插即用的多模态控制功能,能够在文本到运动(Text-to-Motion)、语音到手势(Speech-to-Gesture)和音乐到舞蹈(Music-to-Dance)等多个领域中生成稳健的运动
AI模型#动作生成开源
1,692

V Express
优质新品
V-Express是一个由腾讯AI实验室开发的头像视频生成模型,它通过一系列渐进式丢弃操作平衡不同的控制信号,使得生成的视频能够同时考虑姿态、输入图像和音频。
AI头像生成#人工智能开源
2,640

The Shape Of AI
国外精选
The Shape of AI 是一个专注于人工智能交互模式的网站,它提供了关于如何在设计中融入人工智能的深入见解。
AI设计工具#用户体验
3,420

Hume AI EVI
国外精选
Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。
AI语音助手#人机交互
1,512

AMBIDEX
AMBIDEX是NAVER LABS开发的双臂机器人,旨在实现与人类的安全共存。
机器人#人机交互
636

EMAGE
EMAGE是一种统一的整体共话手势生成模型,通过表情丰富的掩蔽音频手势建模来生成自然的手势动作。
AI图像生成#音频手势建模开源
1,848

01 Light
01 Light是一款语音控制界面,可以让你用语音控制家用电脑执行各种操作。
个人助理#人机交互
2,412

Salieri AI
Salieri是一个多元宇宙AI平台,帮助用户创建、配置和分享无限的并行世界。
AI模型#人机交互
3,108

Universal Manipulation Interface
通用操作接口(UMI)是一个数据收集和策略学习框架,允许直接将现场人类演示中的技能转移到可部署的机器人策略。
AI机器人#机器人开源
2,724

Speechgpt
SpeechGPT是一种多模态语言模型,具有内在的跨模态对话能力。
AI语音合成#多模态开源
2,988

LAM
rabbit是一个研究项目,旨在开发可以理解和模拟人类在计算机应用中的行为的系统。
AI Agents#自然语言处理
2,532

Insactor
InsActor是一个基于物理模拟的角色控制系统。
AI Agents#控制开源
1,680
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k