Workflowllm
简介
WorkflowLLM是一个以数据为中心的框架,旨在增强大型语言模型(LLMs)在工作流编排方面的能力。核心是WorkflowBench,这是一个大规模的监督式微调数据集,包含来自83个应用、28个类别的1503个API的106763个样本。WorkflowLLM通过微调Llama-3.1-8B模型,创建了专门针对工作流编排任务优化的WorkflowLlama模型。实验结果表明,WorkflowLlama在编排复杂工作流方面表现出色,并且能够很好地泛化到未见过的API。
截图

产品特色
数据收集:从RoutineHub等平台收集现实世界的Apple快捷指令,并将其转录成Python风格的代码。
查询扩展:使用ChatGPT生成多样化和复杂的任务查询,以丰富工作流数据集。
工作流生成:训练有素的注释模型为合成查询生成工作流,然后进行质量检查,并与收集的样本合并,形成最终的数据集。
模型微调:使用WorkflowBench微调Llama-3.1-8B模型,创建WorkflowLlama,专门针对工作流编排任务优化。
实验结果:WorkflowLlama在编排复杂工作流和泛化到未见API方面表现出色。
数据预处理:将原始的Apple Shortcuts plist格式转换为抽象语法树(AST)表示,提高数据的可读性和实用性。
训练与推理:提供工具用于模型的训练和推理,支持日志记录和保存中间检查点。
使用教程
1. 环境设置:确保Python 3.8已安装,并根据requirements.txt安装所有依赖。
2. 数据预处理:运行preprocess/Convert_ShortCut_to_Python.py脚本来将.plist或.shortcut文件转换为Python兼容格式。
3. 训练模型:执行scripts/train.sh脚本来开始训练模型,提供基础模型路径和数据路径作为参数。
4. 运行推理:模型训练完成后,使用scripts/infer.sh运行推理,提供训练好的模型检查点路径。
5. 查看结果:分析模型的输出,评估工作流编排的效果。
6. 微调和优化:根据实验结果对模型进行微调,以适应特定的工作流需求。
流量来源
直接访问 | 51.61% | 外链引荐 | 33.46% | 邮件 | 0.04% |
自然搜索 | 12.58% | 社交媒体 | 2.19% | 展示广告 | 0.11% |
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
精选AI产品推荐

Nocode
中文精选
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。
开发平台#应用开发
912

Listenhub
优质新品
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。
音频生成#AI
348

Lovart
国外精选
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。
AI设计工具#创意工具
1,128

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。
AI模型#图像处理开源
564

Smart PDFs
国外精选
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。
文章摘要#AI
984

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。
视频编辑#视频处理开源
480

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。
音频生成#文本转语音
26.38k

Liblibai
中文精选
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。
AI模型#图像生成
344.42k