Workflowllm
Workflowllm
WorkflowLLM的目标受众是开发者、数据科学家和自动化工程师,特别是那些需要处理复杂工作流和自动化任务的人。该框架通过提供大规模的数据集和优化的模型,使得这些专业人员能够更有效地构建和部署基于LLM的解决方案,以实现业务流程的自动化。
总访问量: 474,564,576
占比最多地区: US(19.34%)
636
简介
WorkflowLLM是一个以数据为中心的框架,旨在增强大型语言模型(LLMs)在工作流编排方面的能力。核心是WorkflowBench,这是一个大规模的监督式微调数据集,包含来自83个应用、28个类别的1503个API的106763个样本。WorkflowLLM通过微调Llama-3.1-8B模型,创建了专门针对工作流编排任务优化的WorkflowLlama模型。实验结果表明,WorkflowLlama在编排复杂工作流方面表现出色,并且能够很好地泛化到未见过的API。
截图
产品特色
数据收集:从RoutineHub等平台收集现实世界的Apple快捷指令,并将其转录成Python风格的代码。
查询扩展:使用ChatGPT生成多样化和复杂的任务查询,以丰富工作流数据集。
工作流生成:训练有素的注释模型为合成查询生成工作流,然后进行质量检查,并与收集的样本合并,形成最终的数据集。
模型微调:使用WorkflowBench微调Llama-3.1-8B模型,创建WorkflowLlama,专门针对工作流编排任务优化。
实验结果:WorkflowLlama在编排复杂工作流和泛化到未见API方面表现出色。
数据预处理:将原始的Apple Shortcuts plist格式转换为抽象语法树(AST)表示,提高数据的可读性和实用性。
训练与推理:提供工具用于模型的训练和推理,支持日志记录和保存中间检查点。
使用教程
1. 环境设置:确保Python 3.8已安装,并根据requirements.txt安装所有依赖。
2. 数据预处理:运行preprocess/Convert_ShortCut_to_Python.py脚本来将.plist或.shortcut文件转换为Python兼容格式。
3. 训练模型:执行scripts/train.sh脚本来开始训练模型,提供基础模型路径和数据路径作为参数。
4. 运行推理:模型训练完成后,使用scripts/infer.sh运行推理,提供训练好的模型检查点路径。
5. 查看结果:分析模型的输出,评估工作流编排的效果。
6. 微调和优化:根据实验结果对模型进行微调,以适应特定的工作流需求。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图