SEED Story
SEED-Story的目标受众主要是人工智能研究人员、数据科学家、创意产业专业人士以及对人工智能创作感兴趣的开发者。该模型能够帮助他们探索和实现创意写作和视觉艺术的新形式,提供一种全新的内容生成方式。
总访问量: 474,564,576
占比最多地区: US(19.34%)
1,248
简介
SEED-Story是一个基于大型语言模型(MLLM)的多模态长篇故事生成模型,能够根据用户提供的图片和文本生成丰富、连贯的叙事文本和风格一致的图片。它代表了人工智能在创意写作和视觉艺术领域的前沿技术,具有生成高质量、多模态故事内容的能力,为创意产业提供了新的可能性。
截图
产品特色
生成多模态长篇故事:结合文本和图片生成连贯的故事。
基于用户输入的图片和文本:作为故事的起点。
支持最多25个多模态序列的故事生成:尽管训练时最多使用10个序列。
图像风格和角色一致性:确保生成的图片在风格和角色上与故事文本一致。
大规模数据集StoryStream:为训练和基准测试多模态故事生成而设计。
模型权重和训练代码的发布:提供预训练的Tokenizer、De-Tokenizer和基础模型SEED-X。
支持指令调整:通过指令调整进一步优化模型性能。
使用教程
1. 克隆SEED-Story仓库到本地环境。
2. 安装依赖包,根据requirements.txt配置Python环境。
3. 下载并准备StoryStream数据集,用于训练和测试。
4. 使用提供的脚本进行数据集的分块处理,以提高训练效率。
5. 下载并保存预训练的模型权重到指定文件夹。
6. 运行inference脚本进行多模态故事生成。
7. 利用可视化脚本展示生成的故事和多模态注意力。
8. 通过GPT4 API进行生成结果的评估。
流量来源
直接访问51.61%外链引荐33.46%邮件0.04%
自然搜索12.58%社交媒体2.19%展示广告0.11%
最新流量情况
月访问量
4.92m
平均访问时长
393.01
每次访问页数
6.11
跳出率
36.20%
总流量趋势图
地理流量分布情况
美国
19.34%
中国
13.25%
印度
9.32%
俄罗斯
4.28%
德国
3.63%
地理流量分布全球图
替代品