SEED Story : 多模态长篇故事生成模型

SEED Story

简介 :

SEED-Story是一个基于大型语言模型（MLLM）的多模态长篇故事生成模型，能够根据用户提供的图片和文本生成丰富、连贯的叙事文本和风格一致的图片。它代表了人工智能在创意写作和视觉艺术领域的前沿技术，具有生成高质量、多模态故事内容的能力，为创意产业提供了新的可能性。

需求人群 :

SEED-Story的目标受众主要是人工智能研究人员、数据科学家、创意产业专业人士以及对人工智能创作感兴趣的开发者。该模型能够帮助他们探索和实现创意写作和视觉艺术的新形式，提供一种全新的内容生成方式。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 77.6K

使用场景

使用SEED-Story生成基于特定历史事件的多模态故事。

结合用户上传的图片，生成个性化的儿童故事书。

为电影或游戏创作提供初始的故事概念和视觉设计。

产品特色

生成多模态长篇故事：结合文本和图片生成连贯的故事。

基于用户输入的图片和文本：作为故事的起点。

支持最多25个多模态序列的故事生成：尽管训练时最多使用10个序列。

图像风格和角色一致性：确保生成的图片在风格和角色上与故事文本一致。

大规模数据集StoryStream：为训练和基准测试多模态故事生成而设计。

模型权重和训练代码的发布：提供预训练的Tokenizer、De-Tokenizer和基础模型SEED-X。

支持指令调整：通过指令调整进一步优化模型性能。

使用教程

1. 克隆SEED-Story仓库到本地环境。

2. 安装依赖包，根据requirements.txt配置Python环境。

3. 下载并准备StoryStream数据集，用于训练和测试。

4. 使用提供的脚本进行数据集的分块处理，以提高训练效率。

5. 下载并保存预训练的模型权重到指定文件夹。

6. 运行inference脚本进行多模态故事生成。

7. 利用可视化脚本展示生成的故事和多模态注意力。

8. 通过GPT4 API进行生成结果的评估。

精选AI产品推荐

智启未来，您的人工智能解决方案智库

简体中文

直接访问	51.61%	外链引荐	33.46%	邮件	0.04%
自然搜索	12.58%	社交媒体	2.19%	展示广告	0.11%