Docgraphlm : 信息提取与问题解答的文档图语言模型

Docgraphlm

AI知识库 AI模型 #信息提取 #问题解答 #语言模型 #图形特征普通产品开源

简介 :

DocGraphLM是一种用于信息提取和问题解答的文档图语言模型。它采用了先进的视觉丰富文档理解技术，结合了预训练语言模型和图形语义。其独特之处在于提出了联合编码器架构来表示文档，并采用了一种新颖的链接预测方法来重构文档图。DocGraphLM通过收敛的联合损失函数预测节点之间的方向和距离，优先考虑邻域恢复并降低远程节点检测的权重。在三个SotA数据集上的实验表明，采用图形特征能够在信息提取和问题解答任务上实现一致的改进。此外，我们还报告说，采用图形特征能够加速训练过程中的收敛，尽管这些特征仅通过链接预测构建。

需求人群 :

DocGraphLM可用于处理复杂布局文档的信息提取和问题解答任务，适用于需要从结构复杂的文档中提取信息的场景。

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 56.6K

使用场景

将DocGraphLM应用于医学文档，实现从医学文献中提取疾病信息和解答医学问题。

利用DocGraphLM分析法律文件，从法律文书中抽取相关信息并回答法律问题。

在金融领域使用DocGraphLM，从金融报告中提取数据并解答相关问题。

产品特色

信息提取

问题解答