浙江保融科技股份有限公司包恩伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江保融科技股份有限公司申请的专利内容感知与智能路由的文档解析方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121457462B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610008121.3,技术领域涉及:G06F40/205;该发明授权内容感知与智能路由的文档解析方法、装置、设备及介质是由包恩伟;许海军;傅和平设计研发完成,并于2026-01-06向国家知识产权局提交的专利申请。
本内容感知与智能路由的文档解析方法、装置、设备及介质在说明书摘要公布了:本申请提供一种内容感知与智能路由的文档解析方法、装置、设备及介质,涉及人工智能及自然语言处理技术领域。该方法包括:对待识别多模态文档进行内容感知,提取待识别多模态文档的每页文档的多维度特征向量;采用预设路由决策模型对多维度特征向量进行路由,确定每页文档的文档解析工具;对待识别多模态文档的多页文档的文档解析工具进行统计,得到文档解析工具的解析页码;根据每个文档解析工具的解析页码,调用每个文档解析工具对解析页码对应的文档进行解析,得到局部解析结果;对所有局部解析结果进行整合,生成待识别多模态文档的目标解析结果。本申请可以降低文档解析工具的选择和使用门槛,提高文档解析的效率、质量和自动化程度。
本发明授权内容感知与智能路由的文档解析方法、装置、设备及介质在权利要求书中公布了:1.一种内容感知与智能路由的文档解析方法,其特征在于,所述方法包括: 对待识别文档进行内容感知,提取所述待识别文档的每页文档的多维度特征向量,并生成每个特征的置信度,所述多维度特征向量至少包括:所述待识别文档的格式特征、所述每页文档的质量特征、所述每页文档的布局特征和或所述每页文档的元素特征; 采用预设路由决策模型对所述多维度特征向量进行路由,确定所述每页文档的文档解析工具; 对所述待识别文档的多页文档的文档解析工具进行统计,得到至少一个文档解析工具的解析页码; 根据每个文档解析工具的解析页码,调用所述每个文档解析工具对所述解析页码对应的文档进行解析,得到局部解析结果; 对所述至少一个文档解析工具的局部解析结果进行整合,生成所述待识别文档的目标解析结果; 所述采用预设路由决策模型对所述多维度特征向量进行路由,确定所述每页文档的文档解析工具,包括: 若所述预设路由决策模型为预设决策规则,所述预设决策规则预先定义了不同特征组合所对应的文档解析工具,根据所述每页文档的多维度特征向量,从所述预设决策规则中选择匹配度最高的特征组合所对应的文档解析工具,并根据所述多维度特征向量与匹配度最高的特征组合中匹配的特征的置信度,计算匹配的文档解析工具的置信度;或者, 若所述预设路由决策模型为预先训练的分类模型,采用所述分类模型对所述每页文档的多维度特征向量进行识别,输出多个文档解析工具与所述多维度特征向量匹配的概率,确定概率值最大的文档解析工具,并将所述概率值作为所述文档解析工具的置信度; 若根据所述预设决策规则或所述分类模型确定的文档解析工具的置信度高于预设阈值,确定根据所述预设决策规则或所述分类模型确定的文档解析工具为所述每页文档的文档解析工具; 若根据所述预设决策规则或所述分类模型确定的文档解析工具的置信度低于预设阈值,根据多个文档解析工具的描述信息和所述多维度特征向量,生成文档解析提示词;采用预先训练的大语言模型根据所述文档解析提示词,确定所述每页文档的文档解析工具。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江保融科技股份有限公司,其通讯地址为:310012 浙江省杭州市余杭区仓前街道文一西路1500号3幢236室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励