Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华院计算技术(上海)股份有限公司白琪获国家专利权

华院计算技术(上海)股份有限公司白琪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华院计算技术(上海)股份有限公司申请的专利一种基于多策略融合的PDF文档发票页快速识别与提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121392865B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511963900.0,技术领域涉及:G06V30/19;该发明授权一种基于多策略融合的PDF文档发票页快速识别与提取方法是由白琪;虞钉钉;徐清;张泰宇;张逸雯;王浩然;夏天;曹培;沈旭立;赵爽;李涵文设计研发完成,并于2025-12-23向国家知识产权局提交的专利申请。

一种基于多策略融合的PDF文档发票页快速识别与提取方法在说明书摘要公布了:本发明提供一种基于多策略融合的PDF文档发票页快速识别与提取方法,涉及文档图像识别与提取技术领域。其中,基于多策略融合的PDF文档发票页快速识别与提取方法包括:并行化检查PDF文档中的每一页,提取页面中的内嵌图像资源;应用二维码识别策略,尝试解码并以语义验证的方式进行发票判定;作为补充判定策略,使用黑色像素检测策略判别图片左上角是否存在二维码;最后将判定结果合并输出。本发明通过二维码语义验证+黑像素结构检测的两策略快速融合方法,实现对PDF文档发票页的高效识别与提取,在页数众多的批量任务中,保证判定的准确性并提升处理速度。

本发明授权一种基于多策略融合的PDF文档发票页快速识别与提取方法在权利要求书中公布了:1.一种基于多策略融合的PDF文档发票页快速识别提取方法,其特征在于,包括以下步骤: S1、并行化检查PDF文档中的每一页,提取页面中的所有内嵌图像资源,形成每一页的图像队列; S2、对步骤S1所得图像队列,应用二维码识别策略依次识别其中的图像,尝试解码并以语义验证的方式进行发票判定;判定成功时确定该页为发票页,同时停止对该图像队列的识别; S3、对步骤S2识别失败的图像队列,应用黑色像素检测策略依次检测其中的图像;具体步骤包括: S31、通过尺寸筛选,排除不可能是二维码的图片; S32、提取图像左上角的正方形候选区域图像; S33、将候选区域图像转换为灰度图像,再对各像素点进行黑白二值化转换,统计其中黑色像素点的占比,对占比值大于占比阈值的情形,判定候选区域图像为二维码; S34、当某图像被判定为二维码时,其所在图像队列对应的页面被标记为发票页,同时停止对该图像队列的检测; S4、根据步骤S2、S3的结果,将发票页与非发票页分别提取并保存,输出提取结果报告。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华院计算技术(上海)股份有限公司,其通讯地址为:201210 上海市浦东新区中科路1750号1幢23层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。