Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学许勤昆获国家专利权

电子科技大学许勤昆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利一种OCR文本纠错方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116682132B

龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310663686.1,技术领域涉及:G06V30/418;该发明授权一种OCR文本纠错方法是由许勤昆;徐行设计研发完成,并于2023-06-06向国家知识产权局提交的专利申请。

一种OCR文本纠错方法在说明书摘要公布了:该发明公开了一种OCR文本纠错方法,本发明在编码器后链接一个全连接层DenseLayer作为解码器Decoder。在解码器解码过程中,使用集束搜索BeamSearch方法优化解空间的搜索路径,得到排名前KK为集束搜索的搜索宽度的候选结果。再对候选结果通过log_softmax函数计算出概率分布,最终从概率分布中选出概率分数最高的候选作为纠错后的文本。相比于之前仅使用纯本文进行OCR文本纠错,该发明能够更好地利用文档的布局和视觉信息,更好地提升了纠错结果,在数据集SROIE上的纠错性能较纯文本的纠错方案提升了约20%。

本发明授权一种OCR文本纠错方法在权利要求书中公布了:1.一种OCR文本纠错方法,具体包括如下步骤: 步骤1:数据采集与预处理; 步骤1.1:采集扫描图片,获取扫描图片的OCR原始文本,对获取的OCR原始文本进行人工校对,得到对应的人工校对文本,然后将获取的数据分为训练集、验证集和测试集; 步骤1.2:进行文本对齐; 将OCR原始文本与人工校对文本进行对齐,使得OCR原始文本与人工校对文本之间的编辑距离最小,所述编辑距离是针对两个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串;将OCR对齐文本和人工校对对齐文本合并,形成文本对; 步骤1.3:对文本对中的文本进行窗口分割,窗口分割时的滑动步长小于窗口的长度; 步骤1.4:移除文本对中的占位符; 步骤1.5:将步骤1.4得到的文本转换为词向量; 步骤1.6:对每个字符计算出一个边框; 步骤1.7:使用python图像处理函数库cv2加载扫描图片,加载后的图片以三维张量I的形式存储; 步骤2:采用步骤1得到的数据训练一个纠错模型,该纠错模型包括:编码器和解码器,所述编码器包括:文本编码器、图像编码器、布局编码模块、多模态编码器,解码器为全连接层;多模态编码器的输出连接解码器的输入; 所述文本编码器包括文本向量编码器,分段向量编码器,一维位置向量编码器;将步骤1.5得到的词向量分别经过文本向量编码器、分段向量编码器、一维位置向量编码器分别得到文本向量编码、分段向量编码、一维位置编码;将三个部分相加得到文本向量编码T: ; 所述图像编码器包括:视觉编码器,线性投影层,一维位置编码器,分段向量编码器;将步骤1.7得到的三维张量I通过视觉编码器后得到特征向量,再平均池化为固定尺寸;然后依次进行按行展开,然后经过线性投影层得到特征向量序列ProjVisTokEmbI;将特征向量补充一维位置向量和分段向量后,经过分段向量编码器后得到;将特征向量中的每一个特征图赋予一个位置索引,得到一维位置向量,M为特征向量序列的长度,一维位置向量经一维位置编码器编码后得到; 将三个部分相加得到图像编码V: ; 所述布局编码模块是对步骤1.6得到的边框所表示的二维位置信息进行编码; 所述多模态编码器为融合文本编码器、图像编码器、布局编码模块的输出; 所述纠错模型的损失函数为: ; 其中,t为标签的长度,表示给定输入样本,并且已知标签的前j-1个字符,文本纠错模型输出的下一个字符为的概率; 步骤3:遇到新的待纠错文本后,采用步骤1的方法进行预处理,然后采用步骤2训练好的纠错模型进行纠错。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。