Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天津大学何凯获国家专利权

天津大学何凯获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天津大学申请的专利一种基于卷积神经网络模型的场景文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117237961B

龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311143108.1,技术领域涉及:G06V30/148;该发明授权一种基于卷积神经网络模型的场景文本识别方法是由何凯;刘子康;唐金龙设计研发完成,并于2023-09-06向国家知识产权局提交的专利申请。

一种基于卷积神经网络模型的场景文本识别方法在说明书摘要公布了:本发明公开了一种基于卷积神经网络模型的场景文本识别方法,方法包括:对文本图片使用特征编码器进行特征初步提取;对提取到的特征图进行双线性上采样或最大池化处理,使不同维度的特征转化为相同的维度;构建RNSTR网络模型,利用训练集进行训练;输入待测图片,利用构建的RNSTR网络模型进行识别。本发明解决了场景文本识别准确率较低的问题,实现了场景文本的自动识别。

本发明授权一种基于卷积神经网络模型的场景文本识别方法在权利要求书中公布了:1.一种基于卷积神经网络模型的场景文本识别方法,其特征在于,所述方法包括: 构建RNSTR网络模型,利用训练集进行训练;输入待测图像,利用训练好的RNSTR网络模型进行场景文本识别; 其中,所述RNSTR网络模型采用双路并行的结构,包括第一特征提取分支、第二特征提取分支以及特征融合模块: 第一特征提取分支包括空间位置信息感知模块,用于提取不同维度特征层之间的空间特征信息; 第二特征提取分支包括全局特征增强模块,用于对所述待测图像进行选择性特征增强; 所述第一特征提取分支与第二特征提取分支并行工作,其输出经特征融合模块进行融合处理; 所述空间位置信息感知模块包括:10个卷积层、5个激活层、1个池化层; 所述特征融合模块包括:卷积层C3_1、自适应平均池化层AP3_1和激活层RL3_1; 所述全局特征增强模块由2层卷积层和1个激活层组成; 所述10个卷积层、5个激活层、1个池化层为: C1_1为卷积层,卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为32; C1_2为卷积层,卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; SM1_1为激活层,使用softmax作为激活函数,输入图像大小为8×25,输出图像大小为8×25; C1_3为卷积层,卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为32; C1_4为卷积层,卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; SM1_2为激活层,使用softmax作为激活函数,输入图像大小为8×25,输出图像大小为8×25; C1_5为卷积层,卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为64; C1_6为卷积层,卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; SM1_3为激活层,使用softmax作为激活函数,输入图像大小为8×25,输出图像大小为8×25; C1_7为卷积层,卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为128; C1_8为卷积层,卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; SM1_4为激活层,使用softmax作为激活函数,输入图像大小为8×25,输出图像大小为8×25; C1_9为卷积层,卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为256; C1_10为卷积层,卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; SM1_5为激活层,使用softmax作为激活函数,输入图像大小为8×25,输出图像大小为8×25; MP_1为池化层,池化过滤器大小为2×2,步长为2,输入图像大小为16×50,输出图像大小为8×25; 所述卷积层C3_1、自适应平均池化层AP3_1和激活层RL3_1为: 卷积层C3_1的卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为512;自适应平均池化层AP3_1的输入图像大小为8×25,输出图像大小为1×1;激活层RL3_1使用Sigmoid作为激活函数,输入图像大小为1×1,输出图像大小为1×1; 所述2层卷积层和1个激活层为: 卷积层C2_1的卷积核大小为3×3,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为496; 卷积层C2_2的卷积核大小为1×1,步长为1,输入图像大小为8×25,输出图像大小为8×25,通道数大小为1; 激活层SM3_1,使用softmax作为激活函数,输入图像大小为1×1,输出图像大小为1×1; 所述待测图像通过通道数为512,卷积核大小为1×1的卷积层得到第一文本特征,第一文本特征经过池化过滤器大小为2×2的最大池化层处理,得到第一文本池化特征,输入到所述空间位置信息感知模块处理,第一文本特征再经过通道数为256,卷积核大小为1×1的卷积层得到第二文本特征,输入到所述空间位置信息感知模块处理,第二文本特征再经过通道数为128,卷积核大小为1×1的卷积层得到第三文本特征,输入到所述空间位置信息感知模块处理,第三文本特征再经过通道数为64,卷积核大小为1×1的卷积层得到第四文本特征,输入到所述空间位置信息感知模块处理,第四文本特征再经过通道数为32,卷积核大小为1×1的卷积层得到第五文本特征,输入到所述空间位置信息感知模块处理; 所述第一文本池化特征经过所述C1_9卷积处理得到第一文本池化卷积特征,所述第一文本池化卷积特征,再经过所述C1_10卷积处理接着经过所述SM1_5激活处理,得到第一文本池化卷积处理特征,所述第一文本池化卷积处理特征和所述第一文本池化卷积特征相乘得到第一文本相乘特征,所述第一文本相乘特征和所述第一文本池化卷积特征相加得到第一文本处理特征; 所述第二文本特征经过所述C1_7卷积处理得到第二文本卷积特征,所述第二文本卷积特征再经过所述C1_8卷积处理,接着经过所述SM1_4激活处理,得到第二文本卷积处理特征,所述第二文本卷积处理特征和所述第二文本卷积特征相乘,得到第二文本相乘特征,所述第二文本相乘特征和所述第二文本卷积特征相加,得到第二文本处理特征; 所述第三文本特征经过所述C1_5卷积处理得到第三文本卷积特征,所述第三文本卷积特征再经过所述C1_6卷积处理接着经过所述SM1_3激活处理得到第三文本卷积处理特征,所述第三文本卷积处理特征和所述第三文本卷积特征相乘,得到第三文本相乘特征,所述第三文本相乘特征和所述第三文本卷积特征相加,得到第三文本处理特征; 所述第四文本特征经过所述C1_3卷积处理得到第四文本卷积特征,所述第四文本卷积特征再经过所述C1_4卷积处理接着经过所述SM1_2激活处理,得到第四文本卷积处理特征,所述第四文本卷积处理特征和所述第四文本卷积特征相乘,得到第四文本相乘特征,所述第四文本相乘特征和所述第四文本卷积特征相加,得到第四文本处理特征; 所述第五文本特征经过所述C1_1卷积处理得到第五文本卷积特征,所述第五文本卷积特征再经过所述C1_2卷积处理接着经过所述SM1_1激活处理,得到第五文本卷积处理特征,所述第五文本卷积处理特征和所述第五文本卷积特征相乘,得到第五文本相乘特征,所述第五文本相乘特征和所述第五文本卷积特征相加,得到第五文本处理特征; 所述第一文本处理特征、所述第二文本处理特征、所述第三文本处理特征、所述第四文本处理特征和所述第五文本处理特征进行滤波器拼接,得到空间位置特征; 所述第一文本池化特征、所述第二文本特征、所述第三文本特征、所述第四文本特征和第五文本特征进行滤波器拼接得到全局拼接特征,输入到所述全局特征增强模块处理; 所述全局拼接特征经过所述卷积层C2_1处理得到全局卷积特征,所述全局卷积特征再经过所述卷积层C2_2处理接着经过所述激活层SM3_1处理得到全局处理特征,所述全局卷积特征和所述全局处理特征相乘得到全局相乘特征,所述全局相乘特征和所述全局卷积特征相加得到全局增强特征; 所述空间位置特征和所述全局增强特征输入特征融合模块处理,包括:所述空间位置特征和所述全局增强特征经过卷积层C3_1处理得到初步融合特征,所述初步融合特征经过所述自适应平均池化层AP3_1处理接着经过所述激活层RL3_1处理得到初步融合处理特征,所述初步融合处理特征和所述初步融合特征相乘得到融合相乘特征,所述融合相乘特征和所述初步融合特征相加得到融合相加特征,所述融合相加特征通过滤波器拼接得到输出特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。