福建警察学院;杭州海康威视数字技术股份有限公司董煜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉福建警察学院;杭州海康威视数字技术股份有限公司申请的专利一种通用视觉模型训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121415331B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512008636.1,技术领域涉及:G06V20/40;该发明授权一种通用视觉模型训练方法及系统是由董煜;任文奇;任烨;詹申平;陆展鸿;徐玲;陈木生;钟凯伦设计研发完成,并于2025-12-29向国家知识产权局提交的专利申请。
本一种通用视觉模型训练方法及系统在说明书摘要公布了:本发明涉及一种通用视觉模型训练方法及系统,属于计算机视觉技术领域,方法步骤包括:获取待检测视频样本,利用主干网络提取视频序列中连续多帧图像的多层次多尺度特征;基于相邻帧的特征,通过光流预测网络预测从待检测帧到目标帧的光流场;利用待检测帧和目标帧的真值框信息计算运动位移真值,并对光流场进行监督约束;利用光流场将相邻帧特征扭曲对齐,并与待检测帧特征融合,生成增强特征;基于增强特征,通过目标检测网络进行目标分类和定位;结合目标检测损失和光流监督损失构建总损失函数,对主干网络、光流预测网络和目标检测网络进行端到端联合优化训练,利用训练完成的视觉模型输出视频监测结果。
本发明授权一种通用视觉模型训练方法及系统在权利要求书中公布了:1.一种通用视觉模型训练方法,其特征在于,具体步骤包括: 获取待检测视频样本,利用主干网络提取视频序列中连续多帧图像的多层次的多尺度特征; 基于相邻帧的多层次的多尺度特征,通过光流预测网络预测从待检测帧图像到目标帧图像的光流场; 利用待检测帧图像与目标帧图像中的真值框信息,计算真值框对应区域的运动位移真值,并基于运动位移真值对预测的光流场中相应区域的光流向量进行监督约束;所述进行监督约束步骤具体为: 对于待检测帧图像中的每一个真值框,计算其与目标帧图像中对应匹配的真值框之间的几何中心位移,作为待检测帧的真值框对应区域的运动位移真值; 在预测的光流场上,统计所述待检测帧的真值框对应区域的平均光流向量; 计算平均光流向量与运动位移真值之间的差异,并预设差异阈值范围作为光流监督约束; 利用预测的光流场,将相邻帧图像的多层次的多尺度特征向待检测帧图像的多层次的多尺度特征进行扭曲对齐,并与待检测帧图像的同层次同尺度特征进行融合,生成增强后的待检测帧图像的多层次的多尺度特征;所述扭曲对齐步骤具体为: 基于从待检测帧到目标帧的光流场,通过可微采样变换将目标帧的多层次的多尺度特征向待检测帧对应尺度的特征进行空间对齐,生成与待检测帧特征空间一致的扭曲特征图; 其中,所述可微采样变换采用双线性插值方法实现特征值的重采样; 所述融合步骤具体为: 对于扭曲后的相邻帧特征图与待检测帧特征图,通过卷积神经网络学习一个空间自适应的权重图; 利用所述权重图对相邻帧图像的扭曲特征与待检测帧图像的同尺度特征进行加权融合; 基于增强后的待检测帧图像的多层次的多尺度特征,通过目标检测网络进行目标分类与定位,输出待检测帧的检测结果; 基于待检测帧图像的检测结果与真值框信息构建目标检测损失函数,基于待检测帧和目标帧中同一实例的真值框信息,构建光流监督损失函数;结合光流监督损失函数与目标检测损失函数构建总损失函数,对主干网络、光流预测网络和目标检测网络进行端到端的联合优化训练,利用训练完成的视觉模型输出视频监测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建警察学院;杭州海康威视数字技术股份有限公司,其通讯地址为:350007 福建省福州市仓山区首山路59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励