湖南师范大学王润民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南师范大学申请的专利一种基于多模态语义-视觉融合的伪装野生动物实时检测方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121544998B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610070540.X,技术领域涉及:G06V10/80;该发明授权一种基于多模态语义-视觉融合的伪装野生动物实时检测方法、系统、设备及介质是由王润民;许涵;马帅;柴欣灵;符文;刘锦辉;丁亚军设计研发完成,并于2026-01-20向国家知识产权局提交的专利申请。
本一种基于多模态语义-视觉融合的伪装野生动物实时检测方法、系统、设备及介质在说明书摘要公布了:本发明提供了一种基于多模态语义‑视觉融合的伪装野生动物实时检测方法、系统、设备及介质,该方法包括:获取语义‑视觉配对数据集;通过视觉分支、语义分支、自适应残差跨模态融合模块和多尺度动态感知残差模块构建多模态语义‑视觉融合网络;将所述语义‑视觉配对数据集输入至所述多模态语义‑视觉融合网络进行处理,以获取目标检测结果;本方法通过构建的多模态语义‑视觉融合网络对语义‑视觉配对数据集进行处理,基于文本关键词的引导,融合文本特征和视觉特征,检测出隐藏在大自然环境中的伪装野生动物,以达到实时监控和生态保护效果,从而提高检测准确性,降低误判率;该系统具有相同的有益效果。
本发明授权一种基于多模态语义-视觉融合的伪装野生动物实时检测方法、系统、设备及介质在权利要求书中公布了:1.一种基于多模态语义-视觉融合的伪装野生动物实时检测方法,其特征在于,包括以下步骤: 获取语义-视觉配对数据集; 通过视觉分支、语义分支、自适应残差跨模态融合模块和多尺度动态感知残差模块构建多模态语义-视觉融合网络; 将所述语义-视觉配对数据集输入至所述多模态语义-视觉融合网络进行处理,以获取目标检测结果; 所述通过视觉分支、语义分支、自适应残差跨模态融合模块和多尺度动态感知残差模块构建多模态语义-视觉融合网络,具体包括: 在所述视觉分支中,通过编码器对所述语义-视觉配对数据集进行处理,以获取多个初始视觉特征; 采用3×3卷积层、BatchNorm层、LeakyRelu函数对多个初始视觉特征进行处理,以提取目标视觉特征; 在所述语义分支中,通过CLIP编码器对所述语义-视觉配对数据集的文本描述进行处理,以获取语义约束; 将所述语义约束进行维度变换,以得到语义特征; 将所述语义特征和所述目标视觉特征输入所述自适应残差跨模态融合模块中动态聚合所述语义特征与所述目标视觉特征,以获取跨模态上下文的表征; 将所述表征结合可学习权重参数,再与所述目标视觉特征相加,以获取语义-视觉融合特征; 将所述语义-视觉融合特征输入所述多尺度动态感知残差模块中,通过多个动态卷积层提取不同感受野下的图像特征,以获取动态感知特征; 将所述动态感知特征沿通道维度进行拼接得到第一特征后,通过1×1卷积层、BacthNorm层、LeakyRelu层对所述第一特征进行通道变换,将变换后的所述第一特征通过残差结构与所述语义-视觉融合特征相加得到初始输出特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南师范大学,其通讯地址为:410006 湖南省长沙市岳麓区麓山路36号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励