厦门大学林贤明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利基于适配器的交互式伪装目标分割方法、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121353310B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511926269.7,技术领域涉及:G06T7/11;该发明授权基于适配器的交互式伪装目标分割方法、电子设备和存储介质是由林贤明;陈泽华;曹刘娟设计研发完成,并于2025-12-19向国家知识产权局提交的专利申请。
本基于适配器的交互式伪装目标分割方法、电子设备和存储介质在说明书摘要公布了:本发明公开了一种基于适配器的交互式伪装目标分割方法,动态调整模型对不同频域特征的关注度,将原本重复的分割流程细化为按照“先整体后细节”、循序渐进地理解分割目标的过程,并通过点击强化机制,强化用户提示在准确理解分割目标中的作用。本发明主要分为特征提取模块和交互分割模块。在特征提取模块中,图像将通过两条路径提取不同频率的特征,预训练的ViT框架将更关注图像的高频特征,而加入适配器微调训练的分支由于卷积层的特性将更关注低频特征。在交互分割模块中,加入适配器微调的分支所提取的特征将会与点击嵌入进行交叉注意力运算,并通过线性层增加其表达能力,得到强化后的特征。最终,两条分支进行融合通过解码器得到预测掩码。
本发明授权基于适配器的交互式伪装目标分割方法、电子设备和存储介质在权利要求书中公布了:1.一种基于适配器的交互式伪装目标分割方法,其特征在于,包括: 步骤1.特征提取阶段 给定输入图像,将其切分为的patch,其中表示实数域,表示输入图像的高,表示输入图像的宽,表示局部区域的尺寸参数; 特征提取模块由两条分支组成: 1第一条分支为冻结参数的ViT-Base主干,第一条分支的输出为高频率特征,其中表示patch个数,表示特征维度; 2第二条分支为Adapter-ViT,由ViT与层级专属MLP、阶段共享MLP组成;第二条分支的输出为低频率特征,其中表示Adapter-ViT主干; 步骤2.交互分割阶段 使用点击增强模块和特征融合模块以实现利用点击信息和特征提取阶段提取的两种特征; 步骤2.1:由用户输入的点击提示坐标经过嵌入得到的嵌入编码,其中表示点击嵌入序列长度;在点击增强模块中,首先使用嵌入编码和低频率特征进行交叉注意力,其表达式如下: ,其中表示注入了点击信息的图像特征,表示归一化操作,表示的转置,表示单个注意力头的维度; 随后,通过一层MLP增强模型的表达能力,进行图像到点击的交叉注意力,将图像上下文反馈到像素级别,其表达式如下: ,其中表示根据点击位置和语义进行全局调制的图像特征; 步骤2.2:在特征融合模块中,每轮交互过程中,采用动态权重将与融合,其表达式如下: ,,其中表示本轮经过融合后的最终图像特征,表示第轮的权重值,表示第1轮的权重值,表示用于控制衰减速度的预设参数; 步骤3.训练阶段 在训练阶段,将预训练ViT模型的注意力层全部冻结,仅对Adapter-ViT分支中各层MLP、点击增强模块中的交互注意力组件、特征融合模块以及最终的解码器进行参数更新; 步骤4.推理阶段 在推理阶段,按照交互式分割的流程执行多轮点击与掩码生成操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励