深圳大学王浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳大学申请的专利任务自适应的视觉语言大模型协同剪枝方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121581260B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610107381.6,技术领域涉及:G06N20/00;该发明授权任务自适应的视觉语言大模型协同剪枝方法是由王浩;江卓彬;王栋;李岩山;曹文明设计研发完成,并于2026-01-27向国家知识产权局提交的专利申请。
本任务自适应的视觉语言大模型协同剪枝方法在说明书摘要公布了:本发明涉及语言模型剪枝领域,具体公开了任务自适应的视觉语言大模型协同剪枝方法,包括:S1、任务感知,获取含图像文本对的训练数据集,屏蔽单一模态的对应数据集,算损失值定模态依赖性,以自适应偏置微调视觉、语言模块份额;S2、算重要性分数,分模型权重,分层算梯度范数近似值,与模态份额相乘得各层分数;S3、分配稀疏度,汇总分数归一化,结合总参数保留比例算各层稀疏度并设阈值;S4、结构化稀疏,结合剪枝策略与token筛选,算模态关联度的融合分数,留有效token算通道分数,按组保留关键通道。本发明提出的技术方案解决了传统剪枝适配差、未考虑任务模态依赖、易误剪关键参数问题,提升压缩与推理效率,避免跨模态信息丢失,减少性能损失。
本发明授权任务自适应的视觉语言大模型协同剪枝方法在权利要求书中公布了:1.任务自适应的视觉语言大模型协同剪枝方法,其特征在于,包括: S1、任务感知:获取多模态下游任务的训练数据集,该训练数据集包含多个图像文本对信息;通过屏蔽训练数据集中单一模态信息,分别得到屏蔽视觉信息的图像文本对和屏蔽语言信息的图像文本对;利用上述图像文本对计算屏蔽单一模态输入时的损失值,基于损失值确定下游任务的模态依赖性,引入自适应偏置微调视觉模块和语言模块的份额分配,得到下游任务对应的视觉份额和文本份额; S2、重要性分数计算:将视觉语言大模型的权重分为视觉模型权重和语言模型权重,采用分层权重计算视觉模型层和语言模型层的梯度范数近似值;将各层梯度范数与对应模态的份额相乘,分别得到视觉模块各层和语言模块各层的重要性分数; S2中,梯度范数近似值的计算公式为: ; 式中,为第层的目标权重,D为跨模态校准样本集,为跨模态校准样本集中的视觉-文本对,为单样本的噪声采样次数,为内层求和的循环索引,遍历从1到的所有采样轮次,为扰动幅度超参数,为第j次噪声采样时的双向扰动的损失差; S3、稀疏度分配:汇总视觉模型和语言模型的重要性分数,通过归一化方法计算各层重要性分数的归一化占比;基于归一化占比和预设的总参数保留比例,计算视觉模型各层和语言模型各层的稀疏度,并为各层设定最大稀疏度阈值; 各层稀疏度的计算公式为: ; 式中,为视觉模型第层的稀疏度,为语言模型第层的稀疏度,为视觉模块第层重要性分数,为语言模块第层重要性分数,为对应模态第层重要性分数的归一化占比,,为预设的总参数保留比例,|W|为模型总参数数量,为视觉模型第层的参数数量,为语言模型第层的参数数量; S4、token筛选的结构化稀疏:基于权重绝对值-激活值乘积的剪枝策略,结合跨模态注意力权重引导的token筛选机制,对各层内冗余参数进行剪除;先利用双向跨模态注意力权重计算每个token的模态关联度,结合单模态初始分数得到跨模态融合筛选分数,保留融合分数有效的token;基于有效token计算激活通道的范数,结合权重绝对值得到输入通道重要性分数;按重要性分数对输入通道排序,以每四个通道为一组删除两个通道的2:4结构化稀疏模式保留核心参数预设,剪除冗余通道。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳大学,其通讯地址为:518060 广东省深圳市南山区粤海街道南海大道3688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励