中国科学院香港创新研究院人工智能与机器人创新中心;中国科学院自动化研究所陈阵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院香港创新研究院人工智能与机器人创新中心;中国科学院自动化研究所申请的专利基于多模态大语言模型的手术导航方法以及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119564344B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411403748.6,技术领域涉及:A61B34/20;该发明授权基于多模态大语言模型的手术导航方法以及装置是由陈阵;吴锦林;骆行健;刘宏斌设计研发完成,并于2024-10-09向国家知识产权局提交的专利申请。
本基于多模态大语言模型的手术导航方法以及装置在说明书摘要公布了:本发明提供一种基于多模态大语言模型的手术导航方法以及装置,其中,上述方法包括:获取用户语音输入;对用户语音输入进行重采样,得到重采样音频;对重采样音频进行梅尔频谱转换与归一化,得到语音特征;基于语音特征,确定与用户语音输入对应的语音意图;通过检索器基于语音意图在预设的资料文档中进行相似度检索,得到目标应用程序接口文本;基于目标应用程序接口文本与语音意图进行拼接,得到文本输入;将文本输入与视觉输入共同输入至预训练的大语言模型,得到预训练的大语言模型输出的文本回答,其中,文本回答用于操控预设机器进行手术导航。通过本发明能够在神经外科手术中提供更准确的实时导航。
本发明授权基于多模态大语言模型的手术导航方法以及装置在权利要求书中公布了:1.一种基于多模态大语言模型的手术导航方法,其特征在于,包括: 获取用户语音输入; 对所述用户语音输入进行重采样,得到重采样音频; 对所述重采样音频进行梅尔频谱转换与归一化,得到语音特征; 基于所述语音特征,确定与所述用户语音输入对应的语音意图; 通过检索器基于所述语音意图在预设的资料文档中进行相似度检索,得到目标应用程序接口文本,其中,所述资料文档包括应用程序接口文档与应用程序接口手册; 基于所述目标应用程序接口文本与所述语音意图进行拼接,得到文本输入; 将所述文本输入与视觉输入共同输入至预训练的大语言模型,得到所述预训练的大语言模型输出的文本回答,其中,所述文本回答用于操控预设机器进行手术导航; 所述对所述重采样音频进行梅尔频谱转换与归一化,得到语音特征,包括: 基于所述用户语音输入与所述重采样音频进行梅尔频谱转换,得到梅尔频谱: ; 其中,表示所述梅尔频谱,表示梅尔频谱转换操作,表示所述用户语音输入,表示所述重采样音频,表示通道数,表示窗口大小,表示步频; 确定所述梅尔频谱在训练数据集上的平均值; 基于所述梅尔频谱与所述平均值进行归一化,得到归一化后的语音特征: ; 其中,表示所述归一化后的语音特征,表示所述梅尔频谱,表示所述梅尔频谱在训练数据集上的平均值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院香港创新研究院人工智能与机器人创新中心;中国科学院自动化研究所,其通讯地址为:中国香港新界白石角香港科学园科技大道西17号楼301-303, 305-309, 317-320室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励