乐博空间(北京)科技服务有限责任公司朱永强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉乐博空间(北京)科技服务有限责任公司申请的专利基于检索增强生成与多模型协同的语音交互方法及其应用获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121545518B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511731248.X,技术领域涉及:G10L15/22;该发明授权基于检索增强生成与多模型协同的语音交互方法及其应用是由朱永强;刘洁;王海峰;马殿源;戴玮;李梦龙;颜涛设计研发完成,并于2025-11-24向国家知识产权局提交的专利申请。
本基于检索增强生成与多模型协同的语音交互方法及其应用在说明书摘要公布了:本申请涉及人工智能与语音对话技术领域,公开了基于检索增强生成与多模型协同的语音交互方法及其应用,方法包括:语音采集与预处理;本地多轮意图识别;本地RAG检索与候选聚合;决策与云端生成;反馈、合成与持久化;本发明还提供基于检索增强生成与多模型协同的语音交互方法的应用。本发明通过本地结构化意图识别与RAG检索聚合,结合云端大模型的生成能力,兼顾响应时效与隐私保护,显著提高多轮语音交互场景下推荐的准确性和鲁棒性;并通过实体级合并去重、重排与模糊匹配策略减少检索冗余、提升上下文质量;通过离线原子替换机制保证数据更新的一致性与在线服务的稳定性,从而改善终端用户体验并便于工程化部署与扩展。
本发明授权基于检索增强生成与多模型协同的语音交互方法及其应用在权利要求书中公布了:1.基于检索增强生成与多模型协同的语音交互方法,其特征在于,包括以下步骤: S1、由前端多模态终端识别发言人身份,对采集的语音进行降噪、端点检测处理后,经语音识别生成当前轮次对话文本; S2、将生成的所述当前轮次对话文本追加至历史对话中,构建更新后的完整对话历史作为输入,利用本地轻量化语言模型对所述更新后的完整对话历史进行分析,从中抽取与点单或推荐相关的字段,并生成包含点单或推荐字段的结构化JSON对象; S3、以所述结构化JSON对象中的字段与值作为检索约束,在本地知识库或知识图谱中筛选出符合约束的候选实体,为所述候选实体构建对应的文本块集合,并在向量检索模块中进行语义检索,对检索到属于同一实体的多个文本块按序进行合并去重,生成用于决策的实体摘要; S4、基于所述结构化JSON对象中的用户意图,进行决策判断:若判断为确认下单且匹配到可售商品项,则在本地下发确认指令,反之将所述实体摘要与所述更新后的完整对话历史封装后,发送至云端模型,进行自然语言处理与策略决策,生成最终的自然语言回复文本; S5、将所述自然语言回复文本交由前端进行语音合成并播放,并持久化存储所述结构化JSON对象与所述最终的自然语言回复文本,以便统计与回溯,且周期性地拉取远端商品数据以构建临时的知识图与向量库,并以原子替换方式,更新本地正式资源。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人乐博空间(北京)科技服务有限责任公司,其通讯地址为:100000 北京市大兴区北京经济技术开发区经海四路25号院13号楼1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励