当前位置 : 首页 > 专利喜报 > 湖南笑熵智愈科技有限公司冯武获国家专利权

湖南笑熵智愈科技有限公司冯武获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉湖南笑熵智愈科技有限公司申请的专利基于多模态特征融合的语音情感识别方法及系统获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121565211B 。

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202610093136.4，技术领域涉及：G10L25/63；该发明授权基于多模态特征融合的语音情感识别方法及系统是由冯武;于翠楠;刘华安设计研发完成，并于2026-01-23向国家知识产权局提交的专利申请。

本基于多模态特征融合的语音情感识别方法及系统在说明书摘要公布了：本发明公开了基于多模态特征融合的语音情感识别方法及系统，涉及语音情感识别技术领域。该基于多模态特征融合的语音情感识别方法及系统，包括以下步骤：S1，采集语音情感数据集，进行标签统一编码和归一化处理；S2，进行帧级声学与构建频谱、韵律与音质情感特征的构建；S3，融合多子模态深度编码与门控协同注意力机制的语音情感表示生成方法；S4，进行随机森林权重初始化与两阶变异灰狼映射评估；S5，进行语音情感识别和运行反馈自适应更新。本发明有效提升了语音情感识别中特征选择的效率与情感分类准确率，解决了现有语音情感特征选择单阶段单指标、难以在降维同时兼顾情感保留与实时性且整体性能受限的问题。

本发明授权基于多模态特征融合的语音情感识别方法及系统在权利要求书中公布了：1.基于多模态特征融合的语音情感识别方法，其特征在于，包括以下步骤： S1，采集语音情感数据集，对语音情感数据集进行质量筛选、场景与标签统一编码和归一化处理，构成标准化语音情感样本库，标准化语音情感样本库包括语音情感采集样本帧； S2，对标准化语音情感样本库进行帧级声学与构建频谱特征，并进行韵律与音质情感特征的构建和置信度标注得到子模态情感特征向量集；对标准化语音情感样本库进行帧级声学与构建频谱特征的具体过程为：输入语音情感采集样本帧，执行帧级声学与构建频谱特征，生成语音情感频谱子模态特征；拼接构成帧级声学与频谱特征向量；对同一语音片段的全部帧级声学和频谱特征向量进行索引管理和结构化存储，输出帧级声学与频谱特征数据集；所述并进行韵律与音质情感特征的构建和置信度标注得到子模态情感特征向量集的具体过程为：输入帧级声学与频谱特征数据集，构建韵律与音质情感特征，封装形成子模态情感特征向量，通过对历史运行数据中子模态特征与情感标签之间的梯度贡献和类间可分性统计结果进行归一映射得到情感敏感度指标；通过将样本质量标记、噪声环境字段中的信噪比估计值和信道状态字段中的丢包率、失真标记进行融合映射得到质量指标；将质量参考阈值和子模态质量指标的差值进行平方得到质量差值项，将第m个子模态情感敏感度指标的平方减去质量惩罚权重与质量差值项相乘得到质量综合调节项，将质量综合调节项乘以置信度锐化系数得到质量调节项；取动态基准因子的倒数为情感相关项；对质量调节项取负值后进行指数运算得到指数项；将情感相关项与指数项相乘得到惩罚综合项；惩罚综合项加固定值，得到评分分母；最后用固定值除以评分分母，得到第m个子模态的置信度评分；将置信度评分附加到子模态特征向量上封装成子模态情感特征向量集； S3，基于子模态情感特征向量集的融合多子模态深度编码与门控协同注意力机制的语音情感表示生成方法；所述基于子模态情感特征向量集的融合多子模态深度编码与门控协同注意力机制的语音情感表示生成方法的具体过程为：输入子模态情感特征向量集和对应的子模态的置信度评分，对每一条语音情感采集样本帧中携带的频谱、韵律和音质子模态特征进行深度编码与门控协同注意力融合，生成统一的语音情感表示向量，并输出子模态情感影响因子与噪声干扰因子；噪声不一致性指标通过在多噪声场景与多信道条件下，对子模态嵌入在不同噪声标签、信道状态和样本质量等级上的分布差异进行统计，将跨场景输出分布偏差压缩映射得到；基于情感敏感度指标与噪声不一致性指标构建子模态综合指数表征值，将敏感度放大系数与第k个子模态情感敏感度指标相乘得到放大项，对放大项进行指数运算后与情感敏感度动态基准因子相加，得到情感敏度项，对情感敏度项进行对数运算得到敏感项，将第k个子模态噪声不一致性指标与噪声不一致性参考阈值作差得到偏差项，将偏差项乘以噪声惩罚放大系数后进行指数运算得到惩罚项，惩罚项与噪声不一致性动态基准因子相加得到惩罚一致项；对惩罚一致项进行对数运算得到噪声项，敏感项减去噪声项得到第k个子模态的综合指数表征值；构建门控协同注意力融合机制，将综合指数表征值通过单调S形函数转换为子模态注意力权重与影响因子，形成统一的语音情感表示向量； S4，对语音情感表示向量集进行预筛选与随机森林权重初始化，进行两阶变异灰狼与映射评估得到语音情感特征子集；所述对语音情感表示向量集进行预筛选与随机森林权重初始化的具体过程为：输入语音情感表示向量集及对应的子模态情感影响因子与噪声干扰因子，对特征空间执行ReliefF重要性预筛选与随机森林权重初始化，构建情感特征候选子集与初始特征选择向量：对情感特征执行重要性打分与无关特征剔除得到ReliefF候选特征集合，进行重要性评估与初始选择向量构建；生成特征编码与适应度评估接口；子模态注意力权重直接决定子模态在特征选择中的参与度，权重高于权重阈值的子模态将被保留用于特征选择，而低于权重阈值的子模态将被剔除或抑制； S5，对语音情感特征子集进行语音情感识别与置信决策，并进行情感识别服务编排与运行反馈自适应更新。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人湖南笑熵智愈科技有限公司，其通讯地址为：410000 湖南省长沙市长沙经济技术开发区凉塘路28号1号厂房401室；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

湖南笑熵智愈科技有限公司冯武获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务