Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浪潮软件科技有限公司林一伟获国家专利权

浪潮软件科技有限公司林一伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浪潮软件科技有限公司申请的专利一种基于轻量化中文言语康复大模型的状态评估系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121393840B

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511959783.0,技术领域涉及:G16H50/20;该发明授权一种基于轻量化中文言语康复大模型的状态评估系统是由林一伟;王珂琛;金时春;张峰;王冠军;李照川;王宾;张尧臣设计研发完成,并于2025-12-24向国家知识产权局提交的专利申请。

一种基于轻量化中文言语康复大模型的状态评估系统在说明书摘要公布了:本发明公开了一种基于轻量化中文言语康复大模型的状态评估系统,属于人工智能技术领域技术领域,要解决的技术问题为:现有中文言语康复大模型领域适配性差、轻量化与精度失衡、跨模态泛化弱。包括:教师模型构建模块,用于构建教师模型,教师模型基于跨模态融合特征以及增强的声学特征和文本特征进行语音缺陷掩码重建以及跨模态评估;教师模型训练模块,用于对教师模型进行训练;学生模型构建训练模块,用于将训练后的教师模型剪裁为学生模型,对学生模型进行模态内自监督和模态间自监督训练,并进行知识蒸馏;模型部署应用模块,对训练后的学生模型进行低维嵌入压缩,并引入量化感知训练,得到包括多个独立模块的轻量化模型。

本发明授权一种基于轻量化中文言语康复大模型的状态评估系统在权利要求书中公布了:1.一种基于轻量化中文言语康复大模型的状态评估系统,其特征在于,包括: 数据采集模块,用于收集中文言语康复相关的语音数据、文本数据和跨模态评估标签并进行预处理,形成样本集; 教师模型构建模块,用于构建中文言语康复大模型作为教师模型,教师模型对输入的语音数据和文本数据进行特征提取,对提取的声学特征和文本特征进行跨模态特征对齐得到跨模态融合特征,基于跨模态融合特征以及增强的声学特征和文本特征进行语音缺陷掩码重建以及跨模态评估,通过语音缺陷掩码重建输出补全的语音数据以及发音缺陷标签和概率分布,通过跨模态评估输出包括发音缺陷类型及概率分布、状态类型标签及概率分布、以及训练阶段的评估结果; 教师模型训练模块,用于基于跨模态对齐训练、语音缺陷掩码重建训练以及状态类型训练构建损失函数,基于样本集、通过损失函数最小化对教师模型进行训练; 学生模型构建训练模块,用于将训练后的教师模型剪裁为学生模型,对学生模型进行模态内自监督和模态间自监督训练,并基于教师模型输出的跨模态融合特征和状态类型标签概率分布对学生模型进行知识蒸馏; 模型部署应用模块,用于对训练后的学生模型进行低维嵌入压缩,并在学生模型的训练阶段引入量化感知训练,得到包括多个独立模块的轻量化模型,基于预定义的评估指标对轻量化模型进行评估后,基于轻量化模型进行中文言语状态评估; 其中,所述教师模型包括基础模型层、跨模态特征对齐层以及特征增强评估层; 基础模型层用于对输入的文本数据进行语义编码、得到文本特征,对输入的语音数据进行声学特征提取、得到包括发音细节与缺陷特征的声学特征; 跨模态特征对齐层用于基于双交叉注意力机制以及交叉损失函数将文本特征和声学特征融合对齐、输出跨模态融合特征; 特征增强评估层用于通过卷积结构对声学特征进行特征增强、捕捉包括舌尖音缺陷和构音偏移的缺陷特征,得到缺陷声学特征作为增强的声学特征,用于通过字典匹配对文本特征进行权重增强,得到领域增强文本特征作为增强的文本特征,用于基于缺陷声学特征和跨模态融合特征对掩码的语音数据进行语音缺陷掩码重建,输出发音缺陷类型和补全的语音数据,用于以语音缺陷掩码重建生成的发音缺陷类型为先验,基于缺陷声学特征、领域增强文本特征以及跨模态融合特征进行跨模态评估,输出包括发音缺陷类型及概率分布、状态类型标签及概率分布、以及训练阶段的评估结果; 其中,特征增强评估层包括缺陷特征提取层、知识融入层以及掩码重建与预测层;缺陷特征提取层串联于语音编码层的输出端,以声学特征为输入,捕捉包括舌尖音缺陷和构音偏移的专属声学特征,输出缺陷声学特;知识融入层用于通过领域字典匹配的方式对文本特征进行权重增强,输出领域增强文本特征;掩码重建与预测层包括语音缺陷掩码预测子层和跨模态标签预测子层,语音缺陷掩码预测子层用于基于增强的缺陷声学特征和跨模态融合特征执行交叉注意重建、对语音数据中人为掩码片段进行重建,输出发音缺陷类型、概率分布以及补全的语音数据,跨模态标签预测子层以特征重建输出的发音缺陷类型为先验,基于增强的缺陷声学特征、领域增强文本特征以及跨模态融合特征进行评估分析,输出包括发音缺陷类型及概率分布、状态类型标签及概率分布、以及训练阶段的评估结果; 其中,教师模型对应的损失函数表示为: , 其中,表示基于状态类型训练构建的交叉熵损失,表示的权重,计算公式表示为: , 表示样本集中样本数量,表示状态类型标签中类别数量,表示样本在类别上的独热编码,表示样本在类别上教师模型预测输出的概率,在多状态类型标签场景下,为多标签二进制编码; 其中,表示基于跨模态对齐训练构建的损失,表示的权重,计算公式为: , 表示声学特征向量,表示文本特征向量,表示L2范数; 其中,表示基于语音缺陷掩码重建训练构建的CTC损失,表示的权重,计算公式表示为: , 表示原始语音数据对应的发音缺陷标签,表示教师模型通过语音缺陷掩码重建输出的发音缺陷标签概率分布; 其中,学生模型构建训练包括如下操作: 学生模型初始化:以训练后教师模型为基础,保留教师模型中用于进行特征提取、跨模态对齐、特征增强、语音缺陷掩码重建以及跨模态评估的网络层,剪裁冗余网络层,得到初始化的学生模型; 模态内自监督:对语音数据进行随机片段掩码,以掩码的语音数据为输入,通过学生模型进行掩码区域重建,基于掩码区域重建输出的发音缺陷标签概率分布以及真实发音缺陷概率值构建损失函数,通过损失函数最小化进行模型训练;并对文本数据进行随机片段掩码,以掩码的文本数据为输入,通过学生模型进行掩码区域重建,基于掩码区域重建输出的文本数据概率分布以及真实文本数据概率值构建损失函数,通过损失函数最小化进行模型训练; 模态间自监督:将同一用户的语音特征与文本特征作为正样本,不同用户的跨模态融合特征作为负样本,通过对比损失优化学生模型的跨模态特征对齐能力,对比损失计算公式如下: , 其中,表示对比学习批次大小,表示第个语音数据对应的声学特征,表示第个文本数据对应的文本特征,表示温度系数; 特征蒸馏:基于教师模型输出的跨模态融合特征,学生模型通过L2损失学习跨模态融合特征的特征分布,对应的损失函数计算公式为: , 其中,表示教师模型输出的跨模态融合特征,表示学生模型的跨模态融合特征,表示跨模态融合特征的维度; 概率蒸馏:基于教师模型输出的状态类型标签概率分布,学生模型通过KL散度损失学习诊疗标签概率分布,对应的损失函数计算公式为: , 其中,,,表示教师模型输出的状态类型标签概率分布,表示学生模型输出的状态类型标签概率分布,表示状态类型数,表示经验值,用于平衡概率分布的平滑度与区分度; 其中,模型部署应用模块用于执行如下操作: 低维嵌入压缩:对于学生模型输出的跨模态融合特征,学生模型中编码器将高维的跨模态融合特征压缩至低维度,学生模型中解码器重构压缩的跨模态融合特征,基于高维跨模态融合特征与低维度跨模态融合特征的偏差构建重构损失,并引入状态类型标签约束,基于学生模型输出的状态类型标签概率分布和真实的状态类型标签概率值构建标签约束损失,将重构损失与标签约束损失加权求和作为低纬嵌入压缩总损失,并通过PCA分析压缩后跨模态融合特征的方差解释率,基于低纬嵌入压缩总损失对学生模型进行训练,其中,低纬嵌入压缩总损失计算公式为: , 其中,表示重构损失,表示标签约束损失,表示权重系数,计算公式为: , 表示高纬跨模态融合特征,表示重构的跨模态融合特征,表示跨模态融合特征的原始维度; 其中,方差解释率计算公式如下: , 表示高纬跨模态融合特征中第个主成分的方差; 量化感知训练:对学生模型的模型权重进行INT8量化,学生模型中激活值采用INT8量化,模型训练时插入量化误差补偿,通过反向传播修正量化导致的精度损失,精度损失计算公式为: , 表示量化误差损失,计算公式为: , 表示量化前学生模型的权重,表示量化后学生模型的权重,表示权重总数,表示权重系数,表示教师模型的损失函数; 其中,对学生模型中预设的关键网络层采用INT8量化,学生模型中预设的非关键层采用INT4量化,量化感知训练时,设定权重范围以及量化步长,按照渐进式量化执行,在前段训练轮次中用FP32训练,后端轮次中逐步引入量化; 模块化输出:将训练后的学生模型划分为三个独立模块,分别为发音评估模块、状态类型分型模块以及训练阶段建议模块,发音评估模块用于输出发音缺陷类型以及概率分布,状态类型分型模块用于输出状态类型以及概率分布,训练阶段建议模块用于输出训练阶段。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮软件科技有限公司,其通讯地址为:250000 山东省济南市高新区浪潮路1036号浪潮科技园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。