Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请适用于人工智能技术领域,提供了一种语音处理方法,该方法包括:将待处理语音序列进行分帧处理,得到语音帧;对语音帧进行语音活动检测,得到语音帧对应的第一置信度,第一置信度用于指示语音帧存在有效语音活动的可信程度;基于第一置信度,在语音帧中...
  • 本发明提供一种同音字纠错方法、装置以及存储介质,属于文字纠错技术领域,上述方法包括:导入待纠错语音数据、原始语音数据以及真实文本数据;对待纠错语音数据以及原始语音数据进行语音识别得到待纠错文本特征以及原始文本特征;构建训练模型,根据原始文本...
  • 本发明公开一种可插拔式目标说话人的语音识别方法及系统,应用于数据处理技术领域,针对多说话人场景目标语音识别需求,设计特征域直连可插拔式两阶段训练架构。先对多类音频做Mel频谱预处理,通过自适应声纹网络提取全局音色嵌入向量;再搭建自适应卷积编...
  • 本发明提供了一种语义槽位填充方法、装置、设备及存储介质,属于智能交互技术领域,该方法包括:接收目标对象的语音输入,并在识别出语音意图之后,加载对应的槽位依赖规则;通过所述槽位依赖规则,提取出所述语音输入中的各个槽位进行填充,并推理出缺失的槽...
  • 本申请公开了一种音频的音质补偿方法和装置、存储介质、电子设备及产品,涉及智慧家庭技术领域。该音频的音质补偿方法包括:根据人工智能模型输出的第一音频样本和人工智能模型所在的第一区域内的第一房间脉冲响应确定第一音频样本的第一回声样本;根据第一回...
  • 本申请公开了语音识别模型的训练方法、装置、介质、设备及程序产品,涉及人工智能技术领域,方法包括:确定样本数据集的各样本语音数据的语音特征长度和各文本标签的文本标签长度;基于语音特征长度的排序和文本标签长度对多条样本进行样本分批,得到多个批数...
  • 本申请实施例公开一种显示设备、服务器及语音交互方法,在接收到语音数据时,获取语音数据对应的语音文本;基于预设自定义词库和语音文本,获取语音文本内包含的目标自定义词汇以及目标自定义词汇映射的目标标准名称和目标场景标签;预设自定义词库包括标准名...
  • 本发明公开了一种基于目标说话人视素信息的实时视听语音增强方法、系统、终端及介质,方法包括:采集目标说话人的视频流以及当前场景下的混合语音,并确定目标说话人对应的唇部图像序列;将唇部图像序列输入至预先训练完成的视素识别网络,输出估计视素序列;...
  • 本申请公开了一种销售智能体语音对话方法。该方法包括如下步骤:首先对实时语音数据流进行时序语境帧关联解析与情感动态谱量化建模,生成用户需求动态特征构象;接着经层级去噪重构与意图后验概率匹配,确定核心需求特征基向量并生成场景化需求定位特征拓扑;...
  • 本发明涉及语音处理技术领域,公开了一种融合多模态特征的AI互动语音意图识别方法,包括:采集用户的语音信号、面部视频和深度图像,并进行预处理;根据面部视频和深度图像确定面部表情特征、头部姿态角和手势类别;将语音信号、面部表情特征、头部姿态角、...
  • 本公开提供了一种模型训练方法、语音处理方法及相关设备,该方法包括:获取样本音频以及样本音频对应的文本标注和音频标注;根据样本音频和音频标注对语言处理模型进行第一训练处理,得到第一音频处理模型;根据样本音频以及文本标注对第一音频处理模型进行第...
  • 本申请涉及语音交互技术领域,尤其涉及一种eVTOL的语音交互方法、装置、设备及介质。该方法通过在飞行设备中实时采集用户语音信息,检测用户语音信息是否包含目标问题,若检测到用户语音信息中包含目标问题,则使用飞行设备上的向下采集设备对下方环境进...
  • 本申请提供了一种音频识别模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对音频特征和相关的短语特征进行特征融合,得到第一融合特征;基于第一融合特征及音频特征,进行短语预测,得到第一预测短语,并确定第一损失;基于...
  • 本发明提供了一种基于硬件仿真的智能座舱语音交互测试平台,包括:驾驶模拟器硬件用于提供接近实车的驾驶操控环境与人机交互界面;语音交互测试盒子用于采集驾驶舱内的语音信号,仿真软件模块用于构建包含道路、交通事件与噪声环境的虚拟驾驶场景,数据采集与...
  • 本申请公开了一种识别引擎的评分方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:将目标音频输入至已完成训练的语音大模型中得到第一识别文本,以及获取第三方文本识别引擎处理目标音频输出的第二识别文本;计算第一识别文本对应的第一音...
  • 本发明公开了基于声纹识别的藏族方言保护与实时跨方言翻译系统,涉及语音处理技术领域,包括声纹识别模块、语音识别模块、跨方言翻译模块、语音合成模块和安全与审计模块,所述声纹识别模块分析判别方言的类别,所述语音识别模块根据判定的方言类别将输入的方...
  • 本公开实施例涉及一种语音文本训练数据集生成方法、设备、存储介质及产品。该方法包括:基于构式语法规则将目标中文文本拆分为多个构式结构分组文本;对于多个构式结构分组文本中的目标构式结构分组文本,获取与目标构式结构分组文本对应的语音数据,并提取语...
  • 本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取训练样本,并基于训练样本构建输入序列;通过待训练的音频合成模型,对输入序列进行特征提取,得到共享隐藏状态序列;对共享隐藏状态序列进行音频预测,得...
  • 本发明公开了基于AI语音的端到端保险业务处理智能体系统,包括一种基于AI语音的端到端保险业务处理方法和使用该方法的智能体系统,方法包括如下步骤:首先进行实时语音交互,智能体系统识别保险用户的意图:并进行多轮对话记忆管理,对当前意图进行上下文...
  • 本申请涉及人工智能领域,更具体地,涉及一种语音交互的方法和系统,所述方法包括:根据输入音频数据生成响应音频数据,根据响应音频数据生成输出时长;根据输出时长获取响应音频数据中每个音频单元的时间戳;识别响应音频数据中音频单元的情绪词,并为带有情...
技术分类