Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种模型训练方法、语音处理方法及相关设备,该方法包括:获取样本音频以及样本音频对应的文本标注和音频标注;根据样本音频和音频标注对语言处理模型进行第一训练处理,得到第一音频处理模型;根据样本音频以及文本标注对第一音频处理模型进行第...
  • 本申请涉及语音交互技术领域,尤其涉及一种eVTOL的语音交互方法、装置、设备及介质。该方法通过在飞行设备中实时采集用户语音信息,检测用户语音信息是否包含目标问题,若检测到用户语音信息中包含目标问题,则使用飞行设备上的向下采集设备对下方环境进...
  • 本申请提供了一种音频识别模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对音频特征和相关的短语特征进行特征融合,得到第一融合特征;基于第一融合特征及音频特征,进行短语预测,得到第一预测短语,并确定第一损失;基于...
  • 本发明提供了一种基于硬件仿真的智能座舱语音交互测试平台,包括:驾驶模拟器硬件用于提供接近实车的驾驶操控环境与人机交互界面;语音交互测试盒子用于采集驾驶舱内的语音信号,仿真软件模块用于构建包含道路、交通事件与噪声环境的虚拟驾驶场景,数据采集与...
  • 本申请公开了一种识别引擎的评分方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:将目标音频输入至已完成训练的语音大模型中得到第一识别文本,以及获取第三方文本识别引擎处理目标音频输出的第二识别文本;计算第一识别文本对应的第一音...
  • 本发明公开了基于声纹识别的藏族方言保护与实时跨方言翻译系统,涉及语音处理技术领域,包括声纹识别模块、语音识别模块、跨方言翻译模块、语音合成模块和安全与审计模块,所述声纹识别模块分析判别方言的类别,所述语音识别模块根据判定的方言类别将输入的方...
  • 本公开实施例涉及一种语音文本训练数据集生成方法、设备、存储介质及产品。该方法包括:基于构式语法规则将目标中文文本拆分为多个构式结构分组文本;对于多个构式结构分组文本中的目标构式结构分组文本,获取与目标构式结构分组文本对应的语音数据,并提取语...
  • 本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取训练样本,并基于训练样本构建输入序列;通过待训练的音频合成模型,对输入序列进行特征提取,得到共享隐藏状态序列;对共享隐藏状态序列进行音频预测,得...
  • 本发明公开了基于AI语音的端到端保险业务处理智能体系统,包括一种基于AI语音的端到端保险业务处理方法和使用该方法的智能体系统,方法包括如下步骤:首先进行实时语音交互,智能体系统识别保险用户的意图:并进行多轮对话记忆管理,对当前意图进行上下文...
  • 本申请涉及人工智能领域,更具体地,涉及一种语音交互的方法和系统,所述方法包括:根据输入音频数据生成响应音频数据,根据响应音频数据生成输出时长;根据输出时长获取响应音频数据中每个音频单元的时间戳;识别响应音频数据中音频单元的情绪词,并为带有情...
  • 本发明实施例公开了一种音频文件生成方法、装置、电子设备及存储介质,包括:提取目标文本的篇章结构和叙事要素,并基于篇章结构、叙事要素和预先定义的摘要要求,生成摘要内容规划;通过大语言模型,根据摘要内容规划,提炼与目标文本对应的文本摘要;根据与...
  • 本申请涉及计算机技术领域,公开了一种文本朗读检测方法、装置及电子设备。该方法获取用户朗读的音频,以及用户朗读音频时对应的参照文本;根据音频和参照文本,获得音频与参照文本的匹配度;识别音频,获得音频对应的识别文本;根据识别文本和参照文本,检测...
  • 本发明涉及人工智能与情感语音合成技术领域,具体是基于潜在扩散模型的多说话人情感语音合成方法及系统。在情感语音合成方法中,先构建含编码器Enc和解码器Dec的变分自编码器,将语音线性谱经Enc映射至潜在空间,重参数化采样得到潜在声学表示z0,...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的语音处理方法、装置、计算机设备及存储介质,包括:对语音数据进行特征提取得到声学单元序列;对声学单元序列进行韵律特征提取得到韵律特征;对声学单元序列与韵律特征进行编码处理得到指定声学单元序列;...
  • 本申请涉及音频处理技术领域,提供了一种音频数据融合方法、装置、计算机设备及存储介质,所述方法基于截止频率对VPU和MIC采集的音频数据进行频率分割,有效分离出各自的优势频率成分。基于预设增益因子对提取出的第一低频音频和第一高频音频进行增益调...
  • 本发明涉及主动噪声控制技术领域,提供一种基于组合代价函数的双耳协同主动噪声控制方法,用于解决因左右耳道生理结构差异、耳机佩戴贴合性不一致及扬声器指向性非对称等因素导致的左右耳收敛速度不同步与稳态误差不一致的问题。该方法构建包含总体误差项、瞬...
  • 本发明公开了基于人工智能的厂房主动、被动联合降噪系统及实现方法,涉及噪声防治技术领域,该系统包括被动降噪系统及基于人工智能的自适应的主动降噪控制系统;主动降噪控制系统包括设置在厂房内侧壁上的若干固定式ANC主动降噪器和环状分布于厂房内高噪声...
  • 本申请提供一种基于轻量级卷积神经网络(CNN)的变步长主动噪声控制方法与装置。基于所述参考信号和所述误差信号,构建标准化特征向量;基于所述标准化特征向量,通过预先训练的轻量级卷积神经网络预测推理得到变步长;基于所述变步长对滤波‑x最小均方(...
  • 本申请提供一种车辆的主动降噪方法、装置及车辆。车辆的主动降噪方法包括:获取车辆的发动机转速信号、多个误差麦克风采集的第一噪声的当前信号、多个座椅的头枕的当前头枕位置信息;根据误差麦克风的第一噪声的当前信号和该误差麦克风对应的座椅的当前头枕位...
  • 本申请涉及一种主动降噪方法、系统及汽车。该方法包括获取车辆的轮胎空腔内的压力信号;对压力信号进行处理,获得噪声信号,基于噪声信号,控制生成反相位声波信号;以供扬声器在轮胎空腔内播放与反相位声波信号相对应的声音。该方法通过直接获取轮胎内的压力...
技术分类