Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供基于AI语音交互与控制的可视化控制方法及系统,涉及AI控制技术领域,包括通过语音或远程应用接口获取包含目标设备标识与执行动作类型的控制指令;基于预设设备映射关系将控制指令解析为设备级控制信号;通过无线通信链路将控制信号传输至具有独...
  • 本发明涉及仿生玩具技术领域,特别涉及一种仿生玩具的控制方法、仿生玩具及可读存储介质。本发明提供的方法将用户语音信息转换为文本信息;提供预设关键词数据库和喜好数据库、情绪数据库和意图数据库;判断文本信息是否与预设关键词数据库匹配,若否,则基于...
  • 在车辆中使用具有情绪响应能力的基于位置的琐事问答的一种或多种方法,包括:基于全球定位系统(GPS)坐标来发起一个或多个基于位置的琐事问答问题,以及使用车辆内的一个或多个麦克风来检测活跃玩家。基于玩家姓名和座位位置,所述方法包括针对座位位置中...
  • 本申请公开了一种家电设备控制方法、装置、程序产品、介质及家电设备,所述方法包括:获取用户语音,并确定所述用户语音的语音类型;如果所述语音类型为唤醒语音,则控制所述家电设备的状态为监听状态,并在所述监听状态下监听用户的指令语音,以基于监听到的...
  • 本发明公开了一种语音应用的迭代更新方法、装置、系统、车辆及服务器,涉及语音识别技术领域,该方法应用于轨道交通车辆,包括:在当前语音应用启动后,获取车载拾音器采集的原始语音数据流;利用当前语音应用的语音识别模型对原始语音数据流进行语音识别,得...
  • 本申请公开了一种语义识别中词序列确定方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:对语音信号对应的隐向量序列进行线性投影,以得到语音信号的多粒度后验概率,其中,多粒度后验概率包括:字符后验概率、子词后验概率和词后验概率;...
  • 本公开涉及智能建造领域,具体涉及一种工程建造辅助系统、方法、存储介质及电子设备。该工程建造辅助系统包括:终端设备,包括用于采集语音指令,并将语音指令传输至云端数据平台的语音采集设备,以及用于显示接收到的目标建造辅助信息的AR设备;云端数据平...
  • 本申请适用于人工智能技术领域,提供了一种语音识别方法,该方法包括:获取目标儿童用户的语音数据;对语音数据进行感知降噪处理,得到预处理好的语音数据;对预处理好的语音数据进行声学特征提取处理,得到声学特征向量;基于声学特征向量,通过预设的语音识...
  • 本申请提出一种基于动作语义参考、语音节奏以及大模型技术的文字语音生成说话动作的方法,该方法包括:获取同步的音频数据、文本数据以及参考动作序列;根据音频数据的声带振动频率以及信号功率生成音频数据的节奏序列;将通过语音大模型获取的音频数据的音频...
  • 本申请涉及模型训练技术领域、智慧医疗领域及金融服务领域,尤其涉及一种用于声学模型对抗训练的判别方法、装置、设备及介质。该方法在执行声学模型对抗训练时,获取声学模型输出的目标声学数据,对目标声学数据进行特征提取,得到目标声学特征,对目标中间特...
  • 本申请公开了一种模型训练方法、语音处理方法、电子设备及存储介质,涉及大模型、语音处理技术领域。该方法包括:获取噪声音频信号;采用初始语音处理模型对噪声音频信号进行语音增强处理,得到增强音频信号,其中,初始语音处理模型用于对噪声音频信号进行双...
  • 一种基于低秩参数专家模型的藏语多方言语音识别方法,包括:对输入的藏语语音信号进行声学特征提取,获得高层声学表征;通过方言判别器对高层声学表征进行分析,确定对应于多种藏语方言的专家路由权重分布;基于专家路由权重分布,动态加权组合藏语大语言模型...
  • 本发明涉及网络音频技术领域,公开了一种采用智能生成技术实现的网播方法及系统,包括:获取播客节目的目标播出时长,生成脚本文本;对脚本文本进行内容类型识别,对脚本文本进行内容感知时长预估,生成携带预估时长注释的时长标注脚本,并进行语义完整单元识...
  • 本申请公开了一种可控语音生成方法、装置、设备及存储介质,涉及语音生成技术领域。该方法包括:利用至少两个语音特性编码器从相应类型的参考音频中提取出语音特性嵌入向量;其中,所述语音特性编码器是以提取单个种类的语音特性嵌入向量为训练目标,经过对抗...
  • 本发明涉及数据处理技术领域,公开了一种语音合成方法、装置、设备及介质,包括:获取目标提示音频和待进行语音合成的目标文本,确定对目标文本进行语音合成的语言类别,统计目标文本包含的、与语言类别对应的语言单位的总数量,以语言单位执行目标提示音频,...
  • 本公开涉及语音对话技术领域,具体而言,涉及对话模型训练样本的确定方法和音频对话方法。对话模型训练样本的确定方法包括:确定音频对话数据集,所述音频对话数据集包括采集的真实对话音频和生成的合成对话音频;确定所述音频对话数据集对应的文本数据的对话...
  • 本发明实施例公开了一种端侧语音合成与播放控制方法、装置、设备及存储介质。本发明技术方案通过预先构建固定容量的结构体,利用结构体来表示每个语音段文件的实例,以及利用语音段状态来定义语音段的状态机制,实现语音段的全生命周期的结构化管理;通过对大...
  • 本发明公开了一种提高柯西去噪扩散概率模型语音合成速度的方法及装置,包括:(1)定义面向语音合成的柯西去噪扩散概率模型;(2)定义面向语音合成的柯西去噪扩散概率模型的损失函数;(3)构建、优化面向语音合成的去噪神经网络;(4)定义面向语音合成...
  • 本申请属于数据处理技术领域,公开了一种音频TDM接口通道扩展方法及装置,该方法包括:音频合成模块获取音频输入数据;音频合成模块处理音频输入数据,得到合并数据;音频合成模块将合并数据发送至TDM接口;TDM接口接收合并数据并将其发送至音频分解...
  • 本申请涉及车辆声浪合成技术领域,特别涉及一种车内主动声浪合成方法、装置及车辆,其中,方法包括:采集车辆的至少一个行驶状态参数;基于至少一个行驶状态参数确定多个用于模拟引擎声的音源的分配信息;基于分配信息确定每个音源的协同播放动作,并控制每个...
技术分类