Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及模型训练技术领域、智慧医疗领域及金融服务领域,尤其涉及一种用于声学模型对抗训练的判别方法、装置、设备及介质。该方法在执行声学模型对抗训练时,获取声学模型输出的目标声学数据,对目标声学数据进行特征提取,得到目标声学特征,对目标中间特...
  • 本申请提出一种基于动作语义参考、语音节奏以及大模型技术的文字语音生成说话动作的方法,该方法包括:获取同步的音频数据、文本数据以及参考动作序列;根据音频数据的声带振动频率以及信号功率生成音频数据的节奏序列;将通过语音大模型获取的音频数据的音频...
  • 本申请适用于人工智能技术领域,提供了一种语音识别方法,该方法包括:获取目标儿童用户的语音数据;对语音数据进行感知降噪处理,得到预处理好的语音数据;对预处理好的语音数据进行声学特征提取处理,得到声学特征向量;基于声学特征向量,通过预设的语音识...
  • 本公开涉及智能建造领域,具体涉及一种工程建造辅助系统、方法、存储介质及电子设备。该工程建造辅助系统包括:终端设备,包括用于采集语音指令,并将语音指令传输至云端数据平台的语音采集设备,以及用于显示接收到的目标建造辅助信息的AR设备;云端数据平...
  • 本申请公开了一种语义识别中词序列确定方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:对语音信号对应的隐向量序列进行线性投影,以得到语音信号的多粒度后验概率,其中,多粒度后验概率包括:字符后验概率、子词后验概率和词后验概率;...
  • 本发明公开了一种语音应用的迭代更新方法、装置、系统、车辆及服务器,涉及语音识别技术领域,该方法应用于轨道交通车辆,包括:在当前语音应用启动后,获取车载拾音器采集的原始语音数据流;利用当前语音应用的语音识别模型对原始语音数据流进行语音识别,得...
  • 本申请公开了一种家电设备控制方法、装置、程序产品、介质及家电设备,所述方法包括:获取用户语音,并确定所述用户语音的语音类型;如果所述语音类型为唤醒语音,则控制所述家电设备的状态为监听状态,并在所述监听状态下监听用户的指令语音,以基于监听到的...
  • 在车辆中使用具有情绪响应能力的基于位置的琐事问答的一种或多种方法,包括:基于全球定位系统(GPS)坐标来发起一个或多个基于位置的琐事问答问题,以及使用车辆内的一个或多个麦克风来检测活跃玩家。基于玩家姓名和座位位置,所述方法包括针对座位位置中...
  • 本发明涉及仿生玩具技术领域,特别涉及一种仿生玩具的控制方法、仿生玩具及可读存储介质。本发明提供的方法将用户语音信息转换为文本信息;提供预设关键词数据库和喜好数据库、情绪数据库和意图数据库;判断文本信息是否与预设关键词数据库匹配,若否,则基于...
  • 本发明提供基于AI语音交互与控制的可视化控制方法及系统,涉及AI控制技术领域,包括通过语音或远程应用接口获取包含目标设备标识与执行动作类型的控制指令;基于预设设备映射关系将控制指令解析为设备级控制信号;通过无线通信链路将控制信号传输至具有独...
  • 本发明公开了一种基于大模型的用户画像记忆与语音技能场景化联动方法及系统,其中,方法包括获得用户的多维画像标签,基于更新触发条件实时迭代多维画像标签;构建场景特征向量,通过意图推理算法,获得用户当前潜在意图;根据用户语音指令和用户当前潜在意图...
  • 本发明涉及讲解机领域,具体涉及一种带 AI 交互与数据回传的景区讲解机系统,包括:设备初始化模块启动后加载定制化导览界面,开启 GPS 与蓝牙 Beacon 双模定位并输出位置数据;内容匹配与模板展示模块将位置数据与内置景点数据库匹配;AI...
  • 本发明提供了一种语音数据的处理方法、系统、电子设备及存储介质,该方法为:通过经过筛选的数据传输路径将待处理语音数据发送至服务器。如果未能成功将待处理语音数据发送至服务器,则利用部署在终端设备的第一语音模型确定待处理语音数据的语音转义结果。再...
  • 本申请公开了一种智能语音交互方法及系统,涉及语音交互技术领域,包括:获取用户语音,确定情感标签和发音规律特征,输出语言模式;基于标准词频提取疑惑词、填充词特征和指代词;基于辨析规则确定每个疑惑词的精准含义,根据分层机制确定指代词的精准含义;...
  • 本发明提供了一种智能设备的交互方法和智能设备,其中,该方法应用于智能设备,该方法包括:响应于所拾取到的语音信号,提取语音信号中的第一声纹特征信息;响应于第一声纹特征信息与预先存储的基准第一声纹特征信息之间的相似度高于相应的第一相似度阈值,则...
  • 本申请公开一种数字人交互方法、装置、设备及程序产品,旨在解决现有数字人系统在专业领域中因术语识别不准而导致交互内容失准的问题。方案包括:对人机交互过程中的用户语音数据进行文本转录,得到至少两种候选文本;确定每种所述候选文本的声学概率分数与知...
  • 本发明公开了一种基于多模态生物信号感知的静默语音交互系统,涉及静默语音交互技术领域,包括如下步骤:建立交互词语数据库,并采集多位测试者在默念交互词语时的肌电信号和振动信号;构建对应的词语识别模型,得到不同性别的通用词语识别模型;设置测试词语...
  • 本发明提供一种模拟器教员台软件的语音控制方法、装置及电子设备,其中方法包括:获取包括界面控件信息和语音指令信息的配置文件集;基于配置文件集构建包括控件要素和指令动作要素的语音指令知识库;获取待识别语音指令并转换为指令文本;基于语音指令知识库...
  • 本申请关于一种基于发音相关性的偏置方法、装置、设备、存储介质及产品,涉及语音识别领域。该方法包括:接收对目标语音推理出的预选字符;从预先构建的、以发音相关性为基础的字符关联数据中,以高于特定发音相似阈值作为筛选条件,确定与预选字符具有发音相...
  • 本发明涉及一种语音识别与敏感词检测方法,包括以下步骤:采集语音信号并进行预处理与声学特征提取;构建语音识别模型,基于声学特征生成对应文本数据;构建敏感词库并将敏感词库构建为确定有限自动机状态图;遍历文本数据根据确定有限自动机状态图检测敏感词...
技术分类