Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明的实施例提供了一种意图识别方法、电子设备及可读存储介质,涉及数据处理领域,方法包括:接收用户输入的第一语音信息,基于第一语音信息进行意图识别,得到第一语音信息对应的意图信息,接收用户输入的第二语音信息,将第一语音信息的文字标识与第二语...
  • 本发明公开了一种通过语音交互控制大屏数据指标变化展示的方法,涉及数据处理技术领域,包括:对原始语音指令进行识别解析,获得解析结果,所述解析结果包含通过领域语义增强确定的用户意图、目标数据指标及目标操作类型;基于当前应用场景与用户身份信息,对...
  • 本申请公开了一种设备唤醒方法、电子设备及计算机可读存储介质。本申请通过获取当前音频流以及设备所处的当前环境信息;将当前音频流输入预设语音唤醒模型中,得到模型输出结果;响应于模型输出结果表征当前音频流中存在至少一个预设设备的预设唤醒词,根据当...
  • 本申请一些实施例示出一种语音识别方法及终端设备,该方法包括:将接收到的语音数据输入混合架构解码器,输出第一识别文本、第一声学模型得分、第一语言模型得分和置信度。如果置信度小于预设阈值,则将语音数据输入语音识别模型中,以输出第二识别文本;选取...
  • 本发明提供一种电子设备的对话发起方法及相关装置,方法包括以下步骤:在电子设备处于唤醒状态且上一轮对话已结束的情况下,检测是否在预设时间段内未接收到用户输入的对话数据;若在预设时间段内未接收到用户输入的对话数据,确定电子设备是否满足主动对话发...
  • 本申请涉及一种设备的控制方法、装置、智能家居设备及存储介质,方法包括:在目标设备接收到目标语音指令时,获取当前目标设备所处环境的环境信息和目标设备对应的历史语音识别信息;基于目标语音指令,确定目标语音指令与目标设备所接收到的历史语音指令集之...
  • 本申请公开了一种控制指令的发送方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该控制指令的发送方法包括:从自动语音识别ASR结果中得到流式识别结果;生成所述第一识别结果对应的第一控制意图,并将基于所述第一控制意图生成的第一控制指令发送...
  • 本发明公开了一种语音交互的石墨烯AI智能茶几控制方法,涉及家居语音交互技术领域,控制步骤为:S1、基于茶几内置麦克风监听周围用户指令,茶几接收到语音指令后,同步进行初步降噪处理,保留指令的语音片段;S2、训练包含噪声场景的数据集,让内置模型...
  • 本申请实施例提供一种车辆的语音识别方法、车辆及存储介质,其中,该方法包括:响应于接收到车辆中语音交互系统的唤醒指令,采集车辆内用户输出的语音信息;对语音信息进行多维度特征提取,得到用户的语音特征信息,其中,语音特征信息用于表示与目标意图关联...
  • 本申请公开了一种语音交互方法、装置、电子设备及介质,该方法包括:响应于针对当前界面的语音输入操作,获取语音输入操作对应的语音文本信息和当前界面中至少一个组件各自的组件属性信息;对语音文本信息进行组件描述抽取,得到组件特征描述信息和交互类型信...
  • 本发明提供了一种语音识别遥控手柄及语音与操纵杆协同方法,通过从遥控手柄在人机交互过程中的语音输入信号中提取出多尺度语义的语音特征,从遥控手柄在人机交互过程中的语音输入信号中提取出多尺度时序意图的操纵杆操作特征;根据语义语音特征和操纵杆操作特...
  • 本发明实施例公开了一种医疗影像设备的控制方法、装置、电子设备及存储介质,所述方法包括:接收用户针对当前医疗影像设备输入的语音命令信息;对所述语音命令信息进行语音识别,得到对应的语义信息;根据所述语义信息生成控制指令;基于所述控制指令控制所述...
  • 本申请涉及人工智能、数据处理技术领域,公开了一种音视频问答处理方法、训练方法、系统和电子设备。该方法包括:获取问题文本、音频数据和视觉数据,其中,问题文本用于对音频数据和视觉数据中的内容进行提问;将问题文本分别与音频数据和视觉数据进行对齐,...
  • 本申请公开了一种基于动物行为的语音对话方法、装置及可穿戴设备,该方法包括实时采集动物的运动数据与动物周边的环境声音;对所述运动数据进行分析以获取动物的行为状态;对所述环境声音进行解析以获取环境声音中所包含的音频信息;当检测到对话触发指令时,...
  • 本发明涉及智能语音交互技术领域,具体涉及基于用户画像与位置感知的两轮车租赁语音服务系统,该系统包含四大核心模块。多传感器数据融合与运动状态耦合的语音增强模块通过运动微动作事件检测建立动作‑意图关联;位置感知的自适应噪声对抗处理模块构建地理噪...
  • 本申请公开了一种座舱环境下的语音交互方法、装置、设备、介质及产品,该方法包括:采集座舱环境下的至少两路音频信号,至少两路音频信号是在座舱环境下功放的情况下,采集得到的包含语音音频的信号;获取至少两路参考信号;从第i路音频信号中去除第i路参考...
  • 本申请涉及意图识别技术领域,具体是面向多场景的语音驱动AI大模型意图解析方法与动作执行系统,通过构建包含问询与动作偏向评分的意图实体库,结合阈值判断与意图可能性评分,能够精准区分患者的问询需求与操作需求;当意图不明时,引入微调语言大模型生成...
  • 本发明公开了基于深度学习模型的多模态语音增强方法及设备,涉及人工智能技术领域,该方法包括:在虚拟现实环境中获取用户头部姿态数据、双耳音频信号和视觉上下文信息,将双耳音频信号编码为三维空间声学特征,并从视觉上下文信息中提取虚拟声源位置特征及唇...
  • 本发明公开了一种基于眼动引导的复杂声景目标语音选择性增强方法及系统,通过微型眼动追踪模块与环形四元麦克风阵列同步采集注视方向与多通道音频信号,构建眼动引导的动态声源定位机制;基于视觉置信度评分自适应切换或融合波束成形与深度学习增强策略,并引...
  • 本发明涉及数字信息传输技术领域,公开了一种基于语义压缩与音视频联合感知的窄带传输方法及系统,该方法包括:获取链路状态参数确定发送预算。提取音频语义单元序列并提取紧急指令语义信息。提取场景语义信息。对场景语义信息中的口型参数进行跨模态预测,获...
技术分类