Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种保护音色的语音转换方法,涉及语音信号处理技术领域。该方法包括音色特征提取模块、音色保持的语音转换模块、音色一致性评估模块和输出重构模块。首先,通过音色特征提取模块采集并分析源语音信号,提取出表征说话人音色的核心特征参数。随后...
  • 本发明公开一种音频重采样频率追踪方法、音频芯片及音频处理系统,所述方法包括:S100、在FIFO单元和DAC单元之间配置插值内核单元,利用FIFO单元接收并缓存前级音频数据,利用DAC单元播放重采样的音频数据;S200、配置所述插值内核单元...
  • 本申请提供的一种外置解码器的参数配置方法、装置、外置解码器及存储介质,通过获取所述外置解码器所在网络的网络状态、所述外置解码器的负载信息和用户体验质量指标;基于所述网络状态、所述负载信息和所述用户体验质量指标确定所述外置解码器的目标采样率;...
  • 本发明公开了一种音频动态频段映射的移频处理方法,其特征在于,包括以下步骤:S1.预处理与特征量化:对原始音频进行预处理,并通过短时傅里叶变换将预处理后的原始音频从时域信号转换为频域信号,提取频域信号的核心特征参数;S2.动态频段划分:构建决...
  • 本公开实施例提供一种音频数据处理方法、装置、电子设备及存储介质,通过获取初始音频数据对应的梅尔频谱数据,利用频带扩展模块处理梅尔频谱数据,生成增强梅尔频谱数据,其中,频带扩展模块中包括残差去噪扩散模型,用于根据梅尔频谱数据的低频特征预测对应...
  • 本申请提供一种音频编解码系统、音频信号处理方法和相关设备。该音频编解码系统包括第一编解码系统和补偿系统。该第一编解码系统包括第一编码端和第一解码端。该第一编码端用于根据输入音频信号生成码率不同的多种码流,并将生成的码流发送给该第一解码端。该...
  • 本发明提供了一种基于分布式一致性协议的声纹识别系统及方法,属于生物特征识别技术领域,其系统包括:消息队列模块用于接收、存储并缓冲来自外部的声纹识别或注册请求;分布式处理集群模块由多个服务节点组成,每个服务节点均运行声纹识别引擎与分布式一致性...
  • 本发明涉及数据处理技术领域,尤其涉及面向家庭环境的声纹识别方法、装置、设备及存储介质,所述方法包括:构建改进的ECAPA‑TDNN模型并进行训练,得到通用声纹识别模型;获取家庭场景微调数据并进行预处理,使其可用于通用声纹识别模型的训练,以得...
  • 本发明提供交互式玩具机器人的语音数据实时控制方法及系统,涉及数据处理技术领域,所述方法包括:对语音帧序列进行声学特征提取,得到声纹特征嵌入,并将所有声纹特征嵌入按照时间顺序排列,生成声纹特征嵌入序列;将声纹特征嵌入序列输入至预先训练的语音识...
  • 本发明涉及船员考核管理技术领域,具体公开了一种基于船员考核在线管理方法及系统,采集船员考核时的原始语音信号及对应时刻的螺旋桨转速、海况等级和船舶航速;将原始语音信号和物理参数输入物理约束降噪网络作为正则化项嵌入损失函数,分离海洋背景噪声,输...
  • 本发明实施例提供一种语音识别方法、电子设备、存储介质和程序产品,涉及人工智能技术领域,该方法包括:采集语音信号,并确定语音信号所涉及的目标领域;获取目标领域对应的目标语音识别模型,并将语音信号输入目标语音识别模型,得到初始语音识别结果,其中...
  • 本发明涉及一种多模态数据修正方法、装置、计算机设备及存储介质,包括:获取目标多模态数据,并基于目标多模态数据生成对应的初始文本,其中,目标多模态数据至少包括语音数据;将初始文本发送至多个终端,以使多个终端基于初始文本进行实时标注操作,得到协...
  • 本申请涉及人工智能技术领域,揭示了一种多语言无障碍会议室及其实现方法,所述方法包括:由应用服务器、AI模型服务器以及多个用户终端协同执行,包括以下步骤:应用服务器创建会议室实例并生成对应的接入链接,用户终端通过接入链接连接至应用服务器,并向...
  • 本发明公开一种基于场景提示的语音识别方法、装置及相关介质,该方法包括将目标音频转换为频谱图以输出音频时序特征;获取对应的场景提示文本并进行分词处理,再通过提示编码器进行嵌入处理,得到提示特征;将音频时序特征与提示特征进行注意力计算,输出增强...
  • 本公开涉及一种交互式表达训练方法、装置、设备、介质。该方法包括:获取表达主体的语音数据;对语音数据进行语音识别,得到语音数据对应的文本数据;提取语音数据的情感表达特征;通过多模态大模型,基于文本数据和情感表达特征,生成表达主体的表达反馈信息...
  • 本发明涉及语音纪要自动生成技术领域,具体为基于AI的语音识别的会议纪要自动生成方法及系统,包括:处理会议音频得到多通道语音流,经增强后识别并转写多说话人片段。将时间邻近的同一说话人片段合并为逻辑单元后,对其进行主题聚类与意图识别以构建语义结...
  • 本申请公开了一种交互语音的处理方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:在接收到目标对象发送的交互语音对应的第n个中间语音包的情况下,依次对第m至第n个中间语音包进行语音识别,以确定每个中间语音包对应的中间文本;根据...
  • 本发明公开了一种基于大语言模型和数字人交互的智能汇报方法及系统。该智能汇报方法包括:通过自动语音识别进行流式语音转写和有效文本筛选;通过结构化提示词引导和本地轻量化大语言模型推理,进行用户输入意图解析;根据控制类意图优先规则,进行多意图指令...
  • 本公开的实施例公开了基于语音信息与大模型的需求信息识别方法、装置。该方法的一具体实施方式包括:从录音存储数据库中获取针对咨询场景的对话语音文本信息,其中,对话语音文本信息为不同用户之间的对话语音转换为文本后的文本信息;将对话语音文本信息与预...
  • 本发明公开了一种基于多维度音频特征的车载多感官协同交互方法及系统,该方法包括:获取车载原始音频源信号,采用双流并行解析架构,一方面利用NLP模型提取歌词语义特征,另一方面利用CNN模型提取声学物理特征;基于车辆行驶状态对双流特征进行加权仲裁...
技术分类