Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明公开了一种基于动态特征混淆与解耦注意力的说话人身份认证方法,首先提取原始语音信号的特征生成原始特征图F;生成动态混淆掩码M,并与F进行逐元素融合,得到混淆特征图F′;将混淆特征图F′或原始特征图F输入深度神经网络编码器,提取高维说话人...
  • 本发明提供一种油管检测方法、装置、电子设备及存储介质,涉及油管检测领域,方法包括:获取待检测油管图像,并对待检测油管图像进行特征提取,得到对应的特征图谱;利用预设关键点检测模型对特征图谱进行关键点预测,以预测表征油管位置及形态的预设数量的第...
  • 本公开提供了针对声纹识别的对抗扰动生成方法、装置、设备和介质。该对抗扰动生成方法包括:获取训练声纹样本集;初始化对抗样本生成网络;针对训练声纹样本集中的每一个原始声纹样本,确定目标识别对象;将原始声纹样本输入对抗样本生成网络,得到声纹对抗样...
  • 本发明提供一种基于病理图像的空间基因表达图谱预测方法,涉及生物医学技术领域,该方法为通过对病理图像进行高分辨率数字化扫描,得到原始染色图像;将原始染色图像与空间表达矩阵聚合,得到训练数据集;利用训练数据集对图谱预测模型进行训练,得到训练好的...
  • 本申请公开了一种基于多核异构的语音控制方法、系统、存储介质及芯片,属于芯片技术领域。语音处理单元将用户的语音信号转换成文本指令后发送给语义推理单元;语义推理单元利用语义处理模型对文本指令进行语义推理后生成控制指令,根据控制指令生成第一校验信...
  • 本发明涉及人工智能与语音处理技术领域,特别涉及一种零样本歌声合成与编辑的方法及系统。所述方法包括以下步骤:构建模型架构、进行在线旋律学习与联合优化、旋律与内容对齐约束、弱标注时长建模、强化学习后训练、训练与推理。从而能够合成任意歌词与任何参...
  • 本申请涉及音频多场景化加噪处理方法、装置、设备及介质,方法包括:音频服务系统获取目标声学场景中的噪声类型以及需要进行音频多场景化加噪处理的原始音频;音频服务系统将每种噪声类型作为文本嵌入传输至噪声生成系统中的潜在扩散模型,在潜在扩散模型中采...
  • 本发明公开了一种基于酒花信号的智能声纹防伪方法、装置及设备,通过将酒花撞击瓶壁产生的声纹信号进行采集,然后对声纹信号进行去噪处理后提取PLP特征,将特征信号输入CNN‑GMM‑HMM声纹模型中进行训练构建原始标准数据库,当对样本声纹信号采集...
  • 本发明公开了一种基于大数据的智慧农业作物生长分析系统,通过传感器阵列获取初始农作物数据;利用小波去噪‑卡尔曼滤波耦合算法对初始农作物数据进行降噪处理,基于改进的MobileNetV3网络对图像数据进行特征提取,输出作物形态特征向量;通过LS...
  • 本申请提供一种鱼眼图像的展开方法及装置,涉及图像处理技术领域,可以用于调整鱼眼图像的展开起始位置,以提升基于该展开的鱼眼图像的图像效果以及进行目标检测的准确率。具体方案包括:首先将原始鱼眼图像基于起始位置展开,得到原始鱼眼图像的第一展开图像...
  • 本发明公开了基于多光谱图像融合的作物病害早期检测方法及其系统,属于农业智能监测与图像处理技术领域,本发明包括多光谱图像自适应配准融合模块、光谱空间特征协同提取模块、多尺度交叉注意力病害检测模块和置信度驱动边界优化模块,通过基于深度特征的自适...
  • 本申请提供了一种针对特定内容语音片段的声纹特征提取方法,所述声纹特征提取方法,包括:通过前处理,得到声学谱特征片段;构造时延神经网络模块;基于所述时延神经网络模块、加权激励机制和残差结构,构造残差时延神经网络模块;基于所述时延神经网络模块、...
  • 本发明公开一种基于广域感受野空间注意力的目标检测方法,包括:准备训练、测试用的图像数据集;构建基于广域感受野空间注意力的目标检测网络,包括Backbone、Neck、Head和MSA四部分;使用训练好的网络对测试集图像进行特征提取。本发明从...
  • 本申请公开了一种基于多时相遥感影像的茶园识别方法、装置、设备及存储介质,涉及农业遥感技术领域,包括以下步骤:确定茶叶的物候期和农事操作时期,采集待识别区域对应的多时相遥感影像数据;根据遥感影像数据计算归一化植被指数值和预先构建的归一化目标作...
  • 本发明涉及图像数据处理领域,具体涉及一种用于公路边坡防灾减灾的评估模型构建方法。包括:获取样本时序图像;识别发生移动的边坡区域,将连续存在移动且移动趋势一致的帧序列合并为目标时段;计算该边坡区域的移动波动指数;确定每一目标时段的相似时段,计...
  • 本发明提供了一种基于改进的RTDETR的轻量级人形检测方法、设备、介质及产品,该方法包括:获取针对人形检测的数据集,并将数据集分成训练集、验证集和测试集;构建改进的RTDETR模型,改进的RTDETR模型中使用ES Block来替换改进前R...
  • 本发明公开了一种基于专家系统与神经网络融合的星上火点检测方法,包括:根据预设的多源遥感数据提取得到火点特征图谱库;构建轻量化神经网络,将预设的多源遥感数据输入到轻量化神经网络,轻量化神经网络输出火点数据;对火点数据,通过克里金插值法融合火点...
  • 本申请涉及视障辅助技术领域,具体涉及一种用于视障辅助导航的障碍物扫描感知系统,该系统包括:视障辅助图像采集模块,实时获取待扫描区域的深度图像;视障辅助图像分析模块,通过确定特征像素点,得到分布特征值,进而筛选待定伪影像素点,比较待定伪影像素...
  • 本申请公开了一种基于深度学习的谐音生成方法及终端,获取待转化语言的源语言文本,提取源语言文本的音素流;根据目标语言的语言规则切分音素流得到多个第一音节;获取目标语言对应的发音库,在发音库中匹配每一第一音节对应的第二音节,并获取第二音节对应的...
  • 本发明提供一种语音识别方法及装置。所述方法包括:获取原始语音数据;对所述原始语音数据进行信号预处理,得到预处理语音数据;根据所述预处理语音数据,得到目标特征数据;所述目标特征数据包括短时能量和短时零交叉率;根据预设提取条件和所述目标特征数据...
技术分类