Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于视频序列的烟火侦测方法及装置,涉及计算机视觉相关领域,其中方法包括:对视频流中的单帧图像进行目标检测处理,得到包含烟火潜在区域的检测框集合;针对检测框集合中的每一潜在烟火区域,基于目标跟踪算法对视频流的连续多帧图像进行处...
  • 本发明提供了一种基于伪标签生成的无人机光学图像未爆弹探测方法和系统,包括:地面站处理模块、无人机与地面站通信模块、机载计算模块、无人机平台,地面站处理模块由人工设定作业区域,生成首次搜查作业航线,通过无人机与地面站通信模块将作业航线传输到机...
  • 本申请实施例提供了一种模型检测结果匹配方法、装置、设备及介质,涉及图像检测技术领域。该方法包括:基于待检测图像,获取目标检测模型输出的第一检测结果集合和关键点检测模型输出的第二检测结果集合;提取待检测图像中相邻帧间的第一检测结果集合和第二检...
  • 本申请公开了一种基于视频分析的偷盗行为检测方法,包括:获取初始策略模型,初始策略模型为多模态大语言模型;从监控视频流中获取多个关键帧作为初始策略模型的输入数据,同时构造输入提示词,通过初始策略模型对同一输入数据进行分析,并行生成多个候选响应...
  • 本发明公开了一种基于反转任务增强的时序视频定位框架优化方法,包括以下步骤:通过构建多任务学习架构并引入动词补全、动作识别与视频描述三类反转任务,增强时序视频定位模型的动作语义理解能力;采用交替训练策略优化时序定位任务与反转任务;优化后的时序...
  • 本发明涉及一种远程驾控方法、系统及介质,涉及智能驾驶领域,所述方法包括获取远程车辆的多路视频流数据;基于视觉语言模型对所述多路视频流数据进行场景理解,识别交通场景中的交通参与者及其行为特征;根据所述场景理解结果,通过多维度风险评估算法对识别...
  • 本申请提供了一种物流操作数据处理方法和装置、电子设备及存储介质,该方法应用于边缘服务器,方法包括:基于视频筛选模型对目标物流作业场景中采集得到的物流操作视频进行违规片段筛选得到视频筛选结果,并基于与目标物流作业场景对应的操作分类模型对违规异...
  • 本发明提供一种综采工作面大块煤预破碎方法、装置和综采工作面视频监控系统,涉及计算机技术领域,包括:对实时视频流中的各个图像帧进行语义分割,得到各个图像帧对应的煤流区域图像;所述实时视频流用于对综采工作面的煤流进行监控;基于各个图像帧对应的煤...
  • 本发明公开一种基于自适应优化的多模态视频理解方法,属多模态语义建模领域。针对背景技术指出的静态融合无法动态调整模态权重问题,发明内容首次提出AOSM模块:通过可学习温度参数τ在线生成帧级注意力权重,实现文本‑帧语义相关度实时量化。AOSM提...
  • 本申请属于人工智能领域,涉及一种基于自监督的视频关键帧提取方法、装置、设备及介质,包括:获取目标视频的帧序列,用预训练特征提取器提取帧序列中各帧的特征向量,得特征向量序列;依帧序列确定图节点,根据特征向量序列算边权重,构建初始有向图;计算其...
  • 本发明公开了基于多模态大模型的交通视频多维度语义理解方法及系统,涉及智能交通相关领域,其中方法包括:实时获取多源采集数据;对多源采集数据进行预处理,获取交通数据序列;对交通数据序列进行多模态特征提取与跨模态特征对齐,建立交通特征对齐向量;将...
  • 本发明公开了VLM安防监控场景下的视觉语言模型系统,涉及视觉语言模型技术领域,包括:多模态融合模块,用于接收并处理图像帧、深度图及场景信息,异常事件识别模块,用于根据视觉语言模型分析监控画面并识别高阶语义事件,结构化事件输出模块,用于生成标...
  • 本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种基于自适应正则化的视频帧提取方法、装置、设备及介质,所述方法包括:将初始视频流数据分解为多个连续的初始视频帧,对多个初始视频帧进行帧归一化处理,生成多个标准视...
  • 本发明涉及视频处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于原型网络的关键帧提取方法,包括:获取原始输入数据,对原始输入数据进行帧提取,得到RGB帧序列;由视觉编码器和文本编码器构建视觉语言嵌入生成器;将RGB帧序...
  • 本发明涉及视频处理技术领域,可应用医疗健康及金融科技等业务系统平台中,公开了一种基于低秩多模态的关键帧提取方法,包括:根据获取的多模态数据构建原始特征矩阵;对原始特征矩阵分别进行分解处理,生成低秩嵌入表示,将低秩嵌入表示进行向量拼接,得到压...
  • 本发明涉及数据分析技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种原型记忆增强的视频关键帧提取方法、装置、设备及介质,所述方法包括:对原始视频数据转换的时序脉冲序列中每帧视频帧进行时序脉冲卷积,得到脉冲特征序列,将脉冲特征序...
  • 本发明涉及机器学习技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种关键帧提取方法、装置、设备及介质,包括:对预先获取的多模态数据流进行标准化处理并提取不同模态数据的贝叶斯特征,得到视频模态贝叶斯特征、音频模态贝叶斯特征和文本...
  • 本申请实施例提供了一种视频关键帧提取方法、装置、电子设备及存储介质,涉及图像处理技术领域,适用于金融科技领域和医疗健康领域。该方法包括:获取视频帧序列,视频帧序列包括至少两个视频帧;对每一视频帧进行特征提取,得到视频帧特征;根据各个视频帧特...
  • 本发明公开了一种基于物联网的智慧物业管理系统,涉及物业管理领域,解决了现有智慧物业管理异常判断准确性不足的问题,包括:数据采集模块:采集监控信息;区域划分模块:获取监控设备的监控范围,对社区进行区域划分,根据监控设备的监控信息,对每个划分区...
  • 本申请涉及一种用于生物安全柜操作培训的视觉纠偏方法,所述方法包括:建立生物安全柜柜体坐标系并划分清洁区、操作区、废弃区及限制区;基于标准操作规程建立包含动作类型、对象类型、允许区域与姿态约束的标准比对模型;采集操作过程并生成统一时间轴上的动...
技术分类