Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学徐乐玏获国家专利权

东南大学徐乐玏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种基于强化学习的实现自身避障的无人机目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117369502B

龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311431289.8,技术领域涉及:G05D1/46;该发明授权一种基于强化学习的实现自身避障的无人机目标跟踪方法是由徐乐玏;孙长银;王腾设计研发完成,并于2023-10-31向国家知识产权局提交的专利申请。

一种基于强化学习的实现自身避障的无人机目标跟踪方法在说明书摘要公布了:本发明涉及一种基于强化学习的实现自身避障的无人机目标跟踪方法,所述方法包括以下步骤:S1:在虚拟机器人实验平台中搭建用于无人机目标跟踪的场景,S2:场景中的机器人能够实现自主避障,遇到障碍物便随机左转或者右转,机器人运行的速度为0.8ms;S3:采集图像,在无人机的机身下方安装一个摄像头,用来采集向下视野中的图像,图像是像素大小为64×64的RGB图像,S4:再使用三层卷积神经网络和一个空间软最大化spatialsoftmax层对输入的图像进行处理,提取有用的特征,通过无人机当前所处环境的状态来感知碰撞风险,并获取注意力机制中的参数来自适应调整两个任务的权重。

本发明授权一种基于强化学习的实现自身避障的无人机目标跟踪方法在权利要求书中公布了:1.一种基于强化学习的实现自身避障的无人机目标跟踪方法,其特征在于,所述方法包括以下步骤: S1:所述方法包含三个网络,分别是无人机目标跟踪网络和无人机避障网络,称为教师网络,以及无人机目标跟踪与避障同时实现的多任务网络,称为学生网络,三个网络在三个场景中训练,在虚拟机器人实验平台中搭建用于无人机目标跟踪的场景, S2:场景中的机器人能够实现自主避障,遇到障碍物便随机左转或者右转,机器人运行的速度为0.8米每秒, S3:采集图像,在无人机的机身下方安装一个摄像头,用来采集向下视野中的图像,图像是像素大小为64×64的彩色RGB图像, S4:再使用三层卷积神经网络和一个空间软最大化spatialsoftmax层对无人机目标跟踪网络中输入的图像进行处理,提取有用的特征,同时使用长短期记忆LSTM网络对历史的无人机动作进行编码,使得网络可以学习到历史的信息, S5:整个跟踪网络采用决斗双深度Q网络D3QN进行训练,与环境不断交互,输出学到的动作,再使用底层的无人机控制器在仿真环境中驱使无人机运动,得到新的状态,并且获得采取动作到达状态对应的奖励,继续训练网络,共训练2000个回合,得到模型一, S6:在虚拟机器人实验平台中搭建用于无人机自身避障的场景, S7:采集图像,在无人机的机身四周安装四个摄像头,分别是前后左右四个方向,每个方向的视角范围为90度,用来采集无人机四周的图像,图像是像素大小为64×64的RGB图像, S8:再使用三层卷积神经网络和一个空间软最大化spatialsoftmax层对无人机避障网络中输入的图像进行处理,提取有用的特征, S9:整个跟踪网络采用D3QN进行训练,与环境不断交互,输出学到的动作,再使用底层的无人机控制器在仿真环境中驱使无人机运动,得到新的状态,并且获得采取动作到达状态对应的奖励,继续训练网络,共训练2000个回合,得到模型二, S10:将在两个环境中学到的模型一和模型二存到记忆库buffer中,通过策略蒸馏的方法,将前两个学到的网络模型作为教师网络,将多任务网络作为学生网络,在虚拟机器人实验平台中搭建用于无人机目标跟踪同时实现自身避障的场景,主要包含了墙壁,桩子可能给无人机产生障碍的物体, S11:场景中的机器人能够实现自主避障,遇到障碍物便随机左转或者右转,机器人运行的速度为0.8米每秒,机器人的运行路径都是随机的,无人机才能更好的根据摄像头采集到的图像学到合理的策略, S12:采集图像,在无人机的机身四周安装四个摄像头,分别是前后左右四个方向,每个方向的视角范围为90度,用来采集无人机四周的图像,在无人机的机身下方安装一个摄像头,用来采集向下视野中的图像,图像是像素大小为64×64的RGB图像,总共有五张图像作为输入, S13:再使用三层卷积神经网络和一个空间软最大化spatialsoftmax层对多任务网络中输入的图像进行处理,提取有用的特征, S14:整个跟踪网络采用D3QN进行训练,与环境不断交互,输出学到的动作,再使用底层的无人机控制器在仿真环境中驱使无人机运动,得到新的状态,并且获得采取动作到达状态对应的奖励,继续训练网络,共训练2000个回合,训练出的模型经过测试得到无人机在复杂动态的环境中目标跟踪的同时实现自身避障。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。