Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学;中国人民解放军陆军军医大学第一附属医院任君凯获国家专利权

中国人民解放军国防科技大学;中国人民解放军陆军军医大学第一附属医院任君凯获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学;中国人民解放军陆军军医大学第一附属医院申请的专利一种基于分层强化学习的长时域机器人自主作业方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121696986B

龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610183110.9,技术领域涉及:B25J9/16;该发明授权一种基于分层强化学习的长时域机器人自主作业方法是由任君凯;瞿宇珂;卢惠民;肖军浩;曾志文;代维;胡荣设计研发完成,并于2026-02-09向国家知识产权局提交的专利申请。

一种基于分层强化学习的长时域机器人自主作业方法在说明书摘要公布了:本发明涉及一种基于分层强化学习的长时域机器人自主作业方法,包括:训练阶段:构建分层强化学习模型;获取机器人的状态信息并输出长时域任务链,且将长时域任务链拆解出并行交叉的偶序任务链和奇序任务链;第一技能模型基于偶序任务链进行强化学习训练,以输出第一动作,第二技能模型基于奇序任务链进行强化学习训练,以输出第二动作;上层规划单元基于全局的状态信息进行强化学习训练,生成对第一动作和第二动作进行加权组合的动作权重;执行阶段:基于机器人当前的状态信息生成第一动作和第二动作;生成对第一动作和第二动作进行加权组合的动作权重,生成机器人的执行动作。本方案有效的确保了训练过程中模型更新的稳定性与低计算成本。

本发明授权一种基于分层强化学习的长时域机器人自主作业方法在权利要求书中公布了:1.一种基于分层强化学习的长时域机器人自主作业方法,其特征在于,包括以下步骤: S1.训练阶段: 构建分层强化学习模型,且其包括:任务链拆解单元、上层规划单元和下层技能单元; 任务链拆解单元获取机器人的状态信息并输出长时域任务链,且将长时域任务链拆解出并行交叉的偶序任务链和奇序任务链; 下层技能单元包括:第一技能模型和第二技能模型,且第一技能模型和第二技能模型分别采用动态科尔莫戈洛夫-阿诺尔德网络; 第一技能模型基于偶序任务链进行强化学习训练,以输出第一动作,第二技能模型基于奇序任务链进行强化学习训练,以输出第二动作;其中,在第一技能模型、第二技能模型的强化学习训练中,采用动态tanh函数和低秩分解方法辅助第一技能模型、第二技能模型进行动态更新; 上层规划单元基于机器人的状态信息进行强化学习训练,生成对第一动作和第二动作进行加权组合的动作权重; S2.执行阶段: 基于机器人当前的状态信息获取长时域任务链并分解出偶序任务链和奇序任务链,并分别生成第一动作和第二动作; 生成对第一动作和第二动作进行加权组合的动作权重; 基于动作权重对第一动作和第二动作进行加权组合,生成机器人的执行动作; 步骤S1中,所述第一技能模型和所述第二技能模型基于策略梯度的强化学习方法进行训练,且所述第一技能模型和所述第二技能模型基于技能模型损失函数进行更新,其中,技能模型损失函数表示为: 其中,表示技能模型损失函数,表示子任务的状态所对应的损失函数,表示子任务的状态所对应的损失函数,表示子任务的状态,即状态信息,表示状态和动作的优势函数,表示状态和动作的优势函数,表示在子任务中执行的动作,表示在子任务中执行的动作,表示优势函数到损失函数的映射关系,表示状态下的状态价值函数,表示状态-动作对价值函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学;中国人民解放军陆军军医大学第一附属医院,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。