Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学陈实获国家专利权

四川大学陈实获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利基于深度强化学习的光热-光伏联合电站优化调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121485161B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610024048.9,技术领域涉及:H02J3/466;该发明授权基于深度强化学习的光热-光伏联合电站优化调度方法是由陈实;王可瑞;刘艺洪;晏红平;陈江平;王舒灏;熊星瑶;袁浩云设计研发完成,并于2026-01-09向国家知识产权局提交的专利申请。

基于深度强化学习的光热-光伏联合电站优化调度方法在说明书摘要公布了:本发明涉及新能源并网调度优化技术领域,公开了一种基于深度强化学习的光热‑光伏联合电站优化调度方法,以最小化系统总成本为目标,并使用改进的LSTM‑PER‑TD3算法,对光热‑光伏联合电站优化调度策略进行研究,建立光热‑光伏联合电站的精细化调度模型,计及电加热器的耦合作用,构建广义惯量计算模型并嵌入RoCoF与频率偏差安全约束;引入强化学习,将调度问题转化为马尔可夫决策过程,提出融合LSTM与PER的改进TD3算法。本发明克服了在强时序耦合调度问题中历史信息利用不足、关键样本学习效率低的缺陷,大大加快了最优调度策略的求解速度,为高比例新能源电力系统提供了一种高效的智能化调度工具。

本发明授权基于深度强化学习的光热-光伏联合电站优化调度方法在权利要求书中公布了:1.基于深度强化学习的光热-光伏联合电站优化调度方法,其特征在于,包括以下步骤: 步骤1:建立光热-光伏联合电站精细化调度模型,包括光热发电系统、光伏发电系统、电加热器及储热系统的数学模型,并嵌入频率-惯量安全约束; 步骤2:建立光热-光伏联合电站的马尔科夫决策过程:状态空间包括光热-光伏联合电站中各电力组件所处的可能状态,动作空间包括光伏-光热联合电站出力、火电机组出力和电加热功率;确定在某一状态下采取某一动作后,光热-光伏联合电站从一个状态转移到另一个状态的概率分布;并确定在状态下采取某一动作后,智能体获得的奖励,以及表示对未来奖励的重视程度的折扣因子; 步骤3:采用融合优先经验回放与长短期记忆网络的改进TD3算法训练智能体,综合考虑光伏、光热发电运行维护成本、火电机组发电成本、一次调频备用成本、旋转备用成本、弃光成本以及切负荷成本,并以系统总成本最低为目标确定目标函数,设立约束条件,建立系统调度优化成本模型; 改进TD3算法训练智能体过程中,提出融合长短期记忆网络与优先经验回放的改进TD3算法,将LSTM网络作为核心时序处理器,取代原始TD3中对瞬时状态的直接处理;LSTM接收由多个连续时段状态组成的原始状态序列作为输入;通过其内部的遗忘门、输入门和输出门机制,显式编码历史状态轨迹中的长期动态依赖关系,并输出一个富含时序信息的隐含状态向量; ; 其中,、和分别表示遗忘门的输出、权重矩阵和偏置项;表示上一时段t-1的隐藏状态;表示当前时段t的状态;表示Sigmoid激活函数;、和分别表示输入门的输出、权重矩阵和偏置项;为当前时段t的细胞状态候选值;和分别表示候选细胞状态权重矩阵和偏置项;表示当前时段t的细胞状态,表示上一个时段t-1的细胞状态;、和分别表示输出门的输出、权重矩阵和偏置项;表示当前时段t的隐藏状态; 采用孪生延迟深度确定性策略算法,引入孪生Critic网络结构,构建两个独立的Critic网络,通过取二者输出的最小值更新策略; ; ; 其中,为第n个Critic网络的损失函数;为Critic网络的参数;N为经验池中的样本总数;为折扣因子;和分别为当前时段t和下一个时段t+1的状态;为当前时段t第n个Critic网络对状态和动作的Q值估计;为目标Q值;为用于计算下一个时段t+1目标值的平滑目标动作;为下一个时段t+1第n个Critic网络对状态和平滑目标动作的Q值估计; 实施延迟策略更新机制;策略网络在Q网络更新后按设定的时间间隔更新,从而缓解由于过于频繁的更新而导致的参与者网络中的策略波动; ; 其中,为Actor网络的参数;为Critic网络的学习率;为软更新系数;、分别为目标Critic网络、目标Actor网络的参数; 使用目标策略平滑正则化,以增强策略的稳定性并平滑Q函数,为抑制目标值估计方差,在目标Actor网络输出中注入噪声;即在计算贝尔曼残差时,在下一状态所采取的动作将被选取为: ; 其中,表示Target策略网络;为添加的噪音;为截断函数;为高斯分布;为噪声裁剪上界。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。