国网山西省电力公司经济技术研究院;华北电力大学刘红丽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网山西省电力公司经济技术研究院;华北电力大学申请的专利一种基于强化学习的灵活性资源调度决策适应性调整方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120258425B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510343355.9,技术领域涉及:G06Q10/0631;该发明授权一种基于强化学习的灵活性资源调度决策适应性调整方法是由刘红丽;梁燕;武昭原;周明;许敏茹;王宇扬;魏兰懿设计研发完成,并于2025-03-21向国家知识产权局提交的专利申请。
本一种基于强化学习的灵活性资源调度决策适应性调整方法在说明书摘要公布了:本发明涉及一种基于强化学习的灵活性资源调度决策适应性调整方法,属综合能源领域,解决资源调度灵活性低的问题。包括基于电力系统的净负荷波动水平和碳排放总量,以及用户分布式可再生能源和储能配置构建资源调度的负荷波动调整双层模型,包括负荷波动调整优化模型和用户分布式资源配置优化模型;获取电力系统一定历史周期内典型日的净负荷数据,基于动态峰谷时段确定方法对每个典型日的净负荷功率曲线划分峰谷时段,得到对应的平时段、低谷时段和高峰时段;基于平时段、低谷时段和高峰时段,利用深度强化学习方法对负荷波动调整双层模型迭代求解,获得负荷波动水平优化后预测的发电机组出力结果和各用户的分布式可再生能源配置和储能配置容量。
本发明授权一种基于强化学习的灵活性资源调度决策适应性调整方法在权利要求书中公布了:1.一种基于强化学习的灵活性资源调度决策适应性调整方法,其特征在于,包括如下步骤: 基于电力系统的净负荷波动水平和碳排放总量,以及用户分布式可再生能源和储能配置构建资源调度的负荷波动调整双层模型,包括负荷波动调整优化模型和用户分布式资源配置优化模型; 所述负荷波动调整优化模型包括:以最小化系统净负荷波动水平和系统碳排放总量为目标的目标函数,以及约束条件集合; 所述负荷波动调整优化模型的目标函数,如下: 其中,分别为电力系统的系统碳排放总量和系统净负荷波动水平,分别为归一化后的系统碳排放总量和系统净负荷波动水平,为典型日,为典型日出现的概率,为典型日集合,为时段集合,为火电机组集合,为火电机组g的碳排放强度,为火电机组的功率输出,为一个时段的时间间隔,为系统净负荷平均值; 所述负荷波动调整优化模型的约束条件集合包括:峰谷系数边界限额约束,系统功率平衡功率约束和峰谷系数的最低限值约束; 所述峰谷系数边界限额约束,如下: 其中,为t时段的峰谷系数,为低谷时段集合,为平时段集合,为高峰时段集合,为低谷时段系数,为低谷和平时段的系数差,为平时段和高峰时段的系数差; 所述系统功率平衡功率约束,如下: 其中,为用户在典型日下的用电量,为用户的上网电量,为火电机组的功率输出,为系统中受峰谷系数影响的用户集合,为系统中不受峰谷系数影响的用户集合;为不受峰谷系数影响的火电机组的功率输出; 所述峰谷系数的最低限值约束,如下: 其中,为向用户回收多余电能量的回收系数,为用户的初始负荷需求,为火电机组g的单位电能量发电成本,为电力系统单位电能量输电成本; 所述用户分布式资源配置优化模型包括:以最小化分布式可再生能源配置容量和储能配置容量为目标的目标函数和约束条件集合; 所述用户分布式资源配置优化模型的目标函数,如下: 其中,为分布式可再生能源配置单位容量的年化成本,表示用户的可再生能源配置容量,为储能单位容量的年化成本,表示用户的储能配置容量; 所述用户分布式资源配置优化模型的约束条件集合包括:电量平衡约束,分布式可再生能源配置运行约束,储能配置和运行约束; 所述电量平衡约束,如下: 其中,是用户配置分布式可再生能源的实际发电量,和分别为储能充、放电功率; 所述分布式可再生能源配置和运行约束,如下: 其中,和是分布式可再生能源的发电效率和容量因子,为分布式可再生能源配置容量最大值; 所述储能配置和运行约束,如下: 其中,和分别为储能的充电和放电功率的上限,、分别为用户在典型日s的t、t-1时刻的当前储能容量,为用户的储能的充放电效率,和分别为t-1时刻的储能充放电功率,为储能配置容量最大值; 获取电力系统一定历史周期内典型日的净负荷数据,基于动态峰谷时段确定方法对每个典型日的净负荷功率曲线划分峰谷时段,得到对应的平时段、低谷时段和高峰时段; 基于所述平时段、低谷时段和高峰时段,利用深度强化学习方法对资源调度的负荷波动调整双层模型迭代求解,将电力系统的净负荷波动水平、峰谷系数、发电机组出力、分布式可再生能源配置和储能配置定义为马尔科夫决策过程的状态空间的状态变量,利用深度确定性策略梯度强化学习的actor-critic网络对马尔科夫智能体进行优化;当critic网络的损失函数收敛时获得负荷波动水平优化后预测的发电机组出力结果和各用户的分布式可再生能源配置容量和储能配置容量; 所述基于所述平时段、低谷时段和高峰时段,利用DRL学习方法对负荷波动调整优化模型和用户分布式资源配置优化模型迭代求解,包括: 将所述平时段、低谷时段和高峰时段输入所述负荷波动调整优化模型得到峰谷系数; 基于所述峰谷系数,所述用户分布式资源配置优化模型得到对应的分布式可再生能源配置和储能配置; 基于当前的净负荷波动水平、峰谷系数、发电机组出力、分布式可再生能源配置和储能配置,进行马尔科夫决策过程建模,包括: 马尔科夫的状态空间的状态变量包括当前的净负荷波动水平、峰谷系数、发电机组出力、分布式可再生能源配置和储能配置; 在每个时间步内,马尔科夫智能体观测到的状态变量,如下: 其中,表示第步的峰谷系数;表示第步的净负荷; 智能体的动作,设定如下: 在电力系统运行过程中,所述负荷波动调整优化模型的目标函数值越小,所述马尔科夫智能体的奖励越高;所述用户分布式资源配置优化模型的目标函数值越小,所述马尔科夫智能体的奖励越低; 利用深度确定性策略梯度强化学习算法优化所述马尔科夫智能体,采用actor-critic结构; critic网络基于所述状态变量的48维向量和所述动作,输出是当前状态-动作对的Q值估计对动作进行打分;actor网络基于critic网络输出的Q值估计进行优化参数,直至critic网络的损失函数收敛停止迭代求解。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网山西省电力公司经济技术研究院;华北电力大学,其通讯地址为:030024 山西省太原市万柏林区谐园路9号化建大厦17A层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励