Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 清华四川能源互联网研究院李业辉获国家专利权

清华四川能源互联网研究院李业辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉清华四川能源互联网研究院申请的专利一种基于稀疏联邦强化学习的能源管理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121578652B

龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610091621.8,技术领域涉及:G05B13/04;该发明授权一种基于稀疏联邦强化学习的能源管理方法及系统是由李业辉;王毅;秦大林;李姚旺设计研发完成,并于2026-01-23向国家知识产权局提交的专利申请。

一种基于稀疏联邦强化学习的能源管理方法及系统在说明书摘要公布了:本发明属于家庭能源管理领域,涉及一种基于稀疏联邦强化学习的能源管理方法及系统,包括:在每个时间步收集本地能耗信息,并接收来自电力公司的实时电价信息;构建初始能量管理模型,并对初始能量管理模型进行训练,得到最终的能量管理模型;基于能耗信息和实时电价信息,通过能量管理模型执行智能能量管理算法,得到能量管理策略;通过能量管理策略,生成对已安装家用设备的控制指令,并通过控制指令对已安装家用设备进行管理;根本性地解决了边缘设备内存瓶颈问题,实现了复杂算法的本地化部署,并显著降低了联邦学习的通信开销,提升了系统训练效率和稳定性。

本发明授权一种基于稀疏联邦强化学习的能源管理方法及系统在权利要求书中公布了:1.一种基于稀疏联邦强化学习的能源管理方法,其特征在于,包括: 在每个时间步收集本地能耗信息,并接收来自电力公司的实时电价信息; 构建初始能量管理模型,并对初始能量管理模型进行训练,得到最终的能量管理模型,包括: 将能量管理问题转化为马尔可夫决策过程;马尔可夫决策过程包括状态空间、动作空间、状态转移概率函数和奖励函数; 通过稀疏网络构建初始能量管理模型;初始能量管理模型包括初始执行器网络和初始评判器网络,包括: 通过分配层间的稀疏连接构建初始稀疏网络的稀疏拓扑结构,得到初始化后的稀疏网络;稀疏拓扑结构包括稀疏网络的整体稀疏度、网络总层数和层间稀疏连接; 通过SARSA经验样本对稀疏网络进行动态演化,得到最终的稀疏网络,包括: 通过SARSA经验样本对初始化后的稀疏网络进行训练,以固定更新间隔对稀疏网络进行动态演化,得到更新后的稀疏网络; 基于更新后的稀疏网络中现存层间稀疏连接的权重,对层间稀疏连接进行自适应丢弃,得到移除集合; 基于更新后的稀疏网络中的非现存层间稀疏连接的梯度,对层间稀疏连接进行梯度生长,得到生长集合;移除集合和生长集合中的层间稀疏连接的数量相等; 基于移除集合和生长集合对稀疏网络的稀疏拓扑结构进行更新,得到新的稀疏网络,并对新的稀疏网络进行迭代训练,直到稀疏网络收敛,并将收敛后的稀疏网络作为最终的稀疏网络 将初始执行器网络和初始评判器网络的全连接层替换为最终的稀疏网络,得到初始能量管理模型; 将当前观测状态输入执行器网络,输出最优连续动作; 将当前观测状态和最优连续动作拼接后输入评判器网络,得到初始离散动作,并通过贪婪策略对初始离散动作进行选择,得到最优离散动作; 基于最优连续动作和最优离散动作构建最优混合动作,并基于最优混合动作,通过混合DQN算法对能量管理模型进行迭代训练,直到能量管理模型收敛,得到最终的能量管理模型,包括: 执行最优混合动作,在执行动作后返回即时奖励并过渡到新的观测状态,并构建SARSA经验样本; 基于SARSA经验样本,通过能量管理模型生成多步目标,以最优混合动作的值估计与多步目标间的期望均方误差构建评判器网络的损失函数,采用梯度下降法最小化贝尔曼误差,完成评判器网络更新; 基于SARSA经验样本和更新后的评判器网络,通过确定性策略梯度,对最优混合动作的期望值应用链式法则构建执行器网络的损失函数,结合双时间尺度更新规则,执行单步更新,完成执行器网络更新; 采用平滑软更新方式更新能量管理模型的参数;能量管理模型包括执行器网络和评判器网络; 对能量管理模型进行迭代训练,更新能量管理模型的网络参数,直到能量管理模型收敛,得到最终的能量管理模型; 基于能耗信息和实时电价信息,通过能量管理模型执行智能能量管理算法,得到能量管理策略; 通过能量管理策略,生成对已安装家用设备的控制指令,并通过控制指令对已安装家用设备进行管理。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华四川能源互联网研究院,其通讯地址为:610213 四川省成都市天府新区湖畔路北段366号天府新经济产业园A区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。