中山大学李雄获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种基于分层多专家强化学习的无人装备路径规划方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121498708B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610031098.X,技术领域涉及:G01C21/20;该发明授权一种基于分层多专家强化学习的无人装备路径规划方法和系统是由李雄;王嘉琦;倪晓升设计研发完成,并于2026-01-12向国家知识产权局提交的专利申请。
本一种基于分层多专家强化学习的无人装备路径规划方法和系统在说明书摘要公布了:本发明公开了一种基于分层多专家强化学习的无人装备路径规划方法和系统,涉及路径规划技术领域,包括:构建基于上层深度强化学习器与下层速度模糊逻辑控制器的待训练路径规划模型;对无人装备的训练环境感知数据组进行数据预处理和特征提取确定训练环境感知特征;采用训练环境感知数据组确定训练模糊输入变量;基于训练环境感知特征、训练无人装备当前线角速度和训练模糊输入变量对待训练路径规划模型进行训练,确定训练好的路径规划模型;对接收到的无人装备的待处理环境感知数据组,基于数据预处理、特征提取、模糊输入变量确定以及训练好的路径规划模型进行路径规划。借助于模糊逻辑控制器提供的专家先验知识,助力提升模型训练效率。
本发明授权一种基于分层多专家强化学习的无人装备路径规划方法和系统在权利要求书中公布了:1.一种基于分层多专家强化学习的无人装备路径规划方法,其特征在于,包括: 构建基于上层深度强化学习器与下层速度模糊逻辑控制器的待训练路径规划模型; 对无人装备的训练环境感知数据组,进行数据预处理并进行特征提取,确定训练环境感知特征; 采用所述训练环境感知数据组确定下层速度模糊逻辑控制器的训练模糊输入变量; 基于所述训练环境感知特征、训练无人装备当前线角速度和所述训练模糊输入变量输入待训练路径规划模型,通过上下层决策融合输出所述无人装备的当前状态无人状态线角速度,并根据所述当前状态无人状态线角速度确定奖励函数值更新上层深度强化学习器,直至满足训练停止条件时确定训练好的路径规划模型;包括: 通过上层深度强化学习器的动作网络以所述训练环境感知特征、训练相对目标点角度距离、训练相对障碍物角度距离和训练无人装备当前线角速度为输入,输出下层速度模糊逻辑控制器对应的模糊动作权重; 通过下层速度模糊逻辑控制器分别基于训练相对目标点角度距离、训练相对障碍物角度距离和训练相较墙面角度,输出对应的模糊线角速度; 采用各所述模糊线角速度和各所述模糊动作权重进行加权融合,输出当前状态无人状态线角速度; 通过上层深度强化学习器的Q网络以所述训练环境感知特征和所述当前状态无人状态线角速度为输入,输出动作价值函数; 通过上层深度强化学习器的V网络以所述训练环境感知特征为输入,输出状态价值函数; 基于所述当前状态无人状态线角速度确定奖励函数值,并结合所述动作价值函数和所述状态价值函数更新Q网络、V网络和动作网络,直至满足训练停止条件,确定训练好的上层深度强化学习器,输出训练好的路径规划模型; 对接收到的无人装备的待处理环境感知数据组,基于数据预处理、特征提取、模糊输入变量确定以及训练好的路径规划模型进行路径规划; 其中,下层速度模糊逻辑控制器包括自适应脱困导航模糊逻辑控制器、避障模糊逻辑控制器和贴壁运动模糊逻辑控制器; 所述自适应脱困导航模糊逻辑控制器以无人装备相对于路径目标点的相对目标点角度距离为输入,以脱困模糊线角速度为输出; 所述避障模糊逻辑控制器以无人装备相对于最近障碍物的相对障碍物角度距离为输入,以避障模糊线角速度为输出; 所述贴壁运动模糊逻辑控制器以无人装备偏航角相对于墙壁平行方向的相较墙面角度为输入,以贴壁模糊线角速度为输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励