CN201610423029X
2016-06-14
发明专利
基于大数据方式的强化学习仿人机器人步态规划方法
华南理工大学
已授权
本发明公开了一种基于大数据方式的强化学习仿人机器人步态规划方法,首先,通过装配在仿人机器人上的传感器获取状态信息;然后使用Q学习算法计算动作,对离线步态进行修正,同时获得立即回报值;接着将以上信息以四元组的形式,使用大数据存储方法保存到文件中;最后随机抽取四元组结合RBF神经网络更新Q函数。本发明方法能够对仿人机器人在不平整环境情况下的步行运动进行平稳调控,相较于仅利用离线步态指导机器人行走的方法,拥有更高的效率和优势,实验证明了该方法的可行性和有效性。