然后游戏规定:吃到豆子得10分,移动位置分数不变,执行吃豆的动作,但是格子里没有豆子,减1分,撞墙了减5分。限制吃豆人总共能做200次动作。理论上最高得分就是在不扣分的情况下把豆子全部吃掉,有50个豆子,最高得分就是500分。
吃豆人能观察到的,是前后左右和自己所在格子的状态。所以一共是5个格,每个格子有三种状态,总的状态数就是3的5次方,就是243种状态,然后再除去一些地图中不存在的状态;如三面是墙,左右是墙,最后共剩下128种状态。
那么在这个游戏中,我们怎样才能获得最高分呢?
如果采取最传统的方法,就是每种状态都试试,用穷举法列出所有可能性,然后再进行对比,找出得分最高的一组策略模式。
但是,如果要采取这种传统方法,那么总共要涉及到7128种策略组合,如果把每个生成的�
更多内容加载中...请稍候...
本站只支持手机浏览器访问,若您看到此段落,代表章节内容加载失败,请关闭浏览器的阅读模式、畅读模式、小说模式,以及关闭广告屏蔽功能,或复制网址到其他浏览器阅读!
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!