近期公司在AWS赞助下,举办了DeepRacer无人车的比赛,模型训练期间,总结了一些经验如下:
- 如奖励函数编写分值不佳造成曲线上升下降幅度过大不利于收敛,最终训练的模型不会好到哪里去
- 克隆模型的训练的效果普遍不如重新训练
- 相同奖励函数下,过长和过短的时间训练都不能起到更多的帮助作用,反而有可能起反作用,一般推荐150分钟
- Discount factor 0.999比较利于收敛,过小则需要更长时间才能收敛出结果,过小时训练的模型效果不佳(可能需要更长训练时间)
- 实际比赛中,首次模型载入需要15秒左右,模型切换需要13-15秒生效
- 比赛赛道反射光对模型表现影响很大,尤其是大屏幕的光源会造成干扰
如您从本文得到了有价值的信息或帮助,请考虑扫描文末二维码捐赠和鼓励。
如本文对您有用,捐赠和留言 将是对我最好的支持~(捐赠可转为站内积分)
如愿意,请向朋友推荐本站,谢谢。
尊重他人劳动成果。转载请务必附上原文链接,我将感激不尽。