近期公司在AWS赞助下,举办了DeepRacer无人车的比赛,模型训练期间,总结了一些经验如下:

  • 如奖励函数编写分值不佳造成曲线上升下降幅度过大不利于收敛,最终训练的模型不会好到哪里去
  • 克隆模型的训练的效果普遍不如重新训练
  • 相同奖励函数下,过长和过短的时间训练都不能起到更多[……]

Read more