Reward driven controller parameter optimization.

类型