E4-Unit_2-Introduction_to_Q_Learning-O14-Additional_Readings

中英文对照学习,效果更佳!
原课程链接:https://huggingface.co/deep-rl-course/unit4/additional-readings?fw=pt

Additional Readings

附加读数

These are optional readings if you want to go deeper.

如果你想更深入,这些都是可选的读物。

Monte Carlo and TD Learning

蒙特卡罗与TD学习

To dive deeper on Monte Carlo and Temporal Difference Learning:

为了更深入地研究蒙特卡罗和时差学习:

Q-Learning

为什么时差(TD)方法的方差比蒙特卡罗方法低?什么时候蒙特卡罗方法比时差方法更受欢迎?Q-学习