mxxhcm's blog

  • 首页

  • 标签

  • 分类

  • 归档

reinforcement learning why use baseline ?

发表于 2019-10-04 | 评论数:
reinforcement learning importance sampling
gradient method deep deterministic policy gradient
马晓鑫爱马荟荟

马晓鑫爱马荟荟

记录硕士三年自己的积累

337 日志
26 分类
77 标签
RSS
GitHub E-Mail
© 2022 马晓鑫爱马荟荟
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Pisces v6.6.0