AI
AI
2017全球十大突破性技术

MIT技术评论给出了2017全球十大突破性技术:治愈瘫痪、自动驾驶货车、刷脸支付、实用型量子计算机、360°全景相机、太阳能热光伏电池、基因疗法2.0、细胞图谱、僵尸物联网、强化学习。

DQN知识索引和读书笔记

吃快餐,看了不少知乎网友的帖子,这里整理小结了DQN相关的知识,并附上链接。DL+RL=AI不是虚言。RL的未来应该还可以更灿烂。

大话增强学习-3

本文结合蒙特卡洛法和Q-learning法,很快地给出了TD算法,即估计出一个value来。本文也许是最简单粗暴地介绍TD算法的文章。最后本文还介绍了一些想法来处理即没有R(s,a)又不能使用蒙特卡洛法的情况。

大话增强学习-2

以演员演戏导演打分的比喻来解释蒙特卡洛法在增强学习(强化学习,reinforcement learning)上的运用。简单直观,非常易懂。这也许是网络上最好懂的介绍蒙特卡洛增强学习法的文章了。

大话增强学习

以大白话的方式,一步步引导出马尔科夫过程,马尔科夫决策过程,和最简单有效的增强学习算法:Q-learning算法。