AI
AI
Expander: Google基于图的机器学习平台

概况 最近(2016年10月),机器学习取得了重大进展,使计算机系统能够解决复杂的现实问题。 这些进步之一是Google的研究部门构建的大型基于图的机器学习平台Expender。许多Google产品和功能的技术背后,都在使用Expender。如Inbox中的提醒,Allo中的智能消息回复,与深层神经网络结合为Google Photos中的最新图像识别系统提供动力。 半监督学习 监督学习 近来在深度学习和机器学习方面的成功大部分归功于在大量(通常是数百万个)

2017全球十大突破性技术

MIT技术评论给出了2017全球十大突破性技术:治愈瘫痪、自动驾驶货车、刷脸支付、实用型量子计算机、360°全景相机、太阳能热光伏电池、基因疗法2.0、细胞图谱、僵尸物联网、强化学习。

DQN知识索引和读书笔记

吃快餐,看了不少知乎网友的帖子,这里整理小结了DQN相关的知识,并附上链接。DL+RL=AI不是虚言。RL的未来应该还可以更灿烂。

大话增强学习-3

本文结合蒙特卡洛法和Q-learning法,很快地给出了TD算法,即估计出一个value来。本文也许是最简单粗暴地介绍TD算法的文章。最后本文还介绍了一些想法来处理即没有R(s,a)又不能使用蒙特卡洛法的情况。

大话增强学习-2

以演员演戏导演打分的比喻来解释蒙特卡洛法在增强学习(强化学习,reinforcement learning)上的运用。简单直观,非常易懂。这也许是网络上最好懂的介绍蒙特卡洛增强学习法的文章了。