Post Detail

Expander: Google基于图的机器学习平台

Hugiss  

概况

最近(2016年10月),机器学习取得了重大进展,使计算机系统能够解决复杂的现实问题。 这些进步之一是Google的研究部门构建的大型基于图的机器学习平台Expender。许多Google产品和功能的技术背后,都在使用Expender。如Inbox中的提醒,Allo中的智能消息回复,与深层神经网络结合为Google Photos中的最新图像识别系统提供动力。

半监督学习

监督学习
近来在深度学习和机器学习方面的成功大部分归功于在大量(通常是数百万个)标签数据上进行培训时表现出高预测能力的模型。

无监督学习 相反,一些机器学习方法直接对原始数据进行操作,无需任何监督,这种被称为无监督学习。

困难 然而,任务越困难,获得足够高质量的标签数据就越困难。收集每个新问题的标签数据往往是非常劳动密集和耗时的。这促成了Expander。

半监督学习 Expander技术从人类学习如何推广和弥合已经知道的内容(标记信息)与不熟悉的观察(未标记信息)之间的差距而得到灵感,被称为“半监督”学习。这种强大的技术使我们能够构建可以在训练数据可能稀少的情况下工作的系统。基于图的半监督机器学习方法的主要优点是

  • 在学习期间共同模拟标记和未标记的数据,利用数据中的基础结构
  • 可以轻松地组合多种类型的信号转换为单个图形表示,并了解它们。这与其他机器学习方法(例如神经网络方法)形成对比。

如何工作

Label propagation是核心。下面是GIF动画,耐心观看。


看上去很简单,难度在于如何规模化,2015年的论文有介绍。

Show Disqus Comments