2016-02-27

机器学习(1)-概念

最近想系统看一下机器学习，在这里记录一下。
最近一则新闻很吸引眼球：Nature重磅封面：谷歌人工智能击败欧洲围棋冠军，3月将与李世乭对弈，新闻中提高的AlphaGo就是通过机器学习而来的。机器学习其实并不神秘。

机器学习
机器学习（Machine Learning)，就是让机器有学习的能力。正式一点的定义为：对于某类任务T和性能度量P，如果一个程序能在T（任务）上以P（性能标准）衡量，随着经验E而自我完善，那么称这个程序在从经验E学习。

对于上面的新闻，任务T就是下棋赢棋，性能度量P就是提到的“价值网络”和“策略网络”，经验E就是训练程序用到的数据。

新闻中还提高了“监督学习”，实际上机器学习分为监督学习无监督学习。

监督学习

监督学习（Supervised Learning），就是指对于给的经验（数据），有了一个“标签”。在Stanford的公开课中，以房子价格和其面积大小为例。
房子价格和面积关系
在上图中，横轴表示房子面积，纵轴表示其价格。这个经验E是有标签的，即价格和面积的对于关系。通过学习这些经验，可以得出房子价格和其面积的关系。
通过房子面积预测房子价格的问题，是个回归问题（Regression）。