最近想系统看一下机器学习,在这里记录一下。
最近一则新闻很吸引眼球:Nature重磅封面:谷歌人工智能击败欧洲围棋冠军,3月将与李世乭对弈,新闻中提高的AlphaGo就是通过机器学习而来的。机器学习其实并不神秘。
-
机器学习
机器学习(Machine Learning),就是让机器有学习的能力。正式一点的定义为:对于某类任务T和性能度量P,如果一个程序能在T(任务)上以P(性能标准)衡量,随着经验E而自我完善,那么称这个程序在从经验E学习。
对于上面的新闻,任务T就是下棋赢棋,性能度量P就是提到的“价值网络”和“策略网络”,经验E就是训练程序用到的数据。
新闻中还提高了“监督学习”,实际上机器学习分为监督学习无监督学习。
监督学习
监督学习(Supervised Learning),就是指对于给的经验(数据),有了一个“标签”。在Stanford的公开课中,以房子价格和其面积大小为例。
在上图中,横轴表示房子面积,纵轴表示其价格。这个经验E是有标签的,即价格和面积的对于关系。通过学习这些经验,可以得出房子价格和其面积的关系。
通过房子面积预测房子价格的问题,是个回归问题(Regression)。
回归问题是指预测连续值得问题。
还有个监督学习的例子,通过肿瘤大小来判断肿瘤是良性还是恶性。
上图中,红色代表恶性,用“1”表示,黑色代表良性,用“0”表示。这些数据是有标签的。
肿瘤大小和其良性恶性问题是一个分类问题。
分类问题是指预测离散值的问题。
无监督学习
无监督学习(Unsupervised Learning),是指给的数据没有“标签”,或者有相同的“标签”。一个典型的无监督学习的算法是聚类算法。在MATLAB中,有kmeans聚类算法。
无监督学习有着广泛的应用。例如谷歌新闻是通过聚类来分类的,DNA数据和天文数据,也可以用聚类来处理。聚类算法只是无监督学习的一种。