机器学习(1)-概念

最近想系统看一下机器学习,在这里记录一下。
最近一则新闻很吸引眼球:Nature重磅封面:谷歌人工智能击败欧洲围棋冠军,3月将与李世乭对弈,新闻中提高的AlphaGo就是通过机器学习而来的。机器学习其实并不神秘。

  • 机器学习

    机器学习(Machine Learning),就是让机器有学习的能力。正式一点的定义为:对于某类任务T和性能度量P,如果一个程序能在T(任务)上以P(性能标准)衡量,随着经验E而自我完善,那么称这个程序在从经验E学习。

对于上面的新闻,任务T就是下棋赢棋,性能度量P就是提到的“价值网络”和“策略网络”,经验E就是训练程序用到的数据。

新闻中还提高了“监督学习”,实际上机器学习分为监督学习无监督学习。

监督学习

监督学习(Supervised Learning),就是指对于给的经验(数据),有了一个“标签”。在Stanford的公开课中,以房子价格和其面积大小为例。
房子价格和面积关系
在上图中,横轴表示房子面积,纵轴表示其价格。这个经验E是有标签的,即价格和面积的对于关系。通过学习这些经验,可以得出房子价格和其面积的关系。
通过房子面积预测房子价格的问题,是个回归问题(Regression)

回归问题是指预测连续值得问题。

还有个监督学习的例子,通过肿瘤大小来判断肿瘤是良性还是恶性。
肿瘤大小和良性恶性关系
上图中,红色代表恶性,用“1”表示,黑色代表良性,用“0”表示。这些数据是有标签的。
肿瘤大小和其良性恶性问题是一个分类问题
分类问题是指预测离散值的问题。

无监督学习

无监督学习(Unsupervised Learning),是指给的数据没有“标签”,或者有相同的“标签”。一个典型的无监督学习的算法是聚类算法。在MATLAB中,有kmeans聚类算法

无监督学习有着广泛的应用。例如谷歌新闻是通过聚类来分类的,DNA数据和天文数据,也可以用聚类来处理。聚类算法只是无监督学习的一种。

参考:Deep Learning, Samy Bengio, Tom Dean and Andrew Ng

文章目录
  1. 1. 机器学习
  2. 2. 监督学习
  3. 3. 无监督学习
,
#add by kangyabing