什么是机器学习

本系列博客为 《白话深度学习与 TensorFlow》一书的阅读分享,意图在于,用文字输出的形式检验本人对书籍的理解程度,本人为第一次接触深度学习,如对知识点理解不透彻或有误解,还请您不吝赐教,给与评论,加以指正。

关于留言方式,您可以通过邮箱 yaoluhao@sina.com 联系到我;同时,我会在文章的最后附上简书的网址,以便于针对某一篇文章讨论,期待大家真挚反馈。

阅读内容

我是本周二拿到《白话深度学习与 TensorFlow》这本书,这个礼拜,我把前言和第一章认真的看完了,感觉这本书白话二字用的很好,书中列举的很多生活中的例子来类比一些比较难懂的概念,还列举了人工智能在生活中的一些好玩和使用的功能,让我们平缓的走入人工智能领域。

关于前言

我们要阅读的是一本专业知识很强的书籍,就不能像读小说是的一目十行,一扫而过,而是要逐字逐句的去读,读完以后要细细品味,还要总结归纳,只有这样重视这本书,我们才能从书中汲取有用的知识,提高自己的价值。

至于怎样重视一本书呢,当然是从前言开始阅读。每本书基本都有前言,前言虽然是写在书籍的最前边,但是很多作者都是最后才回去编写前言这一部分,这样的话,前言反而成为了本书的总结,我么在读前言的时候实际上是对本书的一个大致的了解,就像写书一样要先列提纲一样,这样在后边的阅读中思路会变得清晰,效果会更好。

前言以 AlphaGo 以悬殊的比分击败了韩国著名九段围棋棋手,以及谷歌的机械狗和谷歌的无人驾驶汽车等智能产品,讲述了人工智能(以下称为 AI)给人们充满了惊喜,而人工智能最为核心的又是深度学习,并表明了深度学习会成为未来几十年比较火爆的研究方向。然而深度学习本身的复杂度之高,使得很多爱好者都望而却步。因此,作者就意图写这样一本浅显易懂的书,一步一步的带领读者周瑾深度学习的领域,所以,这本书就应运而生。

什么是机器学习

机器学习是深度学习当中的一门学科。书中讲述机器学习就类似人类学习一样,让机器通过学习,掌握一些比较复杂或高要求的工作,来代替由人类做起来比较花时间的事情。

机器学习是历史的不断进化的产物,人类有别于动物的区别,在于人类会使用工具提高效率,随着计算机的计算能力越来越强,机器也在一定程度上参与了智能化的工作。

之所以机器能智能化,其本质的原因是有算法在支撑。书中举例一个例子:把邮件分类城普遍邮件和垃圾邮件。

机器是如何学会分类邮件呢?这几需要几个要素:

  1. 样本
  2. 模型
  3. 验证

其中:样本分为训练样本——提供机器学习,和验证样本——用于验证机器学习成果;模型我理解的就是算法。

这种训练的过程称为有监督学习。

既然有有监督学习,那一定有无监督学习了?当然要,后文提到了无监督学习是一种不需要人类干预,机器对样本进行识别,自己给样本分类,人类就等着收结果就好了,这是一种更高级的训练过程了。

聚类

聚类用具体事物来讲就是分类,是一种典型的 “无监督学习”,聚类的行为根源来源于人类。人类在认知事物的时候,一直都拥有容量性的问题,于是,人类开始对各种事物进行分类,这样有一个好处,就是我们可以将事物的特征以文字,或其他输出形式向所有人展示,当我们在看到类似的事物的时候,就可以辨别出这一事物是哪一类,这一类事物有哪些特征。

我们想要的就是让机器为我们人类把事物进行分类,把人类从这一过程当中解放出来。这其中提到了两个算法:

  1. K-Means
  2. DBSCAN

其基本思路用白话说就是是将事物抽象成数字,机器会对相近的数字归类。

回归

书中将回归是 ”有果索因“ 的过程,看完这一节以后我觉得这很像哲学中讲的,从现象到本质的过程。

在机器学习领域,最常用的回归有两种:

  1. 线性回归
  2. 非线性回归

不管是哪种回归,总结起来都是讲现实中的事物抽取成数字,从大量数据中抽取对应的函数,验证函数的准确性。

分类

这一节中提到了两个比较重要的概念:

  1. 召回率
  2. 精确率

其中,召回率是指在训练开始前的规定的数据中,判断出多少个正确答案,如:有 200 只猫,正确了 150 只,召回率为 150 / 200 = 75%,召回率可以理解为结果可用程度;精确率值得是指在训练结束后的数据中,判断出多少正确答案,如:结果判断出 200 只狗,其中只有 100 只是正确的,然而在训练样本中,只有 150 只狗的图片,那么,精确率为 100 / 200 = 50%。

综合应用

这一节展示了机器学习在生活中的应用场景,为的是让我们开拓视野,增加认知。

小结

用一个概念总结了这一张所讲述的内容 —— 机器学习就是人类定义一定的计算机算法,让计算机根据数据的样本和一些人类的干预来总结并归纳器特征与特点,并用这些特征和特点与一定的学习目标形成映射关系,进而自动化地做出相应反映的过程。

关键字

在文章的最后,列举一下这一节中出现的一些关键字,方便归纳本节内容:

  • AI (Artificial Intelligence,人工智能)
  • 训练样本
  • 训练
  • 分类模型
  • 验证
  • 有监督学习和无减速学习
  • 算法
  • 共性和孤立点
  • 线性回归和非线性回归
  • 伯努利分布
  • 召回率和精确率
  • 强化学习(reinforcement learning)
坚持原创技术分享,您的支持将鼓励我继续创作!