主要内容

本节主要介绍几个概念。

  • 归纳:从特殊到一般的“泛化”。
  • 演绎:从一般到特殊的“特化”。

从样例中学习是一个归纳过程,也称为归纳学习。

假设有一个数据集,通过三个属性(色泽、根蒂、敲声)来判断是否好瓜:

image-20241121105047102

则可以得到以下两个概念:

  • 假设空间:所有的属性组合规律的集合。

    引用自:https://www.cnblogs.com/HongjianChen/p/8383816.html

    假设空间由3部分组成:

    • ① 属性(特征)色泽,根蒂,敲声的取值分别有2,3,3种选择
    • ② 色泽,根蒂,敲声也许无论取什么值都合适,我们分别用通配符“ * ”来表示,于是取值分别有1,1,1种选择; 例如:“ 好瓜<—>(色泽= *)^(根蒂=蜷缩)^(敲声=浊响)”,即“好瓜是根蒂蜷缩、敲声浊响的瓜,什么色泽都行”
    • ③ 还有一种极端情况,有可能“ 好瓜 ”这个概念根本就不成立,世界上压根就没有“好瓜”这种东西,我们用Ø表示这个假设。

    所以,表1.1中,色泽有2中取值,根蒂有3中取值,敲声有3中取值,再加上各自的“通配项”,以及极端情况“好瓜概念根本不成立”的Ø,故假设空间规模大小为:(2+1) * (3+1) * (3+1)+ 1 = 49。

    image-20241121105313629

  • 版本空间

    image-20241121105403049

归纳学习的过程就是在假设空间中进行搜索,最终获得所有与训练集一致的假设。多个与训练集一致的假设的集合形成一个版本空间。