假设空间

2025-02-23 xinfan9 33 字约 1 分钟

主要内容

本节主要介绍几个概念。

归纳：从特殊到一般的“泛化”。
演绎：从一般到特殊的“特化”。

从样例中学习是一个归纳过程，也称为归纳学习。

假设有一个数据集，通过三个属性（色泽、根蒂、敲声）来判断是否好瓜：

则可以得到以下两个概念：

假设空间：所有的属性组合规律的集合。
引用自：https://www.cnblogs.com/HongjianChen/p/8383816.html

假设空间由3部分组成：
- ① 属性（特征）色泽，根蒂，敲声的取值分别有2,3,3种选择；
- ② 色泽，根蒂，敲声也许无论取什么值都合适，我们分别用通配符“ * ”来表示，于是取值分别有1,1,1种选择；例如：“ 好瓜<—>（色泽= *）^（根蒂=蜷缩）^（敲声=浊响）”，即“好瓜是根蒂蜷缩、敲声浊响的瓜，什么色泽都行”
- ③ 还有一种极端情况，有可能“ 好瓜 ”这个概念根本就不成立，世界上压根就没有“好瓜”这种东西，我们用Ø表示这个假设。
所以，表1.1中，色泽有2中取值，根蒂有3中取值，敲声有3中取值，再加上各自的“通配项”，以及极端情况“好瓜概念根本不成立”的Ø，故假设空间规模大小为：(2+1) * (3+1) * (3+1)+ 1 = 49。
版本空间

归纳学习的过程就是在假设空间中进行搜索，最终获得所有与训练集一致的假设。多个与训练集一致的假设的集合形成一个版本空间。