1.1 引言

机器学习：是一门致力于研究如何通过计算的手段，利用经验来玫善系统自身的性能的学科。~~叽里咕噜说啥呢~~

引自菜鸟教程：机器学习（Machine Learning）是人工智能（AI）的一个分支，它使计算机系统能够利用数据和算法自动学习和改进其性能。

1.2 基本术语

数据集：数据的集合。

样本：数据集中的一个对象。

特征：反应样本某方面的表现或性质的事项。

通过从数据中学得模型的过程称为学习或训练，训练样本组成的集合称为训练集。

分类与回归：连续与离散的差别，分类任务对应连续值学习任务，而回归任务对应离散值学习任务。

聚类：将训练集样本分为若干簇，分析样本之间的潜在联系。

监督学习和无监督学习：根据训练数据是否有标记数据划分，监督学习为有标记数据，而无监督学习为无标记数据。

泛化能力：模型适用于新样本的能力。

这个不重要。

归纳偏好：机器学习算法在学习过程中对某种类型假设的偏好，比如模型更侧重于某些指标等。

奥卡姆剃刀定理：若有多个假设与观察一致，则选最简单的那个。~~哪个简单选哪个~~

没有免费的午餐定理：所有学习算法的期望性能差不多，前提是所有问题出现的机会相同，或者是所有问题同等重要，意味着需要根据不同问题设计不同的模型来解决问题。

这个也不重要。

这个不算不重要，在整理中不重要。