1.1 引言

机器学习:是一门致力于研究如何通过计算的手段,利用经验来玫善系统自身的性能的学科。叽里咕噜说啥呢

引自菜鸟教程:机器学习(Machine Learning)是人工智能(AI)的一个分支,它使计算机系统能够利用数据和算法自动学习和改进其性能。

1.2 基本术语

数据集:数据的集合。

样本:数据集中的一个对象。

特征:反应样本某方面的表现或性质的事项。

通过从数据中学得模型的过程称为学习训练,训练样本组成的集合称为训练集

分类与回归:连续与离散的差别,分类任务对应连续值学习任务,而回归任务对应离散值学习任务。

聚类:将训练集样本分为若干簇,分析样本之间的潜在联系。

监督学习和无监督学习:根据训练数据是否有标记数据划分,监督学习为有标记数据,而无监督学习为无标记数据。

泛化能力:模型适用于新样本的能力。

1.3 假设空间

这个不重要。

1.4 归纳偏好

归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好,比如模型更侧重于某些指标等。

奥卡姆剃刀定理:若有多个假设与观察一致,则选最简单的那个。哪个简单选哪个

没有免费的午餐定理:所有学习算法的期望性能差不多,前提是所有问题出现的机会相同,或者是所有问题同等重要,意味着需要根据不同问题设计不同的模型来解决问题

1.5 发展历史

这个也不重要。

1.6 应用现状

这个不算不重要,在整理中不重要。