1.1 引言
机器学习:是一门致力于研究如何通过计算的手段,利用经验来玫善系统自身的性能的学科。叽里咕噜说啥呢
引自菜鸟教程:机器学习(Machine Learning)是人工智能(AI)的一个分支,它使计算机系统能够利用数据和算法自动学习和改进其性能。
1.2 基本术语
数据集:数据的集合。
样本:数据集中的一个对象。
特征:反应样本某方面的表现或性质的事项。
通过从数据中学得模型的过程称为学习或训练,训练样本组成的集合称为训练集。
分类与回归:连续与离散的差别,分类任务对应连续值学习任务,而回归任务对应离散值学习任务。
聚类:将训练集样本分为若干簇,分析样本之间的潜在联系。
监督学习和无监督学习:根据训练数据是否有标记数据划分,监督学习为有标记数据,而无监督学习为无标记数据。
泛化能力:模型适用于新样本的能力。
1.3 假设空间
这个不重要。
1.4 归纳偏好
归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好,比如模型更侧重于某些指标等。
奥卡姆剃刀定理:若有多个假设与观察一致,则选最简单的那个。哪个简单选哪个
没有免费的午餐定理:所有学习算法的期望性能差不多,前提是所有问题出现的机会相同,或者是所有问题同等重要,意味着需要根据不同问题设计不同的模型来解决问题。
1.5 发展历史
这个也不重要。
1.6 应用现状
这个不算不重要,在整理中不重要。