机器学习(ML)的目标是用一个训练实例集来建立系统,这个系统能够正确地泛化到新实例上,这些新的实例是在学习阶段没有见过的,但来自同一个问题。 ML 的学习即是为一个灵活的模型找到合适的参数值,这些参数要使得实例集上的误差度量自动最小化, 同时也需要避免复杂的模型,从而增加正确泛化的概率。 这个系统的输出值可以是一个类(分类问题),或者是一个数值(回归问题)。在某些情况下,为了增加可用性,可以输出某一类的概率。 只要我们有丰富的有代表性的数据,我们可以在不知道背景知识的情况下建立一个准确的分类器。相较于基于专业领域知识的手动构建的系统,这是一个了不起的改变。 ML是非常强...