线性代数的本质 - 11抽象向量空间

  • 行列式和特征向量与所选坐标系无关,行列式告诉的是一个变换对面积的缩放比例,特征向量则是在变换中留在它所张成的空间中的向量,这二者都是暗含于空间中的性质,自由选取坐标系不会改变它们最根本的值
  • 既不是一个箭头也不是一组数字,但是同样具有向量特性的东西:函数

    函数的线性变换有一个完全合理的解释:这个变换接收一个函数并把它变成另一个函数,从微积分中可以找到一个常见的例子——导数。“算子”和“变换”的意思是一样的
    一个函数变换是线性的:03 矩阵与线性变换抽象性带来一般性的结论,不仅适用于箭头也适用于函数,满足以下两条性质的变换是线性的:“可加性”和“成比例”

    eg:求导是线性运算

  • 多项式空间上,整个空间包含任意高次的多项式,首先我们要给这个空间赋予坐标的含义,需要选取一个基

    由于多项式的次数可以任意高,所以这个基函数集也是无穷大的

    这些类似向量的事物,比如箭头、一组数、函数等,它们构成的集合被称为“向量空间”

    只要定义满足公理,就能顺利的应用结论

机器学习 - 01概述

工作流程

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

  • 获取数据
  • 数据基本处理
  • 特征工程
  • 机器学习(模型训练)
  • 模型评估
  • 结果达到要求,上线服务
  • 没有达到要求,重新上面步骤

算法分类

  1. 监督学习:输入数据由特征值和目标值组成,输出可以是连续的值(回归),或者是有限个离散值(分类)。
  2. 无监督学习:输入数据由特征值组成,没有目标值。输入数据没有被标记,也没有确定的结果。样本数据类别未知; 需要根据样本间的相似性对样本集进行类别划分。
  3. 半监督学习:训练集同时包含标记样本数据和未标记样本数据
  4. 强化学习:实质是make decisions 问题,即自动进行决策,并且可以做连续决策。主要包含五个元素:agent, action, reward, environment, observation;强化学习的目标就是获得最多的累计奖励。

模型评估

  1. 分类模型评估
    • 准确率
    • 精确率
    • 召回率
    • F1-score
    • AUC指标
  2. 回归模型评估
    • 均方根误差(Root Mean Squared Error,RMSE)
    • 相对平方根误差(Relative Squared Error,RSE)
    • 平均决定误差(Mean Absolute Error,MAE)
    • 相对绝对误差(Relative Absolute Error,RAE)
  3. 拟合
    • 欠拟合(under-fitting):模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。
    • 过拟合(over-fitting):所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。
test_my_site

test_my_site