前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >线性代数01 线性的大脑

线性代数01 线性的大脑

作者头像
Vamei
发布2018-09-25 17:24:51
5330
发布2018-09-25 17:24:51
举报
文章被收录于专栏:Vamei实验室Vamei实验室

作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁任何形式转载。

线性代数是一门大学课程,但也是相当“惨烈”的一门课程。在大学期间,我对这门学科就没怎么学懂。先是挣扎于各种行列式、解方程,然后又看到奇怪的正交矩阵、酉矩阵。还没来得及消化,期末考试轰然到来,成绩自然凄凄惨惨。

后来读了更多的线性代数的内容,才发现,线性代数远不是一套奇奇怪怪的规定。它的内在逻辑很明确。只可惜大学时的教材,把最重要的一些核心概念,比如线性系统,放在了最后。总结这些惨痛的经历,再加上最近的心得,我准备写一些线性代数的相关文章。

这一系列线性代数文章有三个目的:

  1. 概念直观化
  2. 为“数据科学”系列文章做准备,没有线性代数基础,没法深入统计和机器学习。
  3. 线性代数运算的代码实现。这是经典的程序员挑战。参看一天能学会的计算机技术

线性代数是现代数学、自然科学的基础工具。在计算机领域,数据挖掘、机器学习、图形处理,数值运算这几块儿都与线性代数紧密相关。如果你对这些技术感兴趣,这些线性代数的文章可以作为你的参考读物。

这一篇,我将引入线型代数的核心:线性系统。让人惊奇的是,这一核心概念,早就根植在我们的思维中。 

生活中的线性:超市结算

我们想象一个只卖两个商品的超市,销售青菜、黄豆。青菜每捆5元,黄豆每盒3元。此外,这个超市还有个积分系统,每捆青菜积分2分,每包黄豆积4分。需要一个结算系统,为客户计算总价和积分。

这对程序员来说不算挑战。每个语言都可以轻松的实现,比如用Python:

代码语言:javascript
复制
# By Vamei

def bill(x1, x2):
    y1 = 5*x1 + 3*x2
    y2 = 2*x1 + 4*x2
    return y1, y2

x1,x2分别为青菜和黄豆的数目。y1,y2为总价和积分。通过输入不同品种的购买数目,我们得到输出。这里的输出有两个元素:总价和积分。

上面的计算,还可以写成一组简单的数学方程:

$$y_1 = 5 \times x_1 + 3 \times x_2 $$

$$y_2 = 2 \times x_1 + 4 \times x_2 $$

我们试想这样一种情况:一对夫妻去超市买菜。丈夫买了1捆青菜,2盒黄豆,结账的时候,为11元和10个积分。妻子买了2捆绑青菜,3盒黄豆,结账的时候,为19元和16积分。

但如果妻子结账前碰到丈夫了,俩人把东西放在一起,总共3捆青菜,5盒黄豆。按照我们的结算系统,总价为[$5 \times 3 + 3 \times 5 = 30 $]元,总积分为[$2 \times 3 + 4 \times 5 = 26$]积分。

你可能会反驳我,为什么要那么麻烦呢?把刚才的两个单子加在一起不就可以了。[$11 + 19 = 30$]元,[$10 + 16 = 26$]积分。这通过结算系统的计算结果完全相同。

这想法没错。你已经在运用线性系统(Linear System)的思维了:

几个购物车里的东西,分开结账的几张小票的总和,和一次算总帐的结果相同。

线性系统还有更复杂的情况。把两个购物车给销售员,让销售员按相同的配比,丈夫的来3车,妻子的来2车。那么,新的总价,应该是丈夫的小票乘3,加上妻子的小票乘2。

线性的思维方式是如此的普遍,以致于我们要多想一下,才能想出非线性的例子。下面是一个非线性的情况:超市更改积分系统,积分超过20的话,将获得双倍积分。这个时候,如果分开结账,丈夫和妻子的积分都不到20,那么积分分别为10和16,总和为26。而合在一起结账,由于积分超过了20,积分将是52。有生活经验的夫妻们,一定是合在一起结账,而不是分开结账了。

我们创造了一个非线性的系统。把这个新的结算系统编成函数,依然用Python:

代码语言:javascript
复制
# By Vamei

def non_linear_bill(x1, x2):
    y1 = 5*x1 + 3*x2
    y2 = 2*x1 + 4*x2
    if y2 > 20:
        y2 = y2 * 2
    return y1, y2

非线性并不是人们的惯常思维方式。超市和商场常有复杂的打折、赠券、积分系统, 这些系统很多时候是非线性的。大脑需要耗费很大能量,才能处理得过来。于是,作为超级线性的男生,我通常的想法都是:去它妈的,老子不要那么麻烦的合单或拆单了。

(奇怪的是,妹纸可以超级熟练的处理各种非线性的购物系统,甚至并行处理多个。上帝拿走的那根肋骨,一定是非线型的……)

“一个”

我们即将要改变我们对一个单位的数据的理解。举出一个数据

做为程序员,最直接会列举出一个数据,比如一个整数,一个浮点数。

那一个结构体呢?C语言中的结构体可以包含有多个元素。我们知道,每个元素分开写出来,并不是结构体的完整数据。比如:

代码语言:javascript
复制
typedef struct {
    int veg;
    int bean;
} Cart;

再继续,一个对象的数据呢?一个对象可以有多个属性。当我们说一个对象的数据时,我们指的是这个对象的多个属性。比如:

代码语言:javascript
复制
public class Cart{
   int veg;
   int bean;
}

再比如,我们在说一个人的数据时,包括姓名,身高、体重、IQ多个值。这多个值可以构成这个人的“一个”数据。我们可以在SQL数据库中建立这样一个Person(name, height, weight, IQ)的表。每一行,也就是一个记录(record),算是一个数据单位。

即使是列表这样的数据容器,如果固定每个位置数据的意义,那么一个列表也可以算是“一个”数据。比如丈夫购物车为[1,2],妻子的购物车为[2,3]。

这种包含了多个元素的数据,称为向量(vector)。与之对应,一个单一的数值,称为标量(scalar)。

 一个向量

我们用带小箭头字母表示,来表示一个向量。比如丈夫的购物车:

$$ \vec{x} = \left[ \begin{matrix} 1 \\ 2 \end{matrix} \right]$$

向量可以相加减,这时只需要对应行的元素相加就可以,相当于合并或分开购物车。比如丈夫和妻子的购物车合并:

$$\begin{bmatrix} 1 \\ 2 \end{bmatrix} + \begin{bmatrix} 2 \\ 3 \end{bmatrix} = \begin{bmatrix} 3 \\ 5 \end{bmatrix}$$

向量也可以与一个标量相乘。比如[$\vec{x} \times 5$]表示5个购物车的量。这时只需将标量与向量的各行元素相乘。

$$ 5 \begin{bmatrix} 1 \\ 2 \end{bmatrix} = \begin{bmatrix} 5 \\ 10 \end{bmatrix}$$ 

伴随着向量,有一个简单的概念,即维度(dimension)。上面的购物车向量,包含了两个数值,即青菜的数目和黄豆的数目。我们因此说该向量是二维的。而结构体中元素的个数、对象的属性个数,都是维度。我会在以后的文章中深入维度这一概念。

有了对数据的深入理解,那么线性系统的特点可以总结如下: 

$$L(a\vec{D_1} + b\vec{D_2}) = aL(\vec{D_1}) + bL(\vec{D_2})$$  

[$\vec{D_1}$]和[$\vec{D_2}$]是向量,分别是丈夫和妻子的购物车。而a, b为两个标量,比如a为2,b为3,表示丈夫那样的购物车乘2,妻子的购物车乘3。L为结算系统。方程右边表示,合在一起结账。方程右边表示,丈夫和妻子分开小票,相乘再相加。方程的两边相等。

矩阵革命

在数学上,我们已经有一组方程表示出了一个线性系统。上面的方程组有些不方便的地方:

  • 输入的元素(黄豆数目)和系统参数(单价)混合在一起
  • 有很多字母

数学家是偷懒的动物,这点和程序员很像。他们最后找到了一种省事的记述方式。利用刚才的向量。分离的表示输入、线性系统和输出的关系:

$$\begin{bmatrix} 11 \\ 10 \end{bmatrix} = \begin{bmatrix} 5 & 3 \\ 2 & 4 \end{bmatrix} \begin{bmatrix} 1 \\ 2 \end{bmatrix}$$

方程最左是个向量,最右是个向量。奇怪的是中间用括号括住的一堆数字。这被称为一个矩阵(Matrix)。可以看到,这个矩阵中有四个元素,包含了各个物品的单价和各个物品可获得的积分。这通常是结算系统所包含的数据。我们可以猜测到,这个矩阵相当于一个结算系统。左边的向量是输出,右边的向量是输入。

结算系统

这个结算系统运作时,把输入向量放横,再和结算系统的每一行元素分别相乘,即获得对应的输出元素。比如输出的第一个元素:

根据这一运算规则,一个线性系统就完全用一个矩阵表示出来了。

可以把矩阵表示成字母A,那么用代数的形式,写出输出和矩阵、输入的关系:

$$\vec{y} = A\vec{x}$$

这个代数形式,在线性代数中,有基础性的地位。方程的右边,我们说矩阵和向量进行了“乘法”运算。这一运算的规则,是按照我们上面所描述的那样运行的。这简直是对乘法符号的一次“运算符重载”(operator overload)。

我们可以用程序来实现上面的计算过程。编写类似的C程序并不复杂。更方便的是调用现有的库函数,比如Python中的numpy: 

代码语言:javascript
复制
# By Vamei

import numpy as np

# matrix
a = np.matrix([[5, 3],[2, 4]])

# input Vector
x = np.array([[1], [2]])

# multiplication
y = np.dot(a, x)

print(y)

矩阵这个东西把结算系统的表示方式大大缩减。更重要在于,线性系统和矩阵是互通的。矩阵表示的是一个线性系统。一个线性系统也总可以表示一个矩阵(证明从略)。

绕了半天,矩阵 = 线性系统。

总结

线性代数的核心是线性系统的概念。线性系统与矩阵的等同性,让线性代数后面的内容,转入到对矩阵的研究中。但核心要牢记。

线性系统的概念在生活中非常常见。人的思维很多时候也是线性的。思考生活中线性和非线性的例子。

广义的数据可以表示成多维的向量。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2014-04-01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 生活中的线性:超市结算
  • “一个”
  • 矩阵革命
  • 总结
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档