引用一个经典用例解释上述的若干概念,使用的数据集如表4-3所示,该数据集可以认为是超市的购物小票,第一列表示购物流水ID,第二列表示每个流水同时购买的物品。
表4-3 超市购物流水
?...回归
回归是研究一个随机变量Y或者一组随机变量Y ( y1, y2, …, yn )对一个属性变量X或者一组属性变量X (x1, x2, …, xn )的相依关系的统计分析方法,通常称X或者X (x1,...x2, …, xn )为自变量,称Y或者Y ( y1, y2, …, yn )为因变量。...为了便于叙述,取自变量为X (x1, x2, …, xn ),因变量为Y,训练参数为W (w1, w2, …, wn )。
(1)目标数学模型函数定义为
?
(2)基于最小二乘定义损失函数为
?...如果因变量是多分类的,则扩展为Softmax回归。