专栏首页村雨遥深度学习之线性回归

深度学习之线性回归

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/github_39655029/article/details/86628097

线性回归

基本要素

1. 模型

2. 模型训练及其三要素

  • 定义 通过数据来寻找特定模型参数值,是模型在数据上的误差尽可能小的过程叫做模型训练;
  • 三要素
    • 训练数据
    • 损失函数(loss function) 衡量误差的函数,
    • 优化算法
      • 解析解:误差最小化问题的解可用公式直接表达,这类解叫做解析解;
      • 数值解:只能通过优化算法有限次迭代模型参数来尽可能降低损失函数的值,这类解叫做数值解;

      小批量随机梯度下降(mini-batch stochastic gradient descent):先选取一组模型参数的初始值,然后对参数进行多次迭代,使每次迭代都可能降低损失函数的值,在每次迭代中,先随机均匀采样一个由固定数目训练数据样本组成的小批量(mini-batch)β,然后求小批量中数据样本的平局损失有关模型参数的梯度(导数),最后用此结果与预先设定的一个正数的乘积作为模型参数在此次迭代中的减小量,注:批量大小和学习率的值是人为设定的,并非模型训练学习,因此叫做超参数,我们通常讲的“调参”正是指调节超参数

3. 模型预测

表示方法

  • 神经网络图 线性回归是一个单层神经网络,输出层中负责计算输出o的单元叫做神经元,输出o的计算依赖于输入,即输出层中的神经元与输入层中各个输入完全连接,因此输出层又叫做全连接层(fully-connected layer)或稠密层(dense layer);
  • 矢量计算表达式

线性回归的实现

  • 实现简单步骤:生成数据集 -> 读取数据 -> 定义模型 -> 初始化模型参数 -> 定义损失函数 -> 定义优化算法 -> 训练模型 ;
  • 代码
    • 线性回归的从零开始实现
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2019/1/15 23:04
# @Author  : Cunyu
# @Site    : cunyu1943.github.io
# @File    : linearRegression.py
# @Software: PyCharm


from IPython import display
from matplotlib import pyplot as plt
from mxnet import autograd, nd
import random

""""
线性回归的从零实现
"""

# 生成人工数据集

num_input = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2

features = nd.random.normal(scale=1, shape=(num_examples, num_input))
labels = true_w[0] * features[:,0] + true_w[1] * features[:,1] + true_b
labels += nd.random.normal(scale=0.01, shape=labels.shape)

print(features[0], labels[0])

def use_svg_display():
	# 用矢量图显示
	display.set_matplotlib_formats('svg')

def set_figsize(figsize = (3.5, 2.5)):
	use_svg_display()
	# 设置图的尺寸
	plt.rcParams['figure.figsize'] = figsize

set_figsize()
plt.scatter(features[:,1].asnumpy(), labels.asnumpy(), 1)
plt.show()

# 读取数据
def data_iter(batch_size, features, labels):
	num_examples = len(features)
	indices = list(range(num_examples))
	random.shuffle(indices)
	for i in range(0, num_examples, batch_size):
		j = nd.array(indices[i:min(i+batch_size, num_examples)])
		yield features.take(j), labels.take(j) # take函数根据索引返回对应元素

batch_size = 10
for X, y in data_iter(batch_size, features, labels):
	print(X, y)
	break


# 初始化模型参数
w = nd.random.normal(scale=0.01, shape=(num_input, 1))
b = nd.zeros(shape=(1,))

w.attach_grad()
b.attach_grad()

# 定义模型
def linreg(X, w, b):
	return nd.dot(X, w) + b

# 定义损失函数
def squared_loss(y_hat, y):
	return (y_hat-y.reshape(y_hat.shape)) ** 2 / 2

# 定义优化算法
def sgd(params, lr, batch_size):
	for param in params:
		param[:] = param - lr * param.grad / batch_size

# 训练模型
lr = 0.03
num_epochs = 3
net = linreg
loss = squared_loss

print('批量样本求平均:')
for epoch in range(num_epochs): # 训练模型一共需num_epochs个迭代周期
	# 每个迭代周期中,会使用训练数据集中所有样本一次(假设样本数据能够被批量大小整除),X和y分别是小批量样本的特征和标签
    for X, y in data_iter(batch_size, features, labels):
        with autograd.record():
            l = loss(net(X, w, b), y) # l是有关小批量X和y的损失
        l.backward() # 小批量的损失对模型参数求梯度
        sgd([w, b], lr, batch_size) # 使用小批量随机梯度下降迭代模型参数
    train_l = loss(net(features, w, b), labels)
    print('epoch %d, loss: %f' % (epoch + 1, train_l.mean().asnumpy()))
print('权重:\n', true_w, w)
print('偏差:\n', true_b, b)
  • 线性回归的简洁实现
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2019/4/10 10:34
# @Author  : cunyu
# @Site    : cunyu1943.github.io
# @File    : linearRegressionSimple.py
# @Software: PyCharm

from mxnet import autograd, nd

# 生成数据集
num_inputs = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2
features = nd.random.normal(scale=1, shape=(num_examples, num_inputs))
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
labels += nd.random.normal(scale=0.01, shape=labels.shape)

# 读取数据
from mxnet.gluon import data as gdata

batch_size = 10
# 将训练数据的特征和标签组合
dataset = gdata.ArrayDataset(features, labels)
# 随机读取小批量
data_iter = gdata.DataLoader(dataset, batch_size, shuffle=True)
# 读取并打印第一个小批量数据样本
for X, y in data_iter:
	print(X, y)
	break

# 定义模型
from mxnet.gluon import nn

net = nn.Sequential()
net.add(nn.Dense(1))

# 初始化模型参数
from mxnet import init

net.initialize(init.Normal(sigma=0.01))

# 定义损失函数
from mxnet.gluon import loss as gloss

loss = gloss.L2Loss()  # 平方损失又称为L2范数损失

# 定义优化函数
from mxnet import gluon

trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.03})

# 训练模型
num_epochs = 3
for epoch in range(1, num_epochs + 1):
	for X, y in data_iter:
		with autograd.record():
			l = loss(net(X), y)
		l.backward()
		trainer.step(batch_size)
	l = loss(net(features), labels)
	print('epoch: %d, loss: %f' % (epoch, l.mean().asnumpy()))

dense = net[0]
print(true_w, dense.weight.data())
print(true_b, dense.bias.data())

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 动手学深度学习-多层感知机

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    村雨遥
  • Java 版 C 语言经典 100 例(26 - 30)

    假设第 5 个人为 岁,则第 4 个人为 岁,第 3 个人为 岁,以此类推,第一个人应该是 岁,而第一个人为 10 岁,所以

    村雨遥
  • Java 版 C 语言经典 100 例(11 - 15)

    兔子的规律为数列 1,1,2,3,5,8,13,21....,即下个月是上两个月之和(从第三个月开始),利用递归求每个月的兔子数,然后求和

    村雨遥
  • [pytorch] 图像识别之mixup/cutout/Margin loss....简单实现

    本人kaggle分享链接:https://www.kaggle.com/c/bengaliai-cv19/discussion/128592

    MachineLP
  • 数据结构C#版笔记--队列(Quene)

    队列(Quene)的特征就是“先进先出”,队列把所有操作限制在"只能在线性结构的两端"进行,更具体一点:添加元素必须在线性表尾部进行,而删除元素只能在线性表头部...

    菩提树下的杨过
  • 还在用SimpleDateFormat?Java8都发布N年了,转LocalDateTime吧

    Java8发布,已有数年之久,但是发现很多人都还是坚持着用SimpleDateFormat和Date进行时间操作。SimpleDateFormat这个类不是线程...

    Happyjava
  • LeetCode 1090. 受标签影响的最大值(优先队列)

    我们有一个项的集合,其中第 i 项的值为 values[i],标签为 labels[i]。

    Michael阿明
  • 使用 Iceberg on Kubernetes 打造新一代云原生数据湖

    作者徐蓓,腾讯云容器专家工程师,10年研发经验,7年云计算领域经验。负责腾讯云 TKE 大数据云原生、离在线混部、Serverless 架构与研发。 背景 大...

    腾讯云原生
  • 巧用fastjson自定义序列化类实现字段的转换

    项目中突然需要增加另一个字段的查找,而这个查找需要查另一张表的记录。 但现在产品很多地方都要增加该字段,如何最快的实现该功能呢。 办法如下: 通过fast...

    星痕
  • 跨平台 ListView 性能优化

    导语 精神哥前阵子去参加了好友小青在北京办的T沙龙,探讨移动端热更新相关的话题。Bugly 曾为大家介绍过不少腾讯内部的热更新的框架,正好这次看到了美团,去哪儿...

    腾讯Bugly

扫码关注云+社区

领取腾讯云代金券