薛晓刚-
Oracle和MySQL数据库中做线性回归
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
薛晓刚-
社区首页
>
专栏
>
Oracle和MySQL数据库中做线性回归
Oracle和MySQL数据库中做线性回归
原创
薛晓刚-
关注
发布于 2025-11-01 16:09:44
发布于 2025-11-01 16:09:44
112
0
举报
什么是线性回归
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。
中译中翻译成人话就是:线性回归啊,说白了就是 找俩事儿之间的 “固定关系” —— 比如 “广告花了多少钱” 和 “最后卖了多少钱”,它想弄清楚:是不是广告多花 1 块,销售额就固定多赚几块?然后把这个 “多花 1 块赚 X 块” 的规律找出来,以后就能照着这个规律猜:下次花 5000 块广告,能赚多少;想赚 10 万,得投多少广告。
模拟说明
假设收集了 12 个月的广告投入(单位:万元)和对应销售额(单位:万元)数据,数据符合线性趋势(真实关系:销售额 = 5 * 广告投入 + 20 + 随机误差),模拟数据如下: 月份 广告投入(万元) 销售额(万元) 1 10 72 2 15 98 3 8 63 4 20 125 5 12 81 6 18 110 7 25 148 8 14 92 9 9 68 10 22 133 11 16 105 12 7 59
画成坐标图就是这样:
image.png
说白了就是要找到一条线,让这它几乎穿过了每个点。这样如果按照这样的规律下一次再有一个x的数值输入,那么我们就能呢推断Y的数值大致是多少了。
最后通过函数我们知道了这条线。
image.png
推断结果
================================================== 销售额预测(业务场景) ================================================== 广告投入 13 万元 → 预期销售额:87.80 万元 广告投入 20 万元 → 预期销售额:122.93 万元 广告投入 28 万元 → 预期销售额:163.06 万元 广告投入 35 万元 → 预期销售额:198.18 万元
业务决策建议
加大广告投入:因投入产出比达 1:5,在预算允许范围内可增加广告投放(如从 20 万提升至 28 万,预期销售额增长 40 万元)。
设定目标阈值:若目标销售额为 150 万元,可反推需投入广告:(150 - 19.87) / 5.02 ≈ 26 万元。 风险控制:模型 RMSE 仅 2.83 万元,预测误差小,可基于该模型制定营销预算和销售目标,风险可控。
那么如果结合数据库来做怎么办?
既然通过模拟数据可以做出这个结果,那么我第一感觉就是如果在数据库实现。我就设计表的时候,让这个表的一列是广告投入,另外一个列是销售额(已经有的历史数据)所以表的设计是很重要的。否这里会是一个多表链接(甚至是跨库的操作)
image.png
写入数据
image.png
最后效果就是这样:
image.png
数据也是一模一样的:
销售额预测(业务场景) ================================================== 广告投入 13 万元 → 预期销售额:87.80 万元 广告投入 20 万元 → 预期销售额:122.93 万元 广告投入 28 万元 → 预期销售额:163.06 万元 广告投入 35 万元 → 预期销售额:198.18 万元
重点来了
如果我们篡改了数据:
image.png
那么结果就是:
image.png
销售额预测(业务场景) ================================================== 广告投入 13 万元 → 预期销售额:97.31 万元 广告投入 20 万元 → 预期销售额:96.15 万元 广告投入 28 万元 → 预期销售额:94.83 万元 广告投入 35 万元 → 预期销售额:93.68 万元
可以看出简直是什么都不是了。
所谓智能化的基础是信息化
如果连基本的数据都不对,想做好AI是不可能的。
可惜MySQL社区版没有自身的模型,以上都是用python去演示的,但是Oracle有。
image.png
上图还是Oracle23AI的,最新的26AI,我没有。但是我相信这些只会是越做越好。
带给我们的思考就是,怎么控制好数据库对象设计以及数据质量。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
机器学习
数据库
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
机器学习
数据库
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
什么是线性回归
模拟说明
推断结果
业务决策建议
那么如果结合数据库来做怎么办?
重点来了
所谓智能化的基础是信息化
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐