前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >某高校毕业设计-数据分析课题技术实现篇

某高校毕业设计-数据分析课题技术实现篇

作者头像
用户2225445
发布2023-10-16 15:56:41
1480
发布2023-10-16 15:56:41
举报
文章被收录于专栏:IT从业者张某某

某高校毕业设计-数据分析课题技术实现篇

1.确定分析目标

1.法律,最高法标准案件发布后对酒驾量刑的影响。 2.教务处 分析各个学院的毕设指导情况分析

2.初步判断数据研判数据

2.1能不能找到数据–>可以找到

能不能找到数据 法律文书网找到了 教务处 教务数据可以直接导出

2.2分析指标
2.2.1 指标1 各个老师的毕设通过率

为完成这个指标,需要什么字段

学院名,专业名,指导教师,学生学号,学生姓名,企业老师姓名,选题,选题类型,是否通过

2.2.2 指标2 每年的毕设重修人数

为完成这个指标,需要什么字段

学院名,专业名,学生学号,是否通过

2.2.3 各个学院每年答辩通过率

为完成这个指标,需要什么字段

学院名,专业名,学生学号,是否通过

2.2.4 指标new

为完成这个指标,需要什么字段

2.2.15 指标new

为完成这个指标,需要什么字段

2.3 基于需要分析的目标确定需要哪些字段特征

汇总

学院名,专业名,指导教师,学生学号,学生姓名,学生的联系方式,企业老师姓名,选题,选题类型,答辩成绩,论文成绩,指导教师成绩

3.数据采集

python 或 一些工具 八爪鱼 后裔采集器 钞能力 但是采集的难度是有区别的

4.数据处理

**技术需要带一带大家** 常见包括 数据预处理

空缺值处理 重复值处理 异常值处理 数据集成 多个数据合并在一起 数据规约 完整数据集 100 字段,但我分析这个指标只需要10字段,我就提取10个字段作为子集,这样快,就是数据规约中的维度规约。数量规约。 数据转换。收入100亿 2000千元 0-1之间 数据转换

数据处理是遍布全周期的

5.数据分析实现

与数据处理是交叉

5.1指标1 各个老师的毕设通过率

实现流程

数据处理 数据集成 数据规约 数据子集 统计分析 **重点关注下**

在这里插入图片描述
在这里插入图片描述

绘图可视化 **重点关注下**

在这里插入图片描述
在这里插入图片描述

由图5-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整

5.2 指标2 每年的毕设重修人数

数据处理 数据集成 数据规约 数据子集 统计分析 重点关注下 绘图可视化 重点关注下 由图2-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整

6.数据挖掘实现

6.1 预测下今年每个学院的通过率

实现技术流程

数据处理 数据集成 数据规约 数据子集 统计分析 重点关注下 数据挖掘 回归算法 聚类 分类 深度学习 图 实现一个预测等 采用多种算法进行比较,评估 绘图可视化 重点关注下 由图6-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整

7.论文报告数据分析技术部分就已经完成。

总结

大家先确定下自己的分析目标,并初步判断能否获得数据,确定一些数据分析指标。本周任务

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 某高校毕业设计-数据分析课题技术实现篇
    • 1.确定分析目标
      • 2.初步判断数据研判数据
        • 2.1能不能找到数据–>可以找到
        • 2.2分析指标
        • 2.3 基于需要分析的目标确定需要哪些字段特征
      • 3.数据采集
        • 4.数据处理
          • 5.数据分析实现
            • 5.1指标1 各个老师的毕设通过率
            • 5.2 指标2 每年的毕设重修人数
          • 6.数据挖掘实现
            • 6.1 预测下今年每个学院的通过率
          • 7.论文报告数据分析技术部分就已经完成。
            • 总结
            相关产品与服务
            数据集成
            数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档