R语言数据分析

前言

经过第一周的试听,第二周的退补选,本学期的《R语言数据分析》课程终于在周四、周五正式开课。

作为一门开源编程课,拿到点名名单时,惊了——这门课只有2个女生选课。经过课程宣传之后,本周终于多了一个女生……是的,这门课只有三个女生选课,占全班人数的1/15不到。

感慨当今女科学家少之余,又在反思是不是自己教学内容不够吸引,所以女生选课这么少。中国的第一位理科类诺贝尔奖来自屠呦呦老师,由女研究员主导技术领域的发展和潜能让人肃然起敬。

对于教学大纲,在上学期教学的基础上,进行了最新技术的增加。

当你学完本学期课程,你可以轻而易举的独立完成:

一篇数据分析报告、

人文社科类的社交网络分析、观点挖掘、汉语分词,

本课程还包括使用R的packages爬取网络数据、正则表达式提取特定数据的内容,你可以使用这部分知识完成数据挖掘的项目作业。

本课程是一门多学科交叉应用性很强的课程,同时欢迎生物、医学领域的学生来学习,我会提供一些课题方向,借助R完成AI生物医学的一些项目。

本学期的课程,理论与上机实践结合,通过期末一个(机器学习/数据挖掘)大项目结束本学期课程。让学生们真正感受到R是一门优于其他分析软件的工具。

课程大纲,sllyabus

基础篇

一 基础篇

1 数学基础

2 R on Mac: Installing & oprations

Mac版R:安装和基础操作

3 R on Windows: Installing & oprations

Windows版R:安装和基础操作

3. RStuido(Mac&Win): Installing & Layout

RStudio:安装与版块功能使用介绍

4.Introduction to R

R的历史、概览、发展、应用领域

5.prime oprations

常见基础操作:读取数据、设置工作空间etc

6.Data Types:Vector,Array,Matrices,Factors,

R中的数据类型及操作

7.Prime Functions

基本命令

8.NA values

缺失值的原因及处理

9.Project Homework:Data Visualisation

项目作业一:数据分析报告及可视化

提高篇

二 提高篇

Writing Code:if-else, for ,while loops, reapt,next,break,

定制化代码

Project Homework:Kaggle Data Analysis

项目作业二:Kaggle数据分析(预测/挖掘)

应用篇

三 应用篇

数据可视化:ggplot2,lattice,rgl

生物医学:微阵列数据处理arrf包etc

基因本体学goTools包etc

微阵列比较基因组杂交aCGH包etc

蛋白质组学:蛋白质结构预测PROcess包etc

基因表达分析EST

金融量化:时序分析、序列分析

数据挖掘:聚类、预测

人文社科:文本挖掘、社交网络分析、分词、观点挖掘

公用数据库介绍

祝各位同学本学期学有所获

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180310G0EK8B00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券