首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

强大空气质量数据分析开源工具

openair 是一个R语言工具,旨在用于分析空气质量数据以及大气成分数据。起初主要用于处理空气质量数据,目前也可以用于分析大气成分数据。...此工具具有如下特点: 可通过 importAURN 和 importKCL 函数英国数百个空气监测站获取数据 可以非常容易处理大气成分数据 通过 windRose 和 pollutionRose 很容易绘制污染风玫瑰图...openair功能非常强大,有非常详细说明文档和配套在线书籍,其中在线书籍内容非常丰富,几乎涵盖了空气质量数据分析每一个方面。唯一缺点可能就是没有Python版本了。...安装 安装非常很方便,只需要执行如下命令即可: require(devtools) install_github('davidcarslaw/openair') 示例 官方文档和在线书籍提供了大量示例.../david_carslaw/openair/

1.1K20

R语言入门到精通:Day2-R和RStudio运行视频教程

本来想着R语言虽然重要,但是肯花心思学习的人可能还是少数,大家可要持之以恒哟。今天,我们就开始进入到《R语言入门到精通》第二节:R和RStudio使用。...上节课程中,我们讲解了R和RStudio安装,(错过朋友,可以直接点击这里 ? )R语言入门到精通:Day1-R语言安装,本节内容我们来学习如何使用他们。...R使用 科·研·猫 R呢,就是R语言“本体”,我们在电脑上安装好了之后,就会出现这样一个图标: ? 我们把它双击打开,就是R图形化界面RGui: ?...RStudio运行 科·研·猫 上节课已经说过,RStudio是R语言一个非常优秀编辑器,它集成了R代码编写、运行、调试、可视化等等非常多功能。...这其中最重要就是代码编辑页面和控制台,代码编辑页面就是我们书写代码和编辑更改代码地方,控制台跟刚才在RGui中一样,就是代码运行和输出运行结果地方。

1.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

完整R语言预测建模实例-数据清理到建模预测

本文使用Kaggle上一个公开数据集,数据导入,清理整理一直介绍到最后数据多个算法建模,交叉验证以及多个预测模型比较全过程,注重在实际数据建模过程中实际问题和挑战,主要包括以下五个方面的挑战:...缺失值挑战 异常值挑战 不均衡分布挑战 (多重)共线性挑战 预测因子量纲差异 以上几个主要挑战,对于熟悉机器学习的人来说,应该都是比较清楚,这个案例中会涉及到五个挑战中缺失值,量纲和共线性问题挑战...可以看出,我们插补出来值和原始值之间差异是比较小,可以帮助我们进行下一步建模工作。...因为原生R只支持单进程,通过我们设置,可以将四个核都使用起来,可以大为减少我们计算时间。 我们最后一个步骤就是要将三个模型进行比较,确定我们最优一个模型: ?...结果准确率和Kappa值两个方面对数据进行了比较,可以帮助我们了解模型实际表现,当然我们也可以通过图形展现预测结果: ? 根据结果,我们可以看到,其实逻辑回归结果还是比较好

3.1K50

有意思数据可视化案例:R语言ggplot2画山脊图展示NBA球员出手距离分布

原文链接是 https://nycdatascience.com/blog/student-works/nba-shot-log/ 主要内容是探索了NBA 14/15赛季常规赛MVP排行榜前四名 库里...今天重复第一个内容:用R语言ggplot2画山脊图展示以上四人投篮出手距离分布。...)+ facet_grid(player_name~.)+ theme_gdocs()+ theme(axis.text.y = element_blank()) 更改坐标轴标题 ggplot...axis.text.y = element_blank())+ labs(x="Shot Distance",y="Shot Density")+ ggtitle("Shot Distance") 自定义填充颜色并且更改图例标题...scale_fill_manual("Players", values = c("#FFCC33", "#FF3300", "#990000", "#0066FF")) 大家可以自己最基本密度图然后逐步向上叠加代码看看效果

77220

寻找与疾病相关SNP位点——R语言SNPedia批量提取搜索数据

,Stabilized,Reference,Chromosome,Position,Gene,还有clinvar表格信息,这时候我们就可以网页中利用RCurl包,XML包,正则表达是把所需要内容提取出来...知识准备 RCurl包和XML包    在前一篇博文R语言从小木虫网页批量提取考研调剂信息 http://www.cnblogs.com/ywliao/p/6420501.html中已经提过,这里再提一个...比如"apple[a-zA-z,;: ]+",定位到apple开头后面匹配小写和大写字母,;:和空格至少一次内容   [\u4E00-\u9FA5]匹配汉字 ** R语言gregexpr函数   ...,许多函数以后可以直接复制使用,或者放进一个自己做R包 !...strURL) 写如标题 info<- data.frame("Title"=strsplit(xmlValue(getNodeSet(doc,'//title')[[1]])," -")[[1]][1

1.4K30

数据看Kobe,请让我以这样方式说再见

时间飞驰,转眼间飞侠真的要说再见了…… 1996年进入NBA,到如今已是飞侠第20个赛季,由于近两年重大伤病,科比状态下滑很快,本赛季他出场12次,场均上场30.8分钟,贡献15.7分、4.1个篮板...技术说明:R语言抓取数据,数据来源:http://stats.nba.com/ 以下是对科比以往比赛成绩数据简单分析 一、抓取Kobe数据并对原始数据进行处理 利用R语言抓取科比职业生涯20个赛季数据...3、聚类分析 首先,了解朋友知道,科比职业生涯前两个赛季是比较惨淡,除了在97年新秀赛季夺得扣篮赛冠军外,并未有太多释放光芒地方;不过此后,星光开始绽放,截止12-13赛季,基本上都处于巨星状态...;随后三个赛季,由于伤病等影响,状态明显下滑。...做一个简单kmeans聚类分析,聚类结果如下: 将聚类结果与上面的实际分类作比较,如下图: 可以看出聚类结果跟我们之前设想差不多,仅有14-15赛季仍被判定为“巨星”赛季

72480

最后,请让我以这样方式说再见:球员数据看Kobe

时间飞驰,转眼间飞侠真的要说再见了…… 1996年进入NBA,到如今已是飞侠第20个赛季,由于近两年重大伤病,科比状态下滑很快,本赛季他出场12次,场均上场30.8分钟,贡献15.7分、4.1个篮板...技术说明: R语言抓取数据,数据来源:http://stats.nba.com/ 数据简单分析 一、抓取Kobe数据并对原始数据进行处理 利用R语言抓取科比职业生涯20个赛季数据,并对初始数据作处理...3、聚类分析 首先,了解朋友知道,科比职业生涯前两个赛季是比较惨淡,除了在97年新秀赛季夺得扣篮赛冠军外,并未有太多释放光芒地方;不过此后,星光开始绽放,截止12-13赛季,基本上都处于巨星状态...;随后三个赛季,由于伤病等影响,状态明显下滑。...做一个简单kmeans聚类分析,聚类结果如下: 将聚类结果与上面的实际分类作比较,如下图: 可以看出聚类结果跟我们之前设想差不多,仅有14-15赛季仍被判定为“巨星”赛季

67750

R语言vs Python:数据分析哪家强?

本文章旨在更客观地看待这两门语言。我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样代码。这让我们了解每种语言优缺点,而不是猜想。...我们将会分析一个NBA数据集,包含运动员和他们在2013-2014赛季表现,可以在这里下载这个数据集。我们展示Python和R代码,同时做出一些解释和讨论。...csv") 上面的代码分别在两种语言中将包含2013-2014赛季NBA球员数据 nba_2013.csv 文件加载为变量nba。...R代码比Python更复杂,因为它没有一个方便方式使用正则表达式选择内容,因此我们不得不做额外处理以HTML中得到队伍名称。R也不鼓励使用for循环,支持沿向量应用函数。...总结 ---- 在Dataquest,我们首先教授Python,但是最近也加入了R课程。我们看到这两种语言是互补,虽然Python在更多领域更强大,但R是一种高效语言

3.5K110

Excel Power Query抓取多个网页数据并配合Power Pivot进行分析

第一部分:网页动态抓取数据 使用Power Query不仅可以获取本地Excel文件数据,还可以获取网页数据。...本节介绍如何使用Power Query获取新浪网新浪体育频道新浪直播室网页中足球排行榜数据,主要获取列表中全部赛季球队数据,赛事主要获取前5项数据(前5项赛事数据结构是相同),如图所示。...首先新建一个Excel工作簿,将其打开后依次选择“数据”→“获取数据”→“来自其他源”→“自网站”选项,然后在弹出Web”对话框中选中“高级”单选按钮,接着将网址按参数进行拆分,并分别填写至“URL...第1步:在Excel工作表中建立一个标题数据表,并添加到数据模型中,表名为“标题”,该表与已经抓取数据表不用建立任何关系。..."和"二级标题名称"放入列标签,将"赛季"放入行标签,将"透视表值"放入值标签,插入切片器。

2.8K20

【Python环境】R vs Python:硬碰硬数据分析

我们将在已有的数十篇主观角度对比Python和R文章中加入自己观点,但是这篇文章旨在更客观地看待这两门语言。...我们会平行使用Python和R分析一个数据集,展示两种语言在实现相同结果时需要使用什么样代码。这让我们了解每种语言优缺点,而不是猜想。...在Dataquest,我们教授两种语言,并认为两者在数据科学工具箱中都占据各自地位。 我们将会分析一个NBA数据集,包含运动员和他们在2013-2014赛季表现,可以在这里下载这个数据集。...csv") 上面的代码分别在两种语言中将包含2013-2014赛季NBA球员数据 nba_2013.csv 文件加载为变量nba。...R代码比Python更复杂,因为它没有一个方便方式使用正则表达式选择内容,因此我们不得不做额外处理以HTML中得到队伍名称。R也不鼓励使用for循环,支持沿向量应用函数。

1.5K90

一起来约G7~R语言探索约基奇数据简单小例子

掘金又赢了,硬生生把系列赛3比1打成了3:3,于是大家都来调侃说 我 约基奇(约G7)名号可不是白叫!...哈哈哈哈 那作为一个喜欢篮球R语言初学者,当然不能只看比赛了,还要把约基奇常规数据探索学起来!...场均出场时间17-18赛季达到最大值,恰好也是命中率最低一个赛季,那我们可以合理猜测一下,要想最大效率发挥约基奇作用,应该合理安排他出场时间。...可能原因有很多,这里我猜可能是休赛季参加世界杯没有得到充足休息导致。...,单纯得分、及助攻等数据很难看出对比赛胜负影响,除非你队中有一位叫做波普运动员。

40810

仅靠一道简单数学题,他就变成了Stack Overflow数据科学家

一次拜访、几周面试,Stack Overflow提供给他一个无法拒绝工作机会,David Robinson计算生物学博士变成了一个数据科学家。...那么,贝塔分布有这样直观解释吗? 例如 α=.99,β=.5,贝塔分布B(α,β)如下图所示(使用R生成): 那么这个图代表什么意思?Y轴是一个概率密度,那么X轴呢?...curve(dbeta(x, 81, 219)) 之所以取这两个参数,原因如下: 贝塔分布均值 从上图中可以看出,这个分布主要落在(0.2, 0.35)之间,这是经验得到合理范围。...福利 如果你对这位生物信息学博士变身Stack Overflow数据科学家David Robinson感兴趣,可在微信公众号后台回复“数据”,即可获得David RobinsonR语言文本挖掘《Text...Mining with R》免费电子书。

75670

R语言SOM(自组织映射神经网络)对NBA球员聚类分析|附代码数据

随着训练向量多次输入,收敛参数使调整变得越来越小,从而使地图稳定。 该算法赋予SOM关键特征:数据空间中接近点在SOM中更接近。因此,SOM可能是表示数据中空间聚类好工具。...相关视频 ** 拓端 ,赞27 Kohonen映射类型 下面的示例将使用2015/16 NBA赛季球员统计数据。我们将查看每36分钟更新一次球员统计信息。...点击标题查阅往期内容 R语言k-means聚类、层次聚类、主成分(PCA)降维及可视化分析鸢尾花iris数据集 左右滑动查看更多 01 02 03 04 热图SOM 我们可以通过将每个球员分配到具有最接近该球员状态代表向量来识别地图...每个地图单元格代表性矢量显示在右侧。左侧是根据其状态与这些代表向量接近程度绘制球员图表。 环形SOM 下一个示例是一种更改几何形状方法。在为上述示例训练SOM时,我们使用了矩形网格。...(NBA.SOM4$codes$Y, 1, max) 本文选自《R语言SOM(自组织映射神经网络)对NBA球员聚类分析》。

54820

威少爷投篮命中率

资深篮球评论员苏群老师公众号今天分享文章是《威少投篮惨不忍睹,但他把MVP给乔治》,其中用表格形式展示了威少爷11年职业生涯出手距离投篮命中率和出手距离所占比重变化,个人认为这类数据用折线图看起来更为直观...,本文记录整理苏群老师文章中用到数据后使用ggplot2制作折线图代码 数据整理 不同出手距离命中率 ?...从上图可以看出1-5米内出手命中率近两个赛季明显下降,1米内出手命中率生涯最佳 2、出手距离比例 df2<-read.table("clipboard",header=T) df2 mydata2<-melt...由上图可以看出,威少本赛季较上个赛季进攻方式变化:略微增加了三分球,减少了长两分,其他没有明显变化 参考文献 R语言ggplot2包画折线图 Legends(ggplot2) ggplot2 legend...: Easy steps to change the position and the appearance of a graph legend in R software

43120

Scikit-Learn教程:棒球分析 (一)

一个scikit-learn教程,通过将数据建模到KMeans聚类模型和线性回归模型来预测MLB每赛季胜利。...Python编程语言是数据科学和预测分析绝佳选择,因为它配备了多个软件包,可满足您大部分数据分析需求。...第1部分:预测每赛季MLB球队胜利 在这个项目中,你将测试几个机器学习模型sklearn,根据球队统计数据和那个赛季其他变量来预测那个赛季大联盟棒球队赢得比赛数量。...有关棒球比赛详细解释,请查看美国职业棒球大联盟官方规则。 清理和准备数据 如上所示,DataFrame没有列标题。您可以通过将标题列表传递给columns属性来添加标题pandas。...Pandas通过将R列除以G列来创建新列来创建新列时,这非常简单R_per_game。 现在通过制作几个散点图来查看两个新变量中每一个如何与目标获胜列相关联。

3.4K20

NBA三分球革命:数据揭秘“三分策略是否真有效”?

▍数据准备 为了评估NBA这几年发生了怎样变化,我使用了一个Python网络爬虫框架Scrapy, sportsreference.com 这个网站上爬取相关数据。...最终数据集包括了1946-47赛季到2017-18赛季每个赛季每支球队数据。...▍探索性数据分析 除了在1990年代出现过一个三分球投射高峰(因为当时规则曾出现过短暂更改,将三分线设置更近了),全联盟平均各队三分球尝试次数基本上呈现逐年线性增长规律。...而过去4个赛季,增速开始提升。 ? (图片说明:自79-80赛季至14-15赛季,每队三分球平均出手数) 同一个时间跨度三分球得分数也呈现相似的趋势。 ?...(图片说明:自79-80赛季至14-15赛季,三分球与两分钱占比) 提到三分球,大家必然想到就是库里。过去几个赛季他已经多次打破自己保持三分球记录。

92320
领券