首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Google Earth Engine——使用 R、dplyr 和 ggplot 可视化科罗拉多州丹佛市的每小时交通犯罪数据

丹佛市在其开放数据目录中公开保存过去五年的犯罪数据。在本教程中,我们将使用 R 访问和可视化这些数据,这些数据本质上是具有犯罪类型、社区等特征的时空参考点。 首先,我们将加载一些稍后会用到的包。...,并解析日期/时间列,以便我们可以提取诸如小时-分钟(以评估一天中的模式)、当天周(例如,1 = 星期日,2 = 星期一,...)和年(一年中的哪一天?)...accidents % filter(offense_type_id == "traffic-accident") %>% mutate(datetime = mdy_hms(first_occurrence_date...我们还将创建一个新变量offense_type,它是该offense-type-id列的更易于阅读的版本。使用 ggplot,我们将为一周中的每一天创建一个带有颜色的密度图。...此工作流用于dplyr处理我们的数据,然后将结果通过管道传输到ggplot2,以便我们在全局环境中仅创建一个对象p,即我们的绘图。

10310

使用时间特征使让机器学习模型更好地工作

来源: DeepHub IMBA本文约2300字,建议阅读8分钟在本文中,通过一个实际示例讨论如何从 DateTime 变量中提取新特征以提高机器学习模型的准确性。...特征工程是构建机器学习模型最重要的方面之一。在本文中,我将通过一个实际示例讨论如何从 DateTime 变量中提取新特征以提高机器学习模型的准确性。...从这三个部分中,至少可以提取四个不同的特征: 一年中的一天或一个月中的一天或一周中的一天 一年中的月份 季节 年 除了年以外,所有的特征都可以两部分:正弦和余弦,这样可以获得时间的周期性,例如...如果 Pandas 有 DateTime 列,则可以按如下方式提取年份: df['year'] = df['date_time'].dt.year 从时间中提取特征 根据数据集的粒度,可以从 DateTime...总结 以上就是如何从机器学习模型中提取 DateTime 特征!本文中描述的实际示例表明,日期时间特征的存在可以提高机器学习模型的性能。

1.7K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    质量看板开发实践(三):bug柱状图

    前面2章讲了如何从jira获取数据,知道怎样获取数据,就可以绘图了 本篇记录一下bug柱状图的实现过程 对于这个bug柱状图我大致想实现以下功能: 能够按照日期查询,同时可以切换不同日期维度:按年查询、...,例如按照bug优先级汇总、按照bug状态汇总、按照bug创建者汇总、按照bug创建日期汇总等 本次柱状图是从时间维度统计,所以调用这个方法时,会把class_type设置为"created" ②在提取...是从前端读取的开始日期 end_date_to_datetime是从前端读取的结束日期 dates是一个日期范围列表,它记录了从开始日期到结束日期这个范围内的每一天的日期 result是最终返回的结果,...,因为它们的横轴都具体到某一天 只要拿到开始日期,就能计算得到结束日期,具体过程可以看注释,注释写的很详细 按年查询有一点区别,我希望按年查询时,横轴是一年的12个月份 由于从jira查询到的bug数据是具体到某一天的...,所以得到1年365天的bug数据后,需要对它们进行聚合,以月份进行分组求和 这就很麻烦了,想了很久才找到解决方法,步骤如下 ①从jira提取bug数据后,把日期和bug数分别存到一个列表中,对日期列表进行切割

    4K10

    质量看板开发实践(三):bug柱状图

    前面2章讲了如何从jira获取数据,知道怎样获取数据,就可以绘图了 本篇记录一下bug柱状图的实现过程 对于这个bug柱状图我大致想实现以下功能: 能够按照日期查询,同时可以切换不同日期维度:按年查询...,例如按照bug优先级汇总、按照bug状态汇总、按照bug创建者汇总、按照bug创建日期汇总等 本次柱状图是从时间维度统计,所以调用这个方法时,会把class_type设置为"created" ②在提取...是从前端读取的开始日期 end_date_to_datetime是从前端读取的结束日期 dates是一个日期范围列表,它记录了从开始日期到结束日期这个范围内的每一天的日期 result是最终返回的结果,...,因为它们的横轴都具体到某一天 只要拿到开始日期,就能计算得到结束日期,具体过程可以看注释,注释写的很详细 按年查询有一点区别,我希望按年查询时,横轴是一年的12个月份 由于从jira查询到的bug数据是具体到某一天的...,所以得到1年365天的bug数据后,需要对它们进行聚合,以月份进行分组求和 这就很麻烦了,想了很久才找到解决方法,步骤如下 ①从jira提取bug数据后,把日期和bug数分别存到一个列表中,对日期列表进行切割

    3.2K100

    39个 Python Datetime 小例子,拯救因时间抓狂的你

    在今天的文章中,我们将学习以下内容: Python 中 datetime 模块的使用 使用 Python 日期时间函数将字符串转换为日期时间对象,反之亦然 从日期时间对象中提取日期和时间 使用时间戳 对日期和时间执行算术运算...让我们导入 datetime 模块并创建我们的第一个日期和时间对象: # From the datetime module import date from datetime import date...: datetime.time(11, 33, 25) 我们还可以使用 isocalendar() 函数从日期时间对象中提取周数和天数。...有时,我们需要日期和确切时间,但在其他情况下,我们只需要年份和月份。我们该如何从字符串中提取我们需要的数据,以便将其作为日期时间(日期、时间)对象来操作呢?...想象一下,我们有一个数据集,其中保存着我们公司一年中的每一天的利润。我们想要创建另一个数据集,该数据集将保存距当前日期正好一年的日期,并预测每一天的利润,此时我们一定会在日期上使用算术计算!

    3.4K20

    Java时间处理神器之Joda-Time

    本文将介绍并展示如何使用它。...假设在当前的系统日期下,我希望计算上一个月的最后一天。对于这个例子,我并不关心一天中的时间,因为我只需要获得年/月/日,如清单 6 所示: 清单 6....首先,我从当前月份减去一个月,得到 “上一个月”。接着,我要求获得 dayOfMonth 的最大值,它使我得到这个月的最后一天。...假设您希望获得任何一年中的第 11 月的第一个星期二的日期,而这天必须是在这个月的第一个星期一之后。清单 7 展示了如何完成这个计算: 清单 7....().toDate(); 要创建 Date 对象,它表示从清单 9 所示的 SystemClock 中获得的 LocalDate,您必须首先将它转换为一个 DateMidnight 对象,然后只需要将

    2.3K50

    放弃 Calender优雅地使用Joda-Time吧Joda 大型项目Joda 简介Joda 和 JDK 互操作性Joda 的关键日期时间概念

    本文将介绍并展示如何使用它。...LocalTime:这个类封装一天中的某个时间,当地理位置不重要的情况下,可以使用这个类来只存储一天当中的某个时间。...假设在当前的系统日期下,我希望计算上一个月的最后一天。对于这个例子,我并不关心一天中的时间,因为我只需要获得年/月/日,如清单 6 所示: 清单 6....首先,我从当前月份减去一个月,得到 “上一个月”。接着,我要求获得 dayOfMonth 的最大值,它使我得到这个月的最后一天。...date = localDate.toDateMidnight().toDate(); | 要创建 Date 对象,它表示从清单 9 所示的 SystemClock 中获得的 LocalDate,您必须首先将它转换为一个

    1.5K70

    「Python」用户消费行为分析

    数据的预处理 观察date(用户消费时间列)可发现,其时间格式Pandas未能识别,需要手动将其转换成时间格式列(datetime),方便后续操作。...In [5]: df['date'] = pd.to_datetime(df['date'], format='%Y%m%d') 后续数据分析需要按月来操作,因此需要读取date(用户消费时间列)中的月份..., In [6]: df['month'] = df['date'].astype('datetime64[M]') 注意看这里这里从date(用户消费时间列)中获取月份的方式,并没有使用: In [7...2021-07-01 7 由此可以看出,当遇到多个年份有相同月份的时候,使用.dt.month仅仅可以提取出来月份,但是具体是哪一年的7月,确提取不出来,因此其存在着弊端。...用户最后一次购买日期==第一次购买的日期,说明用户仅仅购买了一次或者用户在同一天内购买了两次。

    1K10

    R语言从经济时间序列中用HP滤波器,小波滤波和经验模态分解等提取周期性成分分析

    数据 我使用从1970Q1到2016Q4的美国对数实际GDP的季度数据来说明不同的方法。时间序列是通过 Quandl 及其相应的R包获得的。...与线性趋势的偏差 从系列中提取趋势的第一种方法是在常数和趋势项上回归目标变量并获得拟合值。在下图中绘制。...正如我们在上面看到的,鉴于趋势的增长率随着时间的推移持续下降,这不太可能。但是,仍然可以采用时间趋势的其他函数形式(例如二次项)来说明趋势的特殊性。...下图绘制了由HP过滤器获得的实际GDP周期性成分的值,并将其与线性趋势下的序列的值进行比较。 ? 尽管HP过滤器在经济学中得到了广泛的应用,但它们的某些功能也受到了广泛的批评。...小波滤波器 Yogo(2008)提出使用小波滤波器从时间序列数据中提取业务周期。该方法的优点是该函数不仅允许提取序列的趋势,周期和噪声,而且还可以更明确地了解周期发生的时间段。

    86710

    左手用R右手Python系列14——日期与时间处理

    日期与时间格式数据处理通常在数据过程中要相对复杂一些,因为其不仅涉及到不同国家表示方式的差异,本身结构也较为复杂,在R语言和Python中,存在着不止一套方法来处理日期与时间,因而做一个清洗的梳理与对比将会很有价值...当你已经获得了一个标准日期格式之后,你可以通过format(date,format=) 函数进行日期元素的提取,比如你可以从标准日期中提取出年份、月份、具体日期、季度、星期、周度等。...这里需要说明的是,以上通过as.POSIXlt函数输出的时间/日期格式,仍然可以使用format(date,format=)函数或者years()\quarters()\months()\weekdays...Python: Python中的常用时间与日期处理函数除了Pandas内置的时间对象之外,还有datetime\time模块。...(四个参数必须满足其中三个方可输出时间序列,freq有默认为天的从参数)。

    2.3K70

    用Python快速分析和预测股票价格

    来源于雅虎财经的股票价格 这段代码将提取从 2010 年 1 月到 2017 年 1 月的 7 年的数据。你可以根据需要调整开始和结束日期。...接下来的分析过程,我们将使用收盘价格,即股票在一天交易结束时的最终价格。 3 探索股票的移动平均值和收益率 在这个分析中,我们使用两个关键的测量指标来分析股票:移动平均值和回报率。...4.2 股票回报率和风险 除了相关性,我们还分析了每支股票的风险和回报。本例中我们提取的是回报的平均值(回报率)和回报的标准差(风险)。...仍然有许多问题需要考虑,特别是对于不同的公司来说,随着时间的推移,它们的价格走势也会不同。 为了进行全面的测试,让我们输出一些股票的预测。...参考文献是从列表中挑选出来的,与其他作品的任何相似之处都纯属巧合。 本文写作纯粹是作者的副业,没有任何其他隐藏的动机。

    3.9K40

    R语言从经济时间序列中用HP滤波器,小波滤波和经验模式分解等提取周期性成分分析

    数据 我使用从1970Q1到2016Q4的美国对数实际GDP的季度数据来说明不同的方法。时间序列是通过  Quandl  及其相应的R包获得的。...与线性趋势的偏差 从系列中提取趋势的第一种方法是在常数和趋势项上回归目标变量并获得拟合值。在下图中绘制。...正如我们在上面看到的,鉴于趋势的增长率随着时间的推移持续下降,这不太可能。但是,仍然可以采用时间趋势的其他函数形式(例如二次项)来说明趋势的特殊性。...下图绘制了由HP过滤器获得的实际GDP周期性成分的值,并将其与线性趋势下的序列的值进行比较。 尽管HP过滤器在经济学中得到了广泛的应用,但它们的某些功能也受到了广泛的批评。...小波滤波器 Yogo(2008)提出使用小波滤波器从时间序列数据中提取业务周期。该方法的优点是该函数不仅允许提取序列的趋势,周期和噪声,而且还可以更明确地了解周期发生的时间段。

    2.4K00

    如何用 Python 和 API 收集与分析网络数据?

    根据我的讲解,请你逐条执行,并仔细观察运行结果。 本例中,我们主要会用到以下两个新的软件包。 首先是号称“给人用”(for humans)的HTTP工具包requests。...而且刚刚无法正常显示的中文,此时也都显现了庐山真面目。 下一步很关键。 我们把真正关心的数据提取出来。 我们不需要返回结果中的错误码等内容。 我们要的,是包含每一天天气信息的列表。...下面我们绘制一个简单的时间序列对比图形。 读入绘图工具包 plotnine 。 注意我们同时读入了 date_breaks,用来指定图形绘制时,时间标注的间隔。...接口,获得结果数据; 如何使用 Python 3 和更人性化的 HTTP 工具包 requests 调用 API 获得数据; 如何用 JSON 工具包解析处理获得的字符串数据; 如何用 Pandas...转换 JSON 列表为数据框; 如何将测试通过后的简单 Python 语句打包成函数,以反复调用,提高效率; 如何用 plotnine (ggplot2的克隆)绘制时间序列折线图,对比不同城市 AQI

    3.3K20
    领券