首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用Python复现一篇Nature的研究: 1.数据下载及预处理

所涉及Python库有 wget , matplotlib , numpy ,xarray , pytorch 等一系列在深度学习以及气象数据处理中经常使用的函数库,希望这篇文章能够对大家有所帮助。...此文使用的神经网络、数据的处理都不是很复杂,适合作为气象神经网络入门的第一个尝试性工作。 本文是复现工作的第一篇文章,主要讲解 数据下载及预处理。...1、CMIP数据 对于使用的CMIP数据,本文并没有使用论文中使用的CMIP5数据,而是使用CMIP6数据。 对于数据的下载,可以直接百度搜索CMIP6然后选择所需的Label下载即可。...我们根据上述规律,使用wget就可以很简单的下载数据了。 接下来是处理CMIP数据,为了统一语言,我使用python中的xarray来处理、merge文件。缺点是很慢,优点是易学。.../ersstv5D") print(file) 同样的,我们使用xarray来merge下载的多个nc文件,并且保存。

1.3K32

用Python复现一篇Nature的研究: 1.数据下载及预处理

所涉及Python库有 wget , matplotlib , numpy ,xarray , pytorch 等一系列在深度学习以及气象数据处理中经常使用的函数库,希望这篇文章能够对大家有所帮助。...此文使用的神经网络、数据的处理都不是很复杂,适合作为气象神经网络入门的第一个尝试性工作。 本文是复现工作的第一篇文章,主要讲解 数据下载及预处理。 ?...1、CMIP数据 对于使用的CMIP数据,本文并没有使用论文中使用的CMIP5数据,而是使用CMIP6数据。 对于数据的下载,可以直接百度搜索CMIP6然后选择所需的Label下载即可。...我们根据上述规律,使用wget就可以很简单的下载数据了。 接下来是处理CMIP数据,为了统一语言,我使用python中的xarray来处理、merge文件。缺点是很慢,优点是易学。.../ersstv5D") print(file) 同样的,我们使用xarray来merge下载的多个nc文件,并且保存。

2.3K52
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    GPM逐日降水数据文件合并

    GPM任务由NASA和JAXA(日本宇宙航空研究开发机构)主导,旨在提供全球范围内的降水观测数据,以改进天气预测、气候研究和自然灾害监测。主要特点高时空分辨率时间分辨率:30分钟至数小时。...多传感器融合结合了卫星、地面雷达和地面雨量计的数据,提升了数据的准确性和覆盖范围。全球覆盖提供从极地到赤道的全球降水数据,尤其适用于偏远和海洋区域。...气候研究:分析长期降水趋势和气候变化。水文建模:支持洪水预警和水资源管理。灾害监测:实时监测极端降水事件,如台风和暴雨。数据获取NASA GES DISC:通过NASA的地球数据系统提供。...GPM逐日降水数据文件合并最近下载了多年的daily降水数据,官网下载下来的gpm数据是一天一个文件,在批量处理时频繁开关文件效率低,所以将多个文件合并。...我下载的是0.1°×0.1°网格的GPM(Global Precipitation Measurement)-IMERG-Final-V07逐日降水资料。我是先把一年的合并,再合并多年的。

    9510

    数据处理 | xarray的计算距平、重采样、时间窗

    距平 下面便提出一个问题:为什么要费尽心思研究变量的距平而非变量的原始数据?若针对于温度这个变量而言,即为什么要使用温度距平(偏离平均值的值)而不非研究绝对温度的变化?...来源:https://www.ncdc.noaa.gov/monitoring-references/faq/anomalies.php Groupby(Ⅲ) Transformations 转换 下面需从数据集中删除气候平均...,从而得到变量随气候平均态变化的残差。...对转换(Transformations)操作而言,消除数据的气候平均是一个很好的例子。转换操作对分组的对象进行操作,但不改变原数据的维度尺寸。...xarray 通过使用Groupby 算法使这些类型的转换变得容易。下面给出了计算去除月份温度差异的海温月数据。

    11.5K74

    Xarray,不用ArcGIS,所有地理空间绘图全搞定...

    空间绘图神器-Xarray 今天直接给大家介绍一下我最近常用的空间绘图神器-Xarray,之所以给大家推荐这个工具包,是因为我最近在空间可视化课程中免费新增的部分内容,其就是使用Xarray工具绘制的。...多种数据格式支持:Xarray支持多种常见的数据格式,如NetCDF、HDF5等,方便数据的读取和写入。...效率:Xarray通过对数据进行坐标对齐,能够高效地处理大型数据集,减少了内存使用和计算时间。...应用场景: 气象数据分析:Xarray在气象领域广泛应用,可以处理和分析大规模的气象观测数据、模拟数据等,进行天气预测、气候变化研究等工作。...气候建模:Xarray能够处理复杂的气候模型输出数据,用于构建和评估气候模型,以及研究气候变化、极端事件等。

    51330

    python计算与绘制WRF降水量

    前言 1.使用os库循环读取文件夹下的wrf‍数据,并用nc库的dataset读取,可使用wrf_list = [Dataset(f) for f in wrf_files] ,wrf_files是os...读取形成的文件列表 2.使用wrfpython的getvar读取多个wrf文件的RAINC,RAINNC,RAINSH,利用cat将多时次数据合并 例如,RAINC = getvar(wrf_list,...# 导入数据读取模块 import numpy as np import pandas as pd from netCDF4 import Dataset import xarray as xr #...(labelsize=15) # 添加标题 plt.title('08-08 1800 - 08-09 0600(UTC)', loc='left', fontsize=20) plt.show() 每小时降水量组图绘制...为了代码不繁琐直接利用xarray的plot作图,更多细致的作图敬请自己实现,以下示例小时降水量的组图绘制 此处使用了xarray的data.diff计算每小时的降水量 wrfout中的降水变量都是累计降水量

    55311

    龙行龘龘!如何批量提取wrfout变量存为nc

    为了更好地处理WRF模型输出数据(当然因为wrfout文件太大了!),我们经常需要批量提取其中的变量,并将提取的数据保存为NetCDF格式(.nc文件),这样可以方便我们后续的分析和可视化操作。..., mode='w', format='NETCDF4', group=None, engine=None, encoding=None): """将 xarray 数据写入 NetCDF 格式的输出文件...使用适用于 wrf-python 的 xarray 数据结构。将投影对象转换为字符串以便作为 NetCDF 属性使用。..., mode='w', format='NETCDF4', group=None, encoding=None): """将 xarray 写入 NetCDF 格式的输出文件 使用适用于...将投影对象转换为字符串,以便可以将其作为 NetCDF 属性使用 :param xarray_array: xarray.DataArray :param mode: 文件打开模式,默认为

    29410

    xarray | 序列化及输入输出

    比如 netCDF 或 OPeNDAP 只要 xarray 对象的内部数据结构不变, Pickle 就能工作。因为 xarray 的内部设计是重新定义的,所以无法保证能够适用于所有版本。...无需外部的库即可很容易的转换为 pickle,json 或 geojson。所有的值都会转换为列表,因此字典可以很大。 netCDF 推荐使用 netCDF 存储 xarray 数据结构。...netCDF是源于地理科学的自描述二进制数据格式。 xarray 基于 netCDF 数据模式,因此磁盘中的 netCDF文件和 Dataset 对象是对应的。...写入编码数据 你也可以自定义 xarray 如何为 netCDF 文件中的每个数据集变量提供编码信息。encoding 参数接收包含编码信息的键值对字典。...这些信息会保存为 netCDF 变量的编码信息,从而使得 xarray 能够更准确的读取编码数据。 注意: 是否使用编码选项是可选的。

    6.5K22

    DEEPSEEK如何回答什么编程语言最适合大气科学

    大气科学涉及气象学、气候学、空气质量等,通常会处理大量的时空数据,比如气象观测、卫星数据、模式输出等。这些数据通常是多维的,比如温度、压强、风速等变量在不同时间和空间上的分布。...Python应该是一个热门选择,因为它的库生态系统很强大,比如NumPy、SciPy、xarray用于数据处理,Matplotlib、Cartopy用于可视化,还有MetPy这样的气象专用库。...* 在气象学、气候学等大气科学领域,编程语言的选择通常取决于具体任务(数据处理、模式开发、可视化等)和社区生态。以下是主要语言的优缺点及适用场景: 1....Python:通用首选 优势: 生态系统强大:xarray(处理NetCDF/HDF数据)、MetPy(气象专用工具)、Cartopy(地图可视化)、Dask(并行计算)等库几乎成为行业标准。...典型场景:气候统计、论文级可视化。 5. NCL/IDL:逐渐被淘汰 现状:NCAR已停止维护NCL,推荐转向Python;IDL因商业闭源逐渐边缘化。 遗留用途:部分旧脚本或课程仍在使用。 6.

    10510

    气象数据的常用格式以及处理的工具

    这次我们来简单了解下气象数据常用的格式以及处理的工具,常用的数据格式包括普通的二进制格式、文本数据、NetCDF、HDF4/5以及GRIB1/2数据。...二进制文件和文本数据   气象中的二进制文件是指利用ASCII及扩展ASCII字符编写的数据或程序指令的文件,一般没有格式,用文本编辑器打开只能看到无意义的乱码,需要特定的解码说明才能使用,例如气象雷达的数据...(Network Common Data Form)   NetCDF数据是常用的气象和卫星数据存储的数据格式,结构形式包含维数、变量、属性和数据四个子域,公众号前几期有过利用python对netCDF...数据处理的介绍,有感兴趣的同学可以关注公众号查看历史精彩文章使用python处理NetCDF格式文件,这里介绍大家利用CDO如何处理netCDF格式的文件   CDO(Climate Data Operators...)是用来处理气候数据的命令行的集合,支持netCDF3/4以及Grib1/2数据格式,常用功能: cdo info a.nc ###查看文件信息 cdo -f grb copy a.nc a.grb

    11.1K1413

    从 netCDF 文件导出到 *.csv 文件

    1、问题背景问题:需要将 netCDF 文件的数据导出到 *.csv 文件,但希望在不使用循环的情况下完成。目前使用的代码存在性能和代码可读性问题,因为使用了三重循环。...2、解决方案方法:为了解决上述问题,可以使用 xarray 库来将 netCDF 文件中的数据转换为表格格式,然后使用 csv 库将表格格式的数据导出到 *.csv 文件。...使用 data_to_table() 函数将 netCDF 文件中的数据转换为表格格式。使用 export_to_csv() 函数将表格格式的数据导出到 *.csv 文件。...export_to_csv(dataset, 'var_name', 'path/to/csv_file.csv')优点:性能优化:使用 xarray 库可以有效地将 netCDF 文件中的数据转换为表格格式...代码可读性增强:使用 xarray 库可以简化代码,使其更加易于阅读和维护。局限性:如果 netCDF 文件中的数据量非常大,则可能需要对代码进行进一步优化以提高导出数据的速度。

    19710

    xarray系列|WRF模式前处理和后处理

    WRF模式前处理 WRF模式后处理 数据提取 投影转换 插值 可视化 本文除了xarray之外,主要使用了 salem 和 xesmf 这两个库,salem 主要是进行前处理和部分后处理操作,xesmf...这里就数据提取、投影转换、插值和可视化几个部分说一下。 由于WRF模式的输出并不完全兼容NetCDF格式的CF标准,所以无法直接利用 xarray 的很多函数。...所以这里读取数据的时候需要先用 netCDF4 读取,然后 salem 进行转换。...投影转换 一般情况下是不需要进行投影转换的,除非在需要和其它投影的数据进行对比分析。这里我们使用 xesmf 进行网格的转换。...这里也可以使用 xarray 自带的插值方法进行插值,或者使用 salem 提供的函数进行插值,比如 .wrf_zlevel 进行垂直插值: ds.isel(time=1).salem.wrf_zlevel

    3.4K61

    xarray系列|WRF模式前处理和后处理

    WRF模式前处理 WRF模式后处理 数据提取 投影转换 插值 可视化 本文除了xarray之外,主要使用了 salem 和 xesmf 这两个库,salem 主要是进行前处理和部分后处理操作,xesmf...这里就数据提取、投影转换、插值和可视化几个部分说一下。 由于WRF模式的输出并不完全兼容NetCDF格式的CF标准,所以无法直接利用 xarray 的很多函数。...所以这里读取数据的时候需要先用 netCDF4 读取,然后 salem 进行转换。...投影转换 一般情况下是不需要进行投影转换的,除非在需要和其它投影的数据进行对比分析。这里我们使用 xesmf 进行网格的转换。...这里也可以使用 xarray 自带的插值方法进行插值,或者使用 salem 提供的函数进行插值,比如 .wrf_zlevel 进行垂直插值: ds.isel(time=1).salem.wrf_zlevel

    5.3K66

    学习笔记:基于where函数的wrf数据优雅索引

    学习笔记:基于where函数的wrf数据优雅索引 前言 在气象与气候研究领域,WRF(Weather Research and Forecasting)模型生成的数据集因其高分辨率和丰富的气象变量而被广泛应用于科研与业务预报中...where函数作为一个条件索引神器,它允许我们在不修改原数据结构的前提下,灵活地根据预设条件定位到数据集中的特定部分,这对于处理多维度、大规模的WRF数据尤为重要。...WRF数据结构简介:介绍WRF输出文件的基本格式(如NetCDF),以及如何使用Python中的xarray或netCDF4等库来便捷地加载与操作这些数据。...无论您是气象学领域的研究人员,还是对WRF数据处理感兴趣的开发者,希望通过这篇笔记,能够让您掌握基于where函数的高效数据索引技能,使您的WRF数据探索之旅变得更加流畅与高效。...在numpy, pandas, 以及我们讨论重点——xarray库中,where函数的核心作用是根据布尔数组(或条件表达式)来过滤数据,类似于SQL中的WHERE子句。

    10910

    Zarr真的能替代NetCDF4和HDF5吗

    已有相关人员测试了通过netCDF和Zarr两种方式处理NOAA在AWS的GOES卫星数据并进行绘图的效率,结果发现:使用Zarr格式比netCDF格式效率提高非常明显。...Zarr和NetCDF格式效率对比 之前也大概了解过 Zarr,之所以要专门介绍 Zarr 是因为在处理数据的过程中,由于需要进行大文件读写操作,而使用 NetCDF 格式写入数据时速度很慢,并且为了避免对文件进行分割实现文件的并行读写...在初步尝试时,使用 Zarr 格式写入数据时比使用 xarray 写入 NetCDF 文件快了 2 倍(未进行数据压缩)。...值得注意的是:xarray 不支持通过 netCDF 格式的增量写文件,支持 Zarr 格式的增量写文件。增量读写在一些场景下是非常关键的,尤其是在数据集较大内存不足的情况下。...在大量文件读写方面我已经逐渐转向 Zarr 了,后续可能也会更新一些这方面的推送,毕竟目前xarray在文件并行读写方面Zarr的支持比netCDF要好一些。

    2.3K30

    利用 pandas 和 xarray 整理气象站点数据

    利用 pandas 和 xarray 整理气象站点数据 平时用 xarray 库在处理 nc 格式的数据非常方便,但偶尔还是要用到一些站点数据来辅助分析,而站点数据一般都是用文本文件存储的,比如下图这种格式...用Python处理这种文本列表就需要用上 pandas 库了, xarray 库就是基于 pandas 的,虽然天天在用 xarray ,但是这还是第一次正儿八经用 pandas 处理数据,就当做一次学习的过程啦...('Station_test.nc') 至此,文本格式的站点数据就转化成了便于读取和分析的 nc 数据了,结构如开头那张目标示意图所示。...三、 数据处理实例 1. 2012年夏季平均气温的空间分布 此例所用数据即上面生成的数据 ds = xr.open_dataset('Station_test.nc') temp = ds['temp'...').mean() TibetWindAnom = TibetWind.groupby( 'time.month') - TibetWind.groupby('time.month').mean

    10.2K41
    领券