首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分析篇 | Pandas基础用法6【完结篇】

In [344]: frame = pd.DataFrame(np.array([1, 2])) 向上转型 与其它类型合并,要用到向上转型,这里指的是现有类型转换为另一种类型,如int 变为 float...A float32 B float32 C float32 dtype: object 用 astype() 把一列或多列转换为指定类型 。...loc() 尝试分配当前的数据类型,而 [] 则会右方获取数据类型并进行覆盖。...这是因为,数据有时存储的是正确类型,但在保存却存成了 object 类型,此时,用 DataFrame.infer_objects() 与 Series.infer_objects() 方法即可把数据软转换为正确的类型...设置为 errors='coerce' ,pandas 会忽略错误,强制把问题数据转换为 pd.NaT(datetime 与 timedelta),或 np.nan(数值型)。

4K10
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas中文官档~基础用法6

In [344]: frame = pd.DataFrame(np.array([1, 2])) 向上转型 与其它类型合并,要用到向上转型,这里指的是现有类型转换为另一种类型,如int 变为 float...A float32 B float32 C float32 dtype: object 用 astype() 把一列或多列转换为指定类型 。...loc() 尝试分配当前的数据类型,而 [] 则会右方获取数据类型并进行覆盖。...这是因为,数据有时存储的是正确类型,但在保存却存成了 object 类型,此时,用 DataFrame.infer_objects() 与 Series.infer_objects() 方法即可把数据软转换为正确的类型...设置为 errors='coerce' ,pandas 会忽略错误,强制把问题数据转换为 pd.NaT(datetime 与 timedelta),或 np.nan(数值型)。

4.2K20

Pandas 2.2 中文官方教程和指南(九·三)

重新索引填充 `reindex()` 接受一个可选参数`method`,该参数是以下表中选择的填充方法: | 方法 | 动作 | | --- | --- | | pad / ffill | 向前填充值...dtype: object 注意 当尝试使用astype()和loc()将一部分列转换为指定类型,会发生向上转型。...loc()尝试适应我们分配给当前 dtype 的内容,而[]将覆盖它们,右侧获取 dtype。因此,以下代码片段会产生意外结果。...dtype: object 注意 当尝试使用astype()和loc()将一部分列转换为指定类型,会发生向上转换。...loc() 尝试适应我们正在分配的当前数据类型,而[]将覆盖它们,右侧获取数据类型。因此,以下代码片段会产生意外结果。

22900

5招学会Pandas数据类型转化

加载数据指定数据类型 一般来说,为了省事我都是直接pd.DataFrame(data)或pd.read_xx(filename)就完事了。...同样,在创建DataFrame类型数据也可以通过dtype参数进行数据类型设定(案例是对全部字段进行设置)。...时间戳转换为日期等 数字字符串按照format转换为日期 如果遇到无法转换的情况,默认情况下会报错,可以通过参数设置errors='coerce'将无法转换的设置为NaT。...']) Out[26]: TimedeltaIndex(['1 days 06:05:01.000030', '0 days 00:00:00.000015500', NaT], dtype='timedelta64...数据类型有以下几种: 数字:number 或 int、float 布尔:bool 时间:datetime64 时间差:timedelta64 类别:category 字符串:string 对象:object

1.3K30

Pandas 2.2 中文官方教程和指南(九·一)

例如,当添加两个 DataFrame 对象,您可能希望将 NaN 视为 0,除非两个 DataFrame 都缺少该值,此时结果将为 NaN(如果需要,您可以稍后使用 fillna 将 NaN换为其他值...重新索引填充 `reindex()`接受一个可选参数`method`,这是以下表中选择的填充方法: | 方法 | 动作 | | --- | --- | | pad / ffill | 向前填充值...dtype: object 注意 当尝试使用astype()和loc()将列的子集转换为指定类型,将发生向上转换。...loc()尝试适应我们分配给当前数据类型的内容,而[]将覆盖它们,右侧获取数据类型。因此,以下代码片段会产生意外结果。...例如,当添加两个 DataFrame 对象,您可能希望将 NaN 视为 0,除非两个 DataFrame 都缺少该值,此时结果将为 NaN(如果需要,您可以稍后使用 fillna 将 NaN换为其他值

8300

Pandas 2.2 中文官方教程和指南(十六)

numpy.nan适用于 NumPy 数据类型。使用 NumPy 数据类型的缺点是原始数据类型将被强制转换为np.float64或object。...在转换部分中解释了将其转换为这些 dtype 的简单方法。 算术和比较操作中的传播 一般来说,在涉及 NA 的操作中,缺失值会传播。当其中一个操作数未知,操作的结果也是未知的。...numpy.nan 适用于 NumPy 数据类型。 使用 NumPy 数据类型的缺点是原始数据类型将被强制转换为 np.float64 或 object。...在转换部分中解释了将其转换为这些 dtype 的简单方法。 算术和比较操作中的传播 一般来说,在涉及NA的操作中,缺失值会传播。当其中一个操作数未知,操作的结果也是未知的。...用正则表达式将‘.’替换为NaN

16910

数据导入与预处理-拓展-pandas时间数据处理02

:00.000020500') to_timedelta生成-构建一个Timedelta序列 pd.to_timedelta(['2 days 04:06:10.00006', '15.5us', 'nan...13 3.6 相互转换 时间戳与时期之间的转换 时间戳时间段 # 时间戳与时期之间的转换:pd.to_period()、pd.to_timestamp() # 每月最后一日,转化为每月 rng =...pandas.core.indexes.datetimes.DatetimeIndex'> print('*'*10) 时间段时间戳...r.mean()-r.std()*2,label='mean-std()*2') plt.legend() plt.show() 输出为: 对于shift函数而言,作用在datetime64为索引的序列上,...4 2020-11-30 10 2020-12-31 4 Freq: M, dtype: int32 在resample中要特别注意组边界值的处理情况,默认情况下起始值的计算方法是最小值时间戳对应日期的午夜

1.9K60

Pandas 2.2 中文官方教程和指南(二十五·二)

展示了一个 csv 文件中获取数据并按块创建存储的函数,同时进行日期解析。...HTML 表格 HDFStore HDFStores 文档 使用时间戳索引进行简单查询 使用链接的多表层次结构管理异构数据 GH 3032 合并具有数百万行的磁盘上的表 在多个进程/线程多个进程/线程写入存储避免不一致性...点击这里查看 csv 文件逐块创建存储 在创建唯一索引的同时向存储追加数据 大数据工作流 读取一系列文件,然后在追加为存储提供全局唯一索引 在具有低组密度的 HDFStore 上进行分组 在具有高组密度的...[ns] New Dates datetime64[ns] Delta timedelta64[ns] dtype: object 另一个示例 可以使用 np.nan 将值设置为...[ns] In [239]: y[1] = np.nan In [240]: y Out[240]: 0 NaT 1 NaT 2 1 days dtype: timedelta64

11500
领券