首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas库常用方法、函数集合

Pandas是Python数据分析处理的核心第三方库,它使用二维数组形式,类似Excel表格,并封装了很多实用的函数方法,让你可以轻松地对数据集进行各种操作。...to_json:导出Json文件 read_html:读取网页中HTML表格数据 to_html:导出网页HTML表格 read_clipboard:读取剪切板数据 to_clipboard:导出数据到剪切板...格式 to_sql:向数据库写入dataframe格式数据 连接 合并 重塑 merge:根据指定键关联连接多个dataframe,类似sql中的join concat:合并多个dataframe,类似...按照指定的列或多个列对数据进行分组 agg:对每个分组应用自定义的聚合函数 transform:对每个分组应用转换函数,返回与原始数据形状相同的结果 rank:计算元素在每个分组中的排名 filter:根据分组的某些属性筛选数据...:绘制堆积图 pandas.DataFrame.plot.bar:绘制柱状图 pandas.DataFrame.plot.barh:绘制水平条形图 pandas.DataFrame.plot.box:绘制箱线图

31510
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    精品课 - Python 数据分析

    我把整套知识体系分成四个模块: Python 基础: 已直播完 (录播已上传) Python 数据分析:这次的课程,NumPy, Pandas, SciPy Python 数据可视化:Matplotlib...对于功能,无非从它能干什么而目的导向去学习,比如如何插值,如何积分,如何优化,等等。 HOW WELL:怎么学好三者?...Pandas WHY 下图左边的「二维 NumPy 数组」 仅仅储存了一组数值 (具体代表什么意思却不知道),而右边的「数据帧 DataFrame」一看就知道这是平安银行和茅台从 2018-1-3 到...---- WHAT Pandas DataFrame 是一种数据结构 (Series 可不严谨的看成一维的 DataFrame,而 Panel 已经被废弃)。...水平面上的灰点是网格 红线是终值条件 (产品在到期日支付函数) 两条深青线是边界条件 (产品在标的上下界时的支付) 蓝点是期权值 (产品在 0 时点的值) 从 T4 到 T0 一步步解的 (从后往前解

    3.3K40

    每个数据科学家都应该知道的20个NumPy操作

    NumPy (Numerical Python)是一个科学计算包,它提供了许多创建和操作数字数组的方法。...我们创建了一个由2到10之间的整数组成的3x2数组。 2. 0到1之间的随机浮点数 ? 浮点数在0和1之间的一维数组。可以用于创建随机噪声数据。 3....重塑 使用reshape函数,它会对数组进行重塑。A的形状是(3,4)大小是12。 ? 可以指定每个维度上的大小,只要保证与原大小相同即可 ? 我们不需要指定每个维度的大小。...数组合并 在某些情况下,我们可能需要组合数组。NumPy提供了以多种不同方式组合数组的函数和方法。 13. 连接 这与pandas的合并的功能很相似。 ?...我们可以使用重塑函数将这些数组转换为列向量,然后进行垂直连接。 ? 14. Vstack 它用于垂直堆叠数组(行在彼此之上)。 ? 它也适用于高维数组。 ? 15.

    2.4K20

    Pandas进阶修炼120题|完整版

    从读取数据到高级操作全部包含,希望可以通过刷题的方式来完整学习pandas中数据处理的各种方法,当然如果你是高手,也欢迎尝试给出与答案不同的解法。...1 创建DataFrame 题目:将下面的字典创建为DataFrame data = {"grammer":["Python","C","Java","GO","R","SQL","PHP","Python...= np.arange(0,100,5) df2 = pd.DataFrame(tem) 84 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个指定分布...低'} ) 103 数据计算 题目:从dataframe提取数据 难度:⭐⭐⭐ 备注 从上一题数据中,对薪资水平列每隔20行进行一次抽样 期望结果 ?...()[::-1][7] 107 数据处理 题目:反转df的行 难度:⭐⭐ 答案 df.iloc[::-1, :] 108 数据重塑 题目:按照多列对数据进行合并 难度:⭐⭐ 输入 df1= pd.DataFrame

    12.7K106

    Python 数据分析(PYDA)第三版(四)

    在某些情况下,以这种格式处理数据可能更加困难;您可能更喜欢拥有一个 DataFrame,其中包含一个以date列中的时间戳为索引的每个不同item值的列。...条形图 plot.bar() 和 plot.barh() 分别绘制垂直和水平条形图。...在这种情况下,Series 或 DataFrame 的索引将用作 x(bar)或 y(barh)刻度(请参见 水平和垂直条形图): In [66]: fig, axes = plt.subplots(2...alpha=0.7) Out[68]: In [69]: data.plot.barh(ax=axes[1], color="black", alpha=0.7) 图 9.15:水平和垂直条形图...我们通过传递stacked=True从 DataFrame 创建堆叠条形图,导致每行中的值水平堆叠在一起(参见 DataFrame 堆叠条形图): In [75]: df.plot.barh(stacked

    31200

    玩转数据处理120题|Pandas版本

    __version__) # 0.25.1 82 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100随机数 Python解法 tem = np.random.randint...(1,100,20) df1 = pd.DataFrame(tem) 83 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20个0-100固定步长的数 Python...解法 tem = np.arange(0,100,5) df2 = pd.DataFrame(tem) 84 数据创建 题目:从NumPy数组创建DataFrame 难度:⭐ 备注 使用numpy生成20...'低'} ) 103 数据计算 题目:从dataframe提取数据 难度:⭐⭐⭐ 备注 从上一题数据中,对薪资水平列每隔20行进行一次抽样 期望结果 ?...Python解法 df2.iloc[::20, :][['薪资水平']] 104 数据处理 题目:将数据取消使用科学计数法 难度:⭐⭐ 输入 df = pd.DataFrame(np.random.random

    7.6K41

    Pandas数据应用:图像处理

    一、引言Pandas 是一个强大的 Python 数据分析库,主要用于处理结构化数据。尽管它并不是专门为图像处理设计的,但在某些情况下,我们可以利用 Pandas 的强大功能来辅助图像处理任务。...Pandas 的 DataFrame 可以用来存储和操作这些像素值,从而实现对图像的基本处理。1. 图像读取与显示要使用 Pandas 处理图像,首先需要将图像转换为 DataFrame 格式。...# 如果需要交换RGB到BGRbgr_img_array = img_array[:, :, ::-1]df_bgr_img = pd.DataFrame(bgr_img_array)四、常见报错及避免措施...如果是多维数组,检查是否正确展平或重塑。...# 明确指定数据类型df_img = pd.DataFrame(img_array.astype(np.float32))五、总结虽然 Pandas 并不是专门用于图像处理的工具,但在某些场景下,它可以作为辅助工具帮助我们更好地理解和操作图像数据

    9210

    Python之数据规整化:清理、转换、合并、重塑

    Python之数据规整化:清理、转换、合并、重塑 1. 合并数据集 pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。...pandas.concat可以沿着一条轴将多个对象堆叠到一起。 实例方法combine_first可以将重复数据编接在一起,用一个对象中的值填充另一个对象中的缺失值。 2....重塑和轴向旋转 有许多用于重新排列表格型数据的基础运算。这些函数也称作重塑(reshape)或轴向旋转(pivot)运算。...4.1 重塑层次化索引 层次化索引为DataFrame数据的重排任务提供了良好的一致性方式。主要两种功能: stack:将数据的列“旋转”为行。...5.2 替换值 replace可以由一个带替换值组成的列表以及一个替换值 data.replace([-999,-1000],np.nan) 5.3 重命名轴索引 轴标签也可通函数或映射进行转换,从而得到一个新对象轴还可以被就地修改

    3.1K60

    Numpy和pandas的使用技巧

    '''NumPy数组实际上被称为ndarray NumPy最重要的一个特点是N维数组对象ndarray,它是一系列同类型数据的集合 1、创建数组,将序列传递给numpy的array()函数即可,从现有的数据创建数组...np.vstack((v1,v2)) vertical 垂直,stack堆叠、累加 矩阵水平拼接 np.hstack((v1,v2)) horizontal 水平的 △ np.c_[]...:相同类型的数组,axis:沿着它连接数组的轴,默认为 0(垂直连接)1(水平连接) n.flatten(order=)返回一份数组拷贝,对拷贝的修改不影响原数组 n.ravel(a,order...数组的行列式 n.solve() 求解线性矩阵方程 ''' 按索引删除行 data = data.drop([i]) 重置索引 data = data.reset_index() 转换数据格式到数字...Python pandas数据分析中常用方法 https://blog.csdn.net/qq_16234613/article/details/64217337 重置索引 import pandas

    3.5K30

    Python替代Excel Vba系列(三):pandas处理不规范数据

    但是身经百战的你肯定会觉得,前2篇例子中的数据太规范了,如果把数据导入到数据库还是可以方便解决问题的。 因此,本文将使用稍微复杂的数据做演示,充分说明 pandas 是如何灵活处理各种数据。...注意索引是从0开始算。 values=arr[3:],从第4行往后一大片作为值。 pd.DataFrame(values,columns=header) , 生成一个 DataFrame 。...ffill 表示用上一个有效值填充。 合并单元格很多时候就是第一个有值,其他为空,ffill 填充方式刚好适合这样的情况。 ---- 现在数据美如画了。...---- 重塑 要理解 pandas 中的重塑,先要了解 DataFrame 的构成。...如下是一个 DataFrame 的组成部分: 红框中的是 DataFrame 的值部分(values) 上方深蓝色框中是 DataFrame 的列索引(columns),注意,为什么方框不是一行?

    5K30

    Python数据分析之数据预处理(数据清洗、数据合并、数据重塑、数据转换)学习笔记

    参考链接: Python | pandas 合并merge,联接join和级联concat 文章目录  1....数据清洗  1.1 空值和缺失值的处理  ​ 空值一般表示数据未知、不适用或将在以后添加数据。缺失值是指数据集中某个或某些属性的值是不完整的。  ​...(2)duplicated()方法支持从前向后( first)和从后向前(last)两种重复值查找模式,默认是从前向后查找判断重复值的。换句话说,就是将后出现的相同条目判断为重复值。 ...例如,通过爬虫采集到的数据都是整型的数据,在使用数据时希望保留两位小数点,这时就需要将数据的类型转换成浮点型。  ​...数据重塑  3.1 重塑层次化索引  ​ Pandas中重塑层次化索引的操作主要是 stack()方法和 unstack()方法,前者是将数据的列“旋转”为行,后者是将数据的行“旋转”为列。

    5.5K00
    领券