首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何在pandas数据框中插入重复的列,并从新列的值中删除最后3个数字?

在pandas数据框中插入重复的列,并从新列的值中删除最后3个数字的步骤如下:

  1. 首先,创建一个pandas数据框,可以使用pd.DataFrame()函数或者其他方式创建一个数据框。
  2. 插入重复的列,可以使用df['新列名'] = df['已存在的列名']的方式,将已存在的列复制到新列中。
  3. 对新列的值进行处理,删除最后3个数字。可以使用字符串切片的方式,例如df['新列名'] = df['新列名'].str[:-3],这样就可以删除新列中每个值的最后3个字符。

以下是一个示例代码:

代码语言:txt
复制
import pandas as pd

# 创建一个数据框
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 插入重复的列
df['C'] = df['A']

# 删除新列的最后3个数字
df['C'] = df['C'].astype(str).str[:-3]

# 打印结果
print(df)

输出结果为:

代码语言:txt
复制
   A  B  C
0  1  4
1  2  5
2  3  6

在这个示例中,我们创建了一个包含两列的数据框,然后将列'A'复制到了新列'C'中。接着,我们将新列'C'的值转换为字符串类型,并使用字符串切片的方式删除了最后3个字符。最后,打印出了处理后的数据框。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

【Python】基于某些删除数据重复

从结果知,参数为默认时,是在原数据copy上删除数据,保留重复数据第一条返回新数据。 感兴趣可以打印name数据,删重操作不影响name。...从结果知,参数keep='last',是在原数据copy上删除数据,保留重复数据最后一条返回新数据,不影响原始数据name。...从结果知,参数keep=False,是把原数据copy一份,在copy数据删除全部重复数据返回新数据,不影响原始数据name。...原始数据只有第二行和最后一行存在重复,默认保留第一条,故删除最后一条得到新数据。 想要根据更多数去重,可以在subset添加。...但是对于两中元素顺序相反数据去重,drop_duplicates函数无能为力。 如需处理这种类型数据去重问题,参见本公众号文章【Python】基于多组合删除数据重复。 -end-

19.1K31

【Python】基于多组合删除数据重复

最近公司在做关联图谱项目,想挖掘团伙犯罪。在准备关系数据时需要根据两组合删除数据重复,两中元素顺序可能是相反。...本文介绍一句语句解决多组合删除数据重复问题。 一、举一个小例子 在Python中有一个包含3数据,希望根据name1和name2组合(在两行顺序不一样)消除重复项。...二、基于两删除数据重复 1 加载数据 # coding: utf-8 import os #导入设置路径库 import pandas as pd #导入数据处理库...import numpy as np #导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于多组合删除数据重复') #把路径改为数据存放路径 df =...从上图可以看出用set替换frozense会报不可哈希错误。 三、把代码推广到多 解决多组合删除数据重复问题,只要把代码取两代码变成多即可。

14.6K30
  • numpy和pandas库实战——批量得到文件夹下多个CSV文件第一数据求其最

    /前言/ 前几天群里有个小伙伴问了一个问题,关于Python读取文件夹下多个CSV文件第一数据求其最大和最小,大家讨论甚为激烈,在此总结了两个方法,希望后面有遇到该问题小伙伴可以少走弯路...通常我们通过Python来处理数据,用比较多两个库就是numpy和pandas,在本篇文章,将分别利用两个库来进行操作。...3、其中使用pandas库来实现读取文件夹下多个CSV文件第一数据求其最大和最小代码如下图所示。 ? 4、通过pandas库求取结果如下图所示。 ?...通过该方法,便可以快速取到文件夹下所有文件第一最大和最小。 5、下面使用numpy库来实现读取文件夹下多个CSV文件第一数据求其最大和最小代码如下图所示。 ?.../小结/ 本文基于Python,使用numpy库和pandas库实现了读取文件夹下多个CSV文件,求取文件第一数据最大和最小,当然除了这两种方法之外,肯定还有其他方法也可以做得到,欢迎大家积极探讨

    9.4K20

    使用R或者Python编程语言完成Excel基础操作

    熟悉界面:打开Excel熟悉其界面,包括菜单栏、工具栏、功能区等。 掌握基本操作:学习如何插入删除行/,重命名工作表,以及基本数据输入。...使用公式:学习使用Excel基本公式,SUM、AVERAGE、VLOOKUP等,理解相对引用和绝对引用概念。 数据格式设置:了解如何设置数据格式,包括数字、货币、日期、百分比等。...增加数据 插入行或:右键点击行号或标,选择“插入”。 输入数据:直接在单元格输入数据。 2. 删除数据 删除行或:右键点击行号或标,选择“删除”。...图表 插入图表:根据数据快速创建各种类型图表,柱状图、折线图、饼图等。 自定义图表:调整图表样式、布局、图例等。 文本处理 文本分列:将一数据根据分隔符分成多。...row.append(row[-2] + row[-1]) # 假设 'Sales' 在倒数第二,'Customers' 在最后 删除 # 删除 'Customers' data[1:]

    18910

    我用Python展示Excel中常用20个操

    PandasPandas,可直接对数据进行条件筛选,例如同样进行单个条件(薪资大于5000)筛选可以使用df[df['薪资水平']>5000],如果使用多个条件筛选只需要使用&()与|(或...数据插入 说明:在指定位置插入指定数据 Excel 在Excel我们可以将光标放在指定位置右键增加一行/,当然也可以在添加时对数据进行一些计算,比如我们就可以使用IF函数(=IF(G2>10000...数据删除 说明:删除指定行//单元格 Excel 在Excel删除数据十分简单,找到需要删除数据右键删除即可,比如删除刚刚生成最后 ?...Pandaspandas删除数据也很简单,比如删除最后使用del df['new_col']即可 ?...数据去重 说明:对重复按照指定要求处理 Excel 在Excel可以通过点击数据—>删除重复按钮选择需要去重即可,例如对示例数据按照创建时间进行去重,可以发现去掉了196 个重复,保留了

    5.6K10

    Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索)

    ,我自己认为难度系数很高,我仅仅用了64个文字形容词就生成了她,很有初恋感觉,符合审美观,对于计算机来说她是一组数字,可是这个数字是怎么推断出来就是很复杂了,我们在模型训练可以看到基本上到处都存在着...Pandas处理,在最基础OpenCV也会有很多Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好操作图片数组真的是相当麻烦,可以在很多...dtype:数据类型 copy:默认是false,也就是不拷贝。从input输入拷贝数据。...DataFrame.insert(loc, column, value) #在特殊地点loc[数字]插入column[列名]某数据 DataFrame.iter()...DataFrame.isin(values) #是否包含数据元素 DataFrame.where(cond[, other, inplace, …])

    1.3K30

    pandas 入门 1 :数据创建和绘制

    pandas,这些是dataframe索引一部分。您可以将索引视为sql表主键,但允许索引具有重复项。...#删除csv文件 import os os.remove(Location) 准备数据 我们数据包括婴儿名字和1880年出生人数。我们已经知道我们有5条记录而且没有任何记录丢失(非空)。...Out[1]: dtype('int64') 您所见,Births类型为int64,因此此列不会出现浮点数(十进制数字)或字母数字字符。...对数据进行排序选择顶行 使用max()属性查找最大 # Method 1: Sorted = df.sort_values(['Births'], ascending=False) Sorted.head...与该表一起,最终用户清楚地了解Mel是数据集中最受欢迎婴儿名称。plot()是一个方便属性,pandas可以让您轻松地在数据绘制数据。我们学习了如何在上一节中找到Births最大

    6.1K10

    如何用 Python 执行常见 Excel 和 SQL 任务

    有关数据结构,列表和词典,如何在 Python 运行更多信息,本教程将有所帮助。...这不是很好,由于实际数字顺序被破坏,这使得 Rank 无用,特别是使用 Pandas 默认提供编号索引。 幸运是,使用内置 Python 方法:del,删除变得很容易。 ?...现在我们已经删除了逗号,我们可以轻易地将转换为数字。 ? 现在我们可以计算这平均值。 ?...现在,可以对我们以前不能做的人均 GDP 进行各种计算,包括通过不同过滤确定百分位数值。 选择/过滤数据 任何数据分析师基本需求是将大型数据集分割成有价值结果。...幸运是,Pandas 拥有强大数据透视表方法。 ? ? 你会看到我们收集了一些不需要。幸运是,使用 Pandas drop 方法,你可以轻松地删除几列。 ? ?

    10.8K60

    用Python执行SQL、Excel常见任务?10个方法全搞定!

    有关数据结构,列表和词典,如何在 Python 运行更多信息,本篇将有所帮助。...这不是很好,由于实际数字顺序被破坏,这使得 Rank 无用,特别是使用 Pandas 默认提供编号索引。 幸运是,使用内置 Python 方法:del,删除变得很容易。 ?...现在我们已经删除了逗号,我们可以轻易地将转换为数字。 ? 现在我们可以计算这平均值。 ?...现在,可以对我们以前不能做的人均 GDP 进行各种计算,包括通过不同过滤确定百分位数值。 07 选择/过滤数据 任何数据分析师基本需求是将大型数据集分割成有价值结果。...幸运是,Pandas 拥有强大数据透视表方法。 ? ? 你会看到我们收集了一些不需要。幸运是,使用 Pandas drop 方法,你可以轻松地删除几列。 ? ?

    8.3K20

    Excel表格中最经典36个小技巧,全在这儿了

    技巧4、查找重复 选取数据区域 - 开始 - 条件格式 - 突出显示单元格规则 - 重复。 ? 显示效果: ? 技巧5、删除重复 选取含重复单元格区域,数据 - 删除重复。 ?...如果要隐藏单元格,选取该区域,右键 - 设置单元格格式 - 数字 - 自定义 - 右侧文本输入三个分号 ;;; ?...技巧10、单元格输入00001 如果在单元格输入以0开头数字,可以输入前把格式设置成文本格式,如果想固定位数(5位)不足用0补齐,可以: 选取该区域,右键 - 设置单元格格式 - 数字 - 自定义...技巧13、防止重复录入 选取要防止重复录入单元格区域,数据 - 有效性 - 自定义 - 公式: ? 如果重复录入,会提示错误清除录入内容 ?...2 引用单元格内容法。如果销售员在单元格B4:B8区域里,在“来源”后输入或点最后折叠按钮选这个区域。如下图所示。 ? 进行如上设置后,我们就可以在销售员一看到下拉菜单了。

    7.9K21

    Pandas图鉴(二):Series 和 Index

    Pandas没有像关系型数据库那样 "唯一约束"(该功能[4]仍在试验),但它有一些函数来检查索引是否唯一,并以各种方式删除重复。 有时,但一索引不足以唯一地识别某行。...下面是插入数值一种方式和删除数值两种方式: 第二种删除方法(通过删除)比较慢,而且在索引存在非唯一情况下可能会导致复杂错误。...Pandas有df.insert方法,但它只能将(而不是行)插入数据框架(而且对序列根本不起作用)。...重复数据 特别注意检测和处理重复数据,可以在图片中看到: is_unique,nunique, value_counts drop_duplicates 和 duplicated 可以保留最后出现...如果这些还不够,也可以通过自己Python函数传递数据。它可以是 用g.apply(f)接受一个组x(一个系列对象)生成一个单一sum())函数f。

    27220

    Python批量处理Excel数据后,导入SQL Server

    代码如下,首先将字符串按格式转变成日期类型数据,原数据为06/Jan/2022 12:27(数字日/英文月/数字数字小时:数字分钟),按日期格式化符号解释表对应关系替换即可。...我想法是,首先调用pandassort_values函数将所有数据根据日期进行升序排序,然后,调用drop_duplicates函数指定按SOID进行去重,指定keep为last,表示重复数据中保留最后一行数据...代码如下: # 去除重复 SOID重复 按日期去除最早数据 def delete_repeat(data): # 先按日期 Docket Rec.Date & Time 排序 默认降序...保证留下日期是最近 data.sort_values(by=['Docket Rec.Date & Time'], inplace=True) # 按 SOID 删除重复行...遍历读取Excel表数据利用了列表推导式,最后利用pandasconcat函数即可将对应数据进行合并。

    4.6K30

    没错,这篇文章教你妙用Pandas轻松处理大规模数据

    在这篇文章,我们将介绍 Pandas 内存使用情况,以及如何通过为数据(dataframe)(column)选择适当数据类型,将数据内存占用量减少近 90%。...对于表示数值(整数和浮点数)块,Pandas 将这些组合在一起,并存储为 NumPy ndarry 数组。...因为 Pandas ,相同类型会分配到相同字节数,而 NumPy ndarray 里存储了数量,所以 Pandas 可以快速准确地返回一个数值占用字节数。...让我们创建一个原始数据副本,然后分配这些优化后数字代替原始数据查看现在内存使用情况。 虽然我们大大减少了数字内存使用量,但是从整体来看,我们只是将数据内存使用量降低了 7%。...首先,我们将每最终类型、以及名字 keys 存在一个字典。因为日期需要单独对待,因此我们先要删除这一

    3.6K40

    通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

    df.sort_values("col1", inplace=True) 数据输入和输出 1. 利用构造一个数据DataFrame 在Excel电子表格可以直接输入到单元格。...在 Pandas ,您使用特殊方法从/向 Excel 文件读取和写入。 让我们首先基于上面示例数据,创建一个新 Excel 文件。 tips.to_excel("....按排序 Excel电子表格排序,是通过排序对话完成pandas 有一个 DataFrame.sort_values() 方法,它需要一个列表来排序。...填充柄 在一组特定单元格按照设定模式创建一系列数字。在电子表格,这将在输入第一个数字后通过 shift+drag 或通过输入前两个或三个然后拖动来完成。...删除重复项 Excel 具有删除重复内置功能。熊猫通过 drop_duplicates() 支持这一点。

    19.5K20

    Excel 常用九十九个技巧 Office 自学教程快速掌握办公技巧

    6、怎样快速删除“0”单元格行按组合键【Ctrl+F】导出查找对话,选择【查找】选项卡,在输入栏输入:0,点击【全部查找】再按组合键【Ctrl+A】就会显示表格内容为 0 所有单元格,选中单元格后右击...16、查找重复选取查找数据区域,依次点击【开始】-【条件格式】-【突出显示单元格规则】-【重复】设置选择重复格式为【浅红填充色深红色文本】。...25、快速删除空行当表格区域内需要删除空行时,可直接选中表格内某,按组合键【Ctrl+G】导出定位对话,定位条件勾选【空】后点击【确定】再删除整行即可。...29、日期双位显示单元格数据区域内日期需要双位显示 2020/01/01 时,可直接选中表内数据,按【Ctrl】+数字【1】调出【设置单元格格式】对话,选择【数字】选项卡,点击【自定义】,设置类型为...41、单元格上标数字输入平方米(m2)可以现在单元格内输入:m2 然后选中 2 按组合键【Ctrl+1】打开单元格设置对话,在字体特殊效果勾选【上标】。

    7.1K21

    工作必会57个Excel小技巧

    +1打开单元格设置窗口 -数字 -自定义 -右边文输入三个分号;;; 3、隐藏编辑栏、灰色表格线、标和行号 视图 -显示 -去掉各项勾选 四、单元格选取 1 、选取当前表格 按ctrl+a全选当前数据区域...F时,自动转到下一行首列 选取A:F,输入后按回车即可自动跳转 5、设置三栏表头 插入 -形状 -直线 -拖入文本输入字体并把边框设置为无 6、同时编辑多个工作表 按ctrl或shift键选取多个工作表...7、输入身份证号或以0开始数字 把单元格格式设置成文本,然后再输入 8、快速删除空行 选取表 - ctrl+g定位 -定位条件 -空 -删除整行 9、快速插入空行 在表右侧输入序号1,2,3....10、快速合并多行数据 插入批注 -选取多数据复制 -粘贴到批注,然后再从批注复制粘至单元格区域中即可。...11、插入特殊符号 插入 -符号 12、查找重复 选取数据 -开始 -条件格式 -突出显示单元格规则 -重复 13、删除重复 选取区域 -数据 -删除重复项 14、单元格分区域需要密码才能编辑

    4K30

    解决TypeError: read_excel() got an unexpected keyword argument ‘parse_cols or ‘she

    假设我们有一个名为data.xlsxExcel文件,其中包含一个名为Sheet1工作表。工作表包含三数据:姓名、年龄和性别。我们希望使用pandas读取该文件选择姓名和年龄两进行处理。...通过设置​​usecols​​参数为包含需要列名列表,我们只选择了姓名和年龄两。然后,我们对选定年龄进行了一些处理,例如加1操作。最后,我们打印出处理后结果。...数据清洗:Pandas提供了丰富功能来处理数据缺失重复和异常值。通过使用Pandas函数和方法,可以轻松地删除缺失、去除重复、填充缺失等。...数据分析:Pandas提供了丰富统计和分析方法,描述性统计、聚合操作、透视表和时间序列分析等。这些方法可以帮助用户更好地了解和分析数据。...数据导入和导出:Pandas支持多种数据格式导入和导出,CSV文件、Excel文件、SQL数据库、JSON格式和HTML表格等。这使得数据获取和存储都变得非常方便。

    96650
    领券