python，pandas:如何指定多列并仅合并重复行的特定列_Python Pandas:删除基于一列的重复行，并连接多列中的信息_基于Pandas.Dataframe中的多列合并多个重复行 - 腾讯云开发者社区

、、

作为一名R用户，我现在正在使用资源学习merge，并且对Stata命令感到困惑。在R中，我不必担心错误地合并数据，因为它无论如何都会合并所有内容。我不需要担心公共列是否包含任何重复的列，因为Y数据帧将合并到X数据帧中的每个重复行。(在merge中使用all=FALSE ) 但是对于Stata，在继续合并之前，我需要从X中删除重复的行。在Stata中，是否假设为了让merge继续，主表中的公共列必须是唯一的？

浏览 0提问于2011-09-07得票数 8

1回答

Pandas多索引数据帧合并问题

、、、、

我想合并两个数据帧，df1和df2，它们有多个索引列： mi1 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2018')], names=['variable', 'year']) mi2 = pd.MultiIndex.from_tuples([('id', '0'), ('car', '2019')], names=['variable', 'yea

浏览 61提问于2020-12-15得票数 0

回答已采纳

3回答

熊猫模糊检测重复项

、、、、

如何在pandas中使用模糊匹配来检测重复行(高效) 如何找到一个列与所有其他列的重复项，而不是转换row_i toString()的巨大for循环，然后将其与所有其他列进行比较？

浏览 10提问于2016-09-14得票数 4

回答已采纳

1回答

使用Pandas -Exception导入数据表:索引(列0)具有重复值[nan]

、

我是pandas的新手，所以如果我忽略了一些显而易见的事情，请原谅我，但我似乎在前面的问题中找不到答案。我试图将一个表导入到Pandas中，该表有任意数量的空格作为分隔符。下面是数据的一个示例： *PRODUCT : Backscatter Ratio - 1064.0 nm ^ Altitude 2010/03/23 17:01:00 2010/03/23 17:03:00 ... 1.50 1 1

浏览 6提问于2012-06-12得票数 1

1回答

将dataframe一列一列地从另一个dataframe划分

、、、

我有两个看起来类似的数据格式，我想将df1中的一列除以来自df2的一列。以下是一些样本数据： dict1 = {'category': {0: 0.0, 1: 1.0, 2: 0.0, 3: 0.0, 4: 1.0}, 'Id': {0: 24108, 1: 24307, 2: 24307, 3: 24411, 4: 24411}, 'count': {0: 3, 1: 2, 2: 33, 3: 98, 4: 33}} df1 = pd.DataFrame(dict1) dict2 = {'Id': {0: 24108,

浏览 1提问于2022-07-27得票数 1

回答已采纳

1回答

如何根据其他构造从不同的表中选择列，以创建新的dataframe python

、、、、

我有两个DataFrames，两个国家都是1--首先是183行，2--第二行是156行--它们都有相互导入的信息，我需要第一列的一列和第二列的一列，我的目标是创建一个单一的Dataframe，包含我需要的两个列，以及两个数据名通信的包含的名称。这就是我所做的，我得到的信息 for i in range(183) : for j in range(156): if df['Country'][i]==df_happy['Country or region'][j]: df.drop(i,axis=0,inplace

浏览 3提问于2020-10-31得票数 0

2回答

在Pandas中删除特定行

、

我尝试过pandas的drop方法，但我没有使用它。我在代码块中提到了我的特定行。我在“Name”列中遇到了我的行。如何使用python删除pandas中的特定行？例如：- 我的特定行是=> Name : Bertug等级:A年龄: 15 import pandas as pd , re , string dataFrame = pd.read_excel("C:\\Users\\Bertug\\Desktop\\example.xlsx") def vowelCount(s): chars = set("aeiouAEIOU") fo

浏览 1提问于2017-03-31得票数 17

回答已采纳

2回答

从结果中筛选重复行(不包括一列)？

、、、

我有张这样的桌子- uid test1 test2 test3 test4 test5 10 x1 x2 x3 x4 x5 11 x6 x7 x8 x9 x10 12 x11 x12 x13 x14 x15 13 x16 x17 x18 x19 x20 14 x16 x17 x18 x19 x20 15 x21 x22 x23 x24 x25 16 x26 x27 x28

浏览 5提问于2011-06-27得票数 0

回答已采纳

2回答

如何在python中有效地读写数据？

、、

我的应用程序需要定期处理数据。应用程序需要处理新数据，然后将其与旧数据合并。数据可能有数十亿行，只有两列，第一列是行名，第二列是值。以下是一个例子： a00001,12 a00002,2321 a00003,234 新数据可能有新的行名或旧的行名。我想把他们合并。因此，在处理过程中，我需要读取旧的大数据文件，并将其与新的文件合并。然后，我将新数据写入一个新文件。我发现最耗时的过程是读写数据.我尝试过几种数据输入/输出方式。读和写文本。这是最费时的方法。但是，Python泡菜包对于大型数据文件并不有效。在python中是否有其他数据I/O格式或包可以有效地加载和写入大型数

浏览 2提问于2020-04-05得票数 0

回答已采纳

2回答

如何使用Python和Pandas将多个具有相似和不同列的CSV文件合并为1个文件？

、、、、

我有12个CSV文件，我正在尝试将它们合并到一个CSV文件中。在这12个文件中，每一个文件中都有一列SendID。SendID是唯一的，不应在最终合并的CSV文件中重复。例如，我的12个CSV文件中有4个具有这些列。 (File 1: A,B,C,D,E), (File 2: A,C,F,H,K), (File 3: A,B,D,H,L), (File 4: A,D,H,N,Q) 因此，列A出现在每个单独的CSV文件中，并充当一个惟一的标识列或主键，它不应在最终的CSV文件中重复。也有一些情况下，相同的列可能出现在多个CSV文件中，如果这些列通过相同的SendID (或上面示例中列出的列A)

浏览 61提问于2021-01-20得票数 0

回答已采纳

3回答

将一行中的字符数计算为新列

、

我有一个pandas数据帧，它大约有100列，我想计算一行每列中的字符数。在Excel中，我会做类似(Len(Concat(A2:CA2))的事情 df['newcolumn'] = ? in Pandas Python

浏览 9提问于2019-07-10得票数 2

回答已采纳

3回答

熊猫重复列进新的行列

、、

我在csv中有一些重复列的数据，我想要创建多个行来重复其中的一些列。我试着用Python里的熊猫来做这个。将以下内容作为MWE。我使用df = pandas.read_csv('my.csv')导入数据，其内容如下所示： a b c c.1 c.2 1 2 3 4 5 6 7 8 9 0 可以看到，列a和b是唯一的，但c有多个值。我希望将c值分割成不同的行，复制a和b，即实现以下目标： a b c 1 2 3 1 2 4 1 2 5 6 7 8 6 7 9 6 7 0 为了不需要输入太多，我遗漏了一个类似重复的d

浏览 10提问于2017-11-05得票数 2

1回答

在Python语言中重复DataFrame列中某个值的第n次

、、、、

我有一个用Python语言编写的3532行20列的DataFrame。我正在尝试重复从“Snew”列的第一行到第706个值的每个值的5次。如果你看到下面的列，我有一个有3532行的“Snew”列，但我只想将第一行到第706行的每个值重复5次，然后我就会有一个具有3532行的重复值的新列。如果任何人有任何想法，我会很高兴。我在numpy和pandas中也尝试了df.repeat连接命令，但它不能很好地工作 ?

浏览 34提问于2021-05-06得票数 1

回答已采纳

2回答

显示来自MySQL的原始和重复数据

、

我有一个表格，列如下： id name mail 这个表中有很多数据，重复数据的可能性很高。我想显示原始数据行和重复数据行一个接一个，以便用户可以删除重复的数据点击删除按钮。

浏览 3提问于2015-07-20得票数 0

回答已采纳

3回答

在熊猫中合并两个没有列名的数据(熊猫是新的)

、

短解释如果数据中有重复的列名，请确保在读取文件时重命名一列。如果您的数据中有NaN等，请删除这些。然后使用下面正确的答案进行合并。可能是个很简单的问题。我使用pandas.read_csv()阅读了两个数据集。我的数据在两个独立的csv中。使用以下代码： import mibian import pandas as pd underlying = pd.read_csv("txt1.csv", names=['dt1','price']); options =

浏览 3提问于2014-04-17得票数 4

回答已采纳

3回答

在熊猫中，除了一个例外，如何使用drop_duplicates？

、、、、

在Python3和pandas中，我需要通过重复列中的值来消除数据帧中的重复行。为此，我使用了： consolidado = df_processos.drop_duplicates(['numero_unico'], keep='last') "numero_unico“列的字符串格式为0029126-45.2019.1.00.0000,0026497-98.2019.1.00.0000,0027274-83.2019.1.00.0000... 因此，上面的命令只保留最后找到的字符串代码外观有没有人知道如何使用drop_duplicates，除了一

浏览 32提问于2019-10-10得票数 1

回答已采纳

1回答

使用Panda提取列位置而不是列名？

、、

我正在尝试使用python从excel文件中提取某些列，我需要自动化的过程，而不是复制和粘贴。一些列名被重复以显示不同类型的数据，例如。Jan-Dec重复了几次。我基本上需要B，C，I，L和EW:FM列，但我不知道如何用pandas写这些。我是python的新手，任何帮助都将不胜感激。代码： import pandas as pd import numpy as np data=pd.read_excel('path', sheet_name="1. Sheet_name") print(data) header=data.iloc[5] data=dat

浏览 0提问于2020-06-20得票数 1

1回答

在jupyter笔记本中从熊猫数据中选择单行时发生的Python键错误

、、、

我成功地用StackOverflow解决了许多问题，但这是我第一次在其他地方找不到问题，自己也解决不了. 我在jupyter笔记本上工作，里面有熊猫的数据，包括文字评论和亚马逊产品的评分。下面是我的代码： import pandas as pd data = pd.read_csv("AmazonSampleForStudentOffice.csv") reviews = data[['reviewText', 'score', 'len_text']] reviews.head(5) 其结果是： reviewText scor

浏览 0提问于2020-03-31得票数 1

回答已采纳

3回答

使用pandas GroupBy.agg()对同一列进行多个聚合

、、、、

pandas有没有一种内置的方法，可以在同一列df["returns"]上应用两个不同的聚合函数f1, f2，而不必多次调用agg()？示例数据帧： import pandas as pd import datetime as dt import numpy as np pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 *

浏览 0提问于2012-09-26得票数 190

回答已采纳

4回答

Python中的DataFrame切片失败

、、、、

我想用Python分割我的数据。切片数据的基本任务会给我带来意想不到的错误。我的代码是： import pandas as pd test_file = pd.read_csv("C:/Users/Lenovo/Desktop/testfile.csv") test_select = test_file[["Category", "Shop"]] print(test_select[1,1]) 代码print(test_select[1,1])应该显示第二列的第二行。错误信息： pandas._libs.hashtable.PyObjec

浏览 0提问于2018-12-15得票数 1

回答已采纳

1回答

将sql中重复的记录行合并为一行

我在一个sql表中有重复的记录。在不同的字段中，行具有相同的id，但值不同。如何将这两行或多行合并成一行。请帮帮忙，

浏览 1提问于2016-12-21得票数 0

回答已采纳

1回答

如何使用python高速处理csv文件中的1500万行？

、、

我在一个包含两列(学生ID，问题ID)的csv文件中有一千五百万行，每个学生回答不止一个问题，所以您将多次找到相同的学生ID。和另一个具有187000行和两列(学生ID，性别)的csv文件，我想在第一个csv文件中添加一个新的列，名为“性别”，它代表了1500万名学生的性别(即使学生id是重复的)我尝试使用colaboratory(GPU运行时类型)此代码，会话在3:40小时后崩溃。那么我该怎么做才能避免这种情况，并实现高速运行呢？读取数据大约需要7秒 import pandas as pd df=pd.read_csv('/content/drive/MyDrive/f

浏览 1提问于2021-11-23得票数 0

3回答

Python(pandas)：基于两列删除重复项，将行与标志保留在另一列中

、

python pandas的新手，需要删除重复的索引行，并根据一列的标志在重复行中只保留一行，示例如下： Index value 1 value2 flag 1 10 20 on 1 30 40 off 2 11 22 on 2 32 42 off 3 12 22 on 3 33 43 off 根据index和flag cloumn进行过滤后，输出应为： Index value 1 value2 flag 1 1

浏览 70提问于2019-05-18得票数 0

1回答

当CSV内容读取为列表时，pandas read_csv()返回带有.1和.2的重复条目

、

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。 target_df = pandas.read_csv(file_absoulte_path, nrows=0, engine='python').columns.tolist() 并将上面返回的列表与另一个列表(expected_columns)进行比较，如下所示。 if(colums_expected==target_df): logger.info("Column names are CORRECT, as expected!"

浏览 2提问于2021-07-15得票数 1

1回答

如何在pandas中做"(df1 & not df2)“数据帧合并？

、、、、

我有2个具有公共列/键(x，y)的pandas dataframes df1 & df2。我想在键(x，y)上进行"(df1 & not df2)“式的合并，这意味着我希望我的代码只在df1中返回包含(x，y)行的数据帧&而不是在df2中。 SAS具有相同的功能 data final; merge df1(in=a) df2(in=b); by x y; if a & not b; run; 谁能优雅地在熊猫中复制相同的功能？如果我们能在merge()中指定how="left-right“，那就太好了。

浏览 0提问于2015-09-20得票数 16

回答已采纳

1回答

在特定列上添加来自其他数据帧的列，同时保留原始索引

、、、、

Pandas新手入门，并尝试基于两个数据帧共有的列从df2向df1添加列。我想保留df1中的索引。注意，df2有很多重复的行，包括重复的ItemIds。 DataFrame 1 ItemId 0 1 1 4 2 7 3 8 DataFrame 2 0 column1 ItemId column_to_merge 1 21984 1 apple 2 89767 1 apple 3 84595 2 pear 4 90876 4

浏览 9提问于2019-07-09得票数 0

回答已采纳

1回答

熊猫斧头

、

我正在尝试理解python pandas中的pandas参数。我知道它类似于numpy轴，但下面的示例仍然让我感到困惑： a = pd.DataFrame([[0, 1, 4], [1, 2, 3]]) print a 0 1 2 0 0 1 4 1 1 2 3 根据，axis=0沿着行(固定列)运行，而axis=1沿着列(固定行)运行。运行print a.drop(1, axis=1)产量 0 2 0 0 4 1 1 3 这将导致删除列，而print a.drop(1, axis=0)则会删除一行。为什么？这在我看来是向后看的。

浏览 4提问于2015-12-14得票数 1

回答已采纳

2回答

熊猫合并给KeyError

、、、

我有两个Dataframes df_general和df_award，它们共享一个名为ProjectNumber的列。我想把他们合并。我试着用dropna()删除所有的行，它确实删除了它们- df_award['ProjectNumber'].replace(' ', np.nan, inplace=True) df_award.dropna(subset=['ProjectNumber'], inplace=True) df_award.head() 然后像这样合并两个Dataframes (因为我只想从第一个表中得到一个列，从第二个表中只需

浏览 1提问于2018-10-26得票数 0

回答已采纳

1回答

Python tabula-py错误(熊猫错误？)

、、、

在网上阅读了一些文章之后，我决定使用tabula从pdf文件中提取表格。我们使用Anaconda，我刚刚安装了tabula 1.1.1。我想从一个简单的脚本开始，看看它将如何处理一个包含一些文本和两个表("table_p16.pdf")的单一页面pdf文件。守则： from tabula import read_pdf df = read_pdf("table_p16.pdf") 错误：拾起-Djava.security.properties=c:\Windows\Sun\Java\Deployment\sam.security :JAVA_TOOL_O

浏览 2提问于2018-07-13得票数 0

2回答

大熊猫DataFrames的外部合并导致内存错误-如何将“大数据”与熊猫合并？

、、、、

我有两只熊猫DataFrames df1和df2，它们的格式相当标准： one two three feature A 1 2 3 feature1 B 4 5 6 feature2 C 7 8 9 feature3 D 10 11 12 feature4 E 13 14 15 feature5 F 16 17 18 feature6 ... 和df2的格式相同。这些DataFrames的大小分别为175 MB和140 MB。 m

浏览 1提问于2016-10-03得票数 1

回答已采纳

2回答

熊猫/Python将两个数据框架与重复行组合在一起

、

好的，这看起来应该很容易与合并或连接操作，但我无法破解它。我在熊猫公司工作。我有两个数据帧，它们之间有重复的行，我想以一种不重复行或列的方式组合它们。会像这样工作 df1: A B a 1 b 2 c 3 df2: A B b 2 c 3 d 4 df3 = df1 combined with df2 A B a 1 b 2 c 3 d 4 我尝试过的一些方法是选择一个中的行，而不是另一个行(一个XOR)，然后追加它们，但是我不知道如何进行选择。我的另一个想法是附加它们并删除重复的行，但我不知道如何执行后者。

浏览 3提问于2015-06-18得票数 6

回答已采纳

2回答

将重复行从列的子集移到Python中的另一个数据帧

、

使用Python和Pandas，我希望找到数据帧中所有具有重复行的列，并将它们移动到另一个数据框架中。例如，我可能有： cats, tigers, 3.5, 1, cars, 2, 5 cats, tigers, 3.5, 6, 7.2, 22.6, 5 cats, tigers, 3.5, test, 2.6, 99, 52.3 我想要猫，老虎，3.5在一个数据帧中 cats, tigers, 3.5 在另一个数据框架中，我想 1, cars, 2, 5 6, 7.2, 22.6, 5 test, 2.6, 99, 52.3 代码应该检查每一列是否重复行，并且只删除在所有行

浏览 2提问于2019-10-21得票数 0

回答已采纳

2回答

在中直接连接1000个CSV文件？没有重复的标题？

、

是否可以在中将具有头的1000个CSV文件直接连接到一个没有重复头的文件中？我可以轻松地将文件下载到本地硬盘驱动器中，但我更愿意在云存储中进行本机操作。它们都有相同的列，并有标题行。

浏览 4提问于2021-05-20得票数 0

回答已采纳

1回答

是否有循环功能来自动从谷歌趋势中提取数据请求？

、、

我想创建一个循环来帮助我通过PyTrends从谷歌趋势中提取数据。我需要遍历大量的关键字，但谷歌趋势只允许比较当时的五个关键字，因此我需要手动遍历关键字并在pandas中创建一个pandas。然而，似乎有什么不对劲。我得到了数据，但是我的dataframe与pandas一起创建了dataframe，其中的值在不同的行中被移动，并且具有重复的"NaN“值。而不是62行，而是372行(带有重复的"NaN")。 from pytrends.request import TrendReq import pandas as pd pytrend = TrendReq()

浏览 2提问于2019-04-15得票数 2

3回答

按长度删除txt文件中的列

我有一个txt文件，其中包含2列和许多行，其中包含整数和字符串(没有I)，其中我需要删除超过50个字符的行，例如\ 4:33333333:3333333: -:aaaaaeeeeeeeffffffffhhhhhhhh 我猜pandas drop函数不适合这种情况(见description:通过指定标签名称和相应的轴，或者通过直接指定索引或列名称来删除行或列) Python还有其他选项吗？谢谢!

浏览 1提问于2021-02-04得票数 0

2回答

熊猫0.18:用分类器读取CSV文件时内存不足

、、、

我正在尝试用read_csv函数将3GB文件(250万行，主要是分类(字符串)数据)读入Pandas数据并获得错误:内存不足我在PC上的Pandas 0.18版本和16 3GB的RAM，所以3GB的数据应该很容易适应16 3GB。(更新:这不是一个重复的问题) 我知道我可以提供dtype来改进对CSV的读取，但是我的数据集中有太多的列，我想先加载它，然后决定数据类型。追踪结果是： Traceback (most recent call last): File "/home/a/Dropbox/Programming/Python/C and d/main.com

浏览 5提问于2016-09-16得票数 1

2回答

将csv读入pandas数据帧，但避免NaN行

、、

我有一个csv文件，其中有73行数据和16列，我想读取它并将其传递给pandas数据帧，但当我这样做时 data_dataframe = pd.read_csv(csv_file, sep = ',') 我得到了3152行和22列，73行和16列的数据，其余的只有纯NaN值。如何告诉pandas读取有效的行和列数据，并避免所有这些额外的NaN数据？

浏览 43提问于2021-11-16得票数 0

回答已采纳

2回答

具有特定列的pandas模式验证

、、

我有一个几乎有56列和120000行的pandas数据帧。我只想在一些列上实现验证，而不是所有列。我在https://tmiguelt.github.io/PandasSchema/上关注了一篇文章当我喜欢下面的函数时，它会抛出一个错误，比如列数无效。架构指定2，但数据框有56列 def DoValidation(self, df): null_validation = [CustomElementValidation(lambda d: d is not np.nan, 'this field cannot be null')] schema =

浏览 6提问于2020-01-21得票数 2

1回答

删除值在列之间交换的重复行

、、、

非常感谢您的阅读。我有一个大约200,000行和46列的pandas数据帧。其中23列以"_1“结尾，另外23列以"_2”结尾。例如： forename_1 surname_1 area_1 forename_2 surname_2 area_2 george neil g jim bob k charlie david s graham josh l pete keith k

浏览 0提问于2017-09-01得票数 5

2回答

如何在Python中将几个Excel工作表合并成不同的表列？

、、、、

我有几张excel表格，列有以下不同的栏：表A: Col1 Col2 Col3 表B: Col2 Col4 Col5 表C: Col1 Col6 Col7 我的最后一张桌子应该是：最终表格: Col1 Col2 Col3 Col4 Col5 Col6 Col7 如果没有特定列的详细信息，则应保持空白。我一次只成功地执行了两个表的合并，但是我想将所有的表合并在一起。这是合并两个工作表的代码： import pandas as pd import numpy as np import glob df = pd.read_excel('C

浏览 0提问于2019-06-13得票数 2

2回答

无法从Pandas DataFrame合并所有所需的列

、、

我是一个初学者，使用木星笔记本中的Pandas进行临床数据集的工作。我的数据中有一列包含普查域代码，我正在尝试将我的数据与一个大的传输数据文件合并，该文件中也有一个包含人口普查域代码的列。最初，我只想从那个传输文件中得到另外两个列，所以，在我下载了该文件之后，我删除了所有其他列，除了我想要添加到我的文件和人口普查栏中的两个列。这是我使用的代码： df_my_data = pd.read_excel("my_data.xlsx") df_transportation_data = pd.read_excel("transportation_data.xlsx

浏览 16提问于2022-07-31得票数 1

1回答

熊猫加入字符串数据类型

、

我试图加入两个熊猫的数据在一个id字段，这是一个字符串uuid。我得到了一个值错误： ValueError:您正在尝试合并对象列和int64列。如果你想继续，你应该使用pd.concat 代码在下面。我试图按照将字段转换为字符串，但错误仍然存在。请注意，pdf来自spark dataframe.toPandas()，而outputsPdf是从字典中创建的。 pdf.id = pdf.id.apply(str) outputsPdf.id = outputsPdf.id.apply(str) inOutPdf = pdf.join(outputsPdf, on='id', how

浏览 1提问于2018-09-17得票数 11

回答已采纳

2回答

与WHERE子句连接的Pandas类比

、、

我正在python的pandas中连接两个数据帧(A和B)。目标是接收来自B的所有纯行( A.client_id为null的A.client_id=B.client_id上的sql模拟-右连接B) 在pandas中，我只知道进行合并操作，但我不知道如何设置条件(where子句)： x=pd.merge(A,B,how='right',on=['client_id','client_id']

浏览 1提问于2016-11-29得票数 6

回答已采纳

1回答

MultiIndexing行与DataFrame中的列

、、、

我正在处理熊猫中的多重索引数据，我想知道是应该多索引行还是列。我的数据如下所示：代码： import numpy as np import pandas as pd arrays = pd.tools.util.cartesian_product([['condition1', 'condition2'], ['patient1', 'patient2'],

浏览 2提问于2014-02-27得票数 5

2回答

如何替换熊猫中的+xx

、

我使用的是Python 2.7.12和pandas 0.20.3，我有一个如下所示的数据框架，我想替换名为number的列，这个列的dtype是object，当我试图替换该列中的+91时，我得到的错误如下， number 0 +9185600XXXXX 1 +9199651XXXXX 2 99211XXXXX 3 99341XXXXX 4 +9199651XXXXX sre_constants.error: nothing to repeat 完全的痕迹，追溯(最近一次调用)：文件"encoder.py"，第21行，在df‘’num

浏览 0提问于2018-09-18得票数 1

回答已采纳

2回答

熊猫/Python文件-选择一行和两个或多个列

、

所以我现在对Pandas有了很好的了解，我正在尝试分析一个CSV文件，但是我希望做一些不同的事情，在这里我看的不是一行和一列，而是一行和两列，目的是根据CSV文件来扩展列的数量。我的代码是： import pandas as pd df = pd.read_csv("UNdata_Export_20180402_123348163.csv") df = df.set_index(["Country or Area"]) df3 = df[df.columns[0:3]] df3=df.loc["Australia"] print(df3) 所

浏览 0提问于2018-04-09得票数 2

回答已采纳

3回答

Python如何从name字段中插入提取的标题并将其添加到其特定的列和索引中？

、

我正在尝试从dataframe中的name字段中提取标题，并使用python追加到新列中： import pandas as pd df = pd.DataFrame(columns = ['id', 'name']) df = df.append({'id': 123, 'name': 'Mr. Rooney'}, ignore_index=True) df = df.append({'id': 124, 'name': 'Miss. Aniston'}, igno

浏览 6提问于2020-02-17得票数 0

回答已采纳

1回答

熊猫数据串接

、、

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

Pandas比较两列写入另一列

、、

这是我第一次使用Stack。抱歉，如果我重复了一个已有的主题，但如果我发现堆栈中如何比较两列，我不知道如何完成我的工作。我必须用csv，A和B。在A中有一个名字和ids的列表，在B中只有一个名字和其他信息的列表。这两个文件的行数不同。我想编写一个读取A和B文件的python脚本，并将它在A中找到的it写入一个专用列，前提是A的名称和B的名称相同。我不想使用excel，我正在努力提高我的python技能，因为我正在使用越来越多的matplotlib，pandas，seaborn for dataviz。有什么想法吗？非常感谢，如果我滥用了stackoverflow问题系统，我很抱歉 Trix

浏览 3提问于2018-05-10得票数 0