我正在尝试将字符串列拆分为不同的列,并尝试使用How to split a column into two columns? 字符串的模式如下所示: import pandas as pd
import numpy as np
>>> data = {'ab': ['a - b', 'a - b', 'b', 'c', 'whatever']}
>>> df = pd.DataFrame(data=data)
ab
0 a -
我需要用选定行上的一些字符串来更新DataFrame列,我为这些行建立了索引。到目前为止,我已经通过列表理解实现了我所需要的东西:
[data.particleIDs.values[idx[i]].append(particlenames[i]) for i in range(len(idx))]
其中data.particleIDs是需要更新的DataFrame列,particlenames是一个包含字符串的列表,idx是一个数组,对于每个字符串,该数组包含需要写入的DataFrame行。几个字符串对应于同一行,我需要将它们都写在DataFrame列中。
假设我有一个DataFrame和我用
我正在尝试将.csv中的NULL值转换为NaN,然后使用这些编辑保存一个文件。下面代码中的f在数据中的正确位置具有NaN值。但是,我无法将其另存为.csv。错误显示在代码下方。
#take .csv with NULL and replaces with NaN - write numerical and NaN values to .csv
import csv
import numpy as np
import pandas
f = pandas.read_csv('C:\Users\mmso2\Google Drive\MABL Wind\_Semester 2 2016\W
Python 3.9和Pandas 1.3.4 下面是我正在使用的数据框架: First name Last Name
Freddie Mercury
John Lennon
David Bowie
Joseph
Jovi 我希望df["Full name"] = df["First name"] + df["Last name"]的结果能够产生一个结果,即使它没有同时填充名字和姓氏列。 所以df["Full name"]= Full name
Freddie Merc
我有一个有点大的CSV文件(>2000行),我已经读到了Pandas,并且希望根据某个数据列中是否出现一个特定的单词来创建一个新的指示器列。我一直在尝试使用regex搜索,这可能过于致命,因为单词总是会被空格分隔,但是DataFrame的单元格是字符串列表的列表。我尝试过使用双列表理解进行迭代,但也存在错误,而且作为Python新手,我也很好奇,是否有一个通用的解决方案来处理未指定数量的嵌套列表。下面是一个示例,其中我的最终目标是一个新列,其中的行中有1,其中单词'saddle'在选定列的任何位置出现在单元格中,如果没有,则为0。
我的DataFrame看起来像这样
im
可以在一个熊猫DataFrame的一个元素中存储一个复杂的字典吗?然后用类似的结构化字典填满整个专栏,好吗? 我的迷你示例 import pandas as pd
import numpy as np
#create an example dict
dict={}
dict['key1']=np.array([[1, 2, 3], [4, 5, 6]])
dict['key2']=np.array([2])
dict['key3']='Mexico'
#create the pd D
我有一个带有字符串列的pandas.DataFrame,我想使用在我的程序中分割的他的值。
我有两种方法可以做到这一点,但我需要知道理论上哪一种更快,以及为什么:
s1 = [x.split() for x in df[_COLUMN_]]
s2= df[_COLUMN_].apply(lambda x: x.split())
我用%%time在笔记本上跑步,但在我的睾丸里我看不出有什么不同。
我知道结果对象对于每一种方式都是不同的,但我也可以使用这两种方法。