我想知道是否有可能删除具有多个连字符的行-例如两个连字符,但保留具有一个连字符的行。 import pandas as pd
import datetime as dt
df = pd.DataFrame({
'apple_pie': ["Hong Kong - London - New York", "Fuji Apple - Best apple pie"],
'shipped_date': ["2021-09-23 21:24:06", "2021-09-25 11:24:06
对于object数据,我可以将两个列映射到第三个元组(object)列中
>>> import pandas as pd
>>> df = pd.DataFrame([["A","b"], ["A", "a"],["B","b"]])
>>> df
0 1
0 A b
1 A a
2 B b
>>> df.apply(lambda row: (row[0], row[1]), axis=1)
0 (A
这个问题与这里的问题非常相似:
除了它是潘达斯系列,而不是潘达斯DataFrame和给出的答案和接受的DataFrame是不工作的系列。
假设我有一个名为s的多索引pd.Series,如下所示:
volume1
year product
2010 A 10
A 7
B 7
2011 A 10
B 7
C
我不明白为什么使用dtype=str创建的系列结果如下:
In [2]: pandas.Series(index=range(2), dtype=str)
Out[2]:
0 NaN
1 NaN
dtype: object
但是使用DataFrame创建的dtype=str结果如下:
In [3]: pandas.DataFrame(index=range(2), columns=[0], dtype=str)
Out[3]:
0
0 n
1 n
为什么只有字母"n“的字符串?
为什么系列赛和DataFrame有这样的区别?
这些文件在哪里?!
根据另一个函数,我需要在Pandas系列(列)中重新定义值。
在迭代过程中,在得到结果之后,我不想查找这个系列两次,因为我想它是浪费时间的,而不是必需的。
例如:
import pandas as pd
s = pd.Series(['A', 'B', 'C'])
for index, value in s.items():
s[index] = func_hard_to_vectorized(value) # lookup again!!!
用C++,的话来说,“如何获得那个单元格的引用?”
我想要的是:
import panda
假设我有一只空熊猫。
import pandas as pd
m = pd.DataFrame(index=range(1,100), columns=range(1,100))
m = m.fillna(0)
以下两个命令有什么区别?
m[2][1]
m[2].ix[1] # This code actually allows you to edit the dataframe
请随时提供进一步的阅读,如果这将有助于今后的参考。
示例
玩具数据表:
>>> df = pd.DataFrame({'a': ['the', 'this'], 'b': [5, 2.3], 'c': [8, 11], 'd': ['the', 7]})
产量:
>>> df
a b c d
0 the 5.0 8 the
1 this 2.3 11 7
以及:
>>> df.dtypes
a object
b
我正在使用python pandas进行数据分析,并且我想更改dataframe中序列的名称。
这是可行的,但似乎效率很低:
AA = pandas.DataFrame( A )
for series in A:
AA[A_prefix+series] = A[series]
del A[series]
有没有办法就地更改系列名称?