我有一个pandas数据框,它的一个列包含一些字符串。我想根据字数将该列拆分成未知数量的列。 假设我有DataFrame df: Index Text
0 He codes
1 He codes well in python
2 Python is great language
3 Pandas package is very handy 现在,我想将text列划分为多个列,每个列包含2个单词。 Index 0 1 2
0
我有一个看起来像这样的pandas数据帧:
A B C
1 2 =A2+B2
3 4 =A3+B3
我使用Python中的xlsxwriter将其写入Excel文件,并将数据框转换为Excel。现在,当我从Python中读取Excel时,我得到C2的值是0.0,而不是3 (=A2+B2)。但是,如果我手动打开Excel,公式就会被求值,并且在'C2‘中有'3’。所以这个问题发生在从代码中读取的时候。
在Python中,有没有一种方法可以读取带有公式作为值的Excel列?
我已经将一个机器学习代码改编为我的project.The代码,该代码在我的笔记本电脑上运行良好,现在在我的台式机上出现问题。我正在检查所有数据框列中是否有缺失值。
File "g100.py", line 11, in <module>
print(dfs.columns[dfs.isna().any()].tolist())
AttributeError: 'DataFrame' object has no attribute 'isna'
我安装的panda版本和依赖项
d.show_versions(as_json
目前,我正在尝试迭代数据框,将字符串列表中的每个值与数据框中某一列中的值进行比较。如果比较结果为真,则将同一行的不同列中的值附加到单独的列表中。 list_of_words = 'yes', 'no', 'maybe'
appendList = []
for word in list_of_words:
for row in dataframe1.iterrows():
if row['A'] == word:
appendList.append(
我试图在现有的数据框架上创建一个新列,但总是遇到"KeyError“问题。在我的数据框中,我有一个包含出生日期的列,我想使用该列来获取客户的年龄。我使用的函数是 for i in range(len(df1)):
df1['Idade'][i] = calculate_age(df1['Data de Nascimento'][i]) 到目前为止,函数"calculate_age“没有任何问题,但我总是得到这样的结果: Traceback (most recent call last):
File "<ip
我有一个像这样的熊猫数据帧:
year week city avg_rank
0 2016 52 Paris 1
1 2016 52 Gif-sur-Yvette 2
2 2016 52 Paris 1
3 2017 1 Paris 4
4 2016 52 Paris 3
5 2016 52 Paris
给定此DF: a b c d
1 2 1 4
4 3 4 2
foo bar foo yes 在大型pandas DF中删除相同但名称不同的列的最好方法是什么?例如: a b d
1 2 4
4 3 2
foo bar yes 从上面的数据框中删除了列c,因为a和c是相同的列,但名称不同。到目前为止,我试着 df = df.iloc[:, ~df.columns.duplicated()] 但是,我不清楚如何检查DF中的行值?
我想要更改一个数据框列的数据类型(从datetime64到object)。
首先,我创建数据帧:
Python 2.6.8 (unknown, Jan 26 2013, 14:35:25)
[GCC 4.7.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> values = pd.Series(i for i in ran