我有一个很大的数据框架,我试图在熊猫身上获得皮尔逊系数。有些列有时包含字符串,我想删除数据帧中包含字符串的所有列。我的代码现在没有引发任何错误,但无法正常工作。
def StringNoMore(dataframe):
i=len(dataframe.index)-1
print(i)
while i > 0:
for cell in dataframe.iloc[i]:
dataframe=dataframe.loc[:, (dataframe != str).any(axis=0)]
print(i)
我有一只有两个栏的熊猫df。其中一个列包含单词字符串,一个列包含单个单词。我需要比较这两列,看看“Col_1”中的字符串是否包含“Col_2”中的单词,然后创建另一列,其中包含该元素的索引。
这就是我所拥有的:
data = {'Col_1': ['A B C D', 'A B C', 'A B C'], 'Col_2': ['D', 'B', 'Z']}
df = pd.DataFrame(data)
print (df)
这就是我需要的:
data =
我希望将列放在包含banned_columns列表中任何单词的pyspark中,并从其余列中形成一个新的dataframe。
banned_columns = ["basket","cricket","ball"]
drop_these = [columns_to_drop for columns_to_drop in df.columns if columns_to_drop in banned_columns]
df_new = df.drop(*drop_these)
banned_columns的思想是删除以basket和cricket
在我的熊猫数据中有一个列,它存储字节。我相信当我将字节放入dataframe时,字节将被转换为字符串,因为dataframe不支持实际字节作为dtype。所以,列值不是b'1a2b',而是被包装在一个类似于"b'1a2b'"的字符串中。
我将这些值传递到需要字节的中。当我像这样传递它时,我会得到错误消息:
TypeError: memoryview: a bytes-like object is required, not 'str'
在这种情况下,我感到困惑的是编码或解码是否有效,还是有其他方法将包装的字节转换为字节?(我正在使
我有一份数据文件。我正在尝试使用Selenium和python中的send_keys()方法将列“果树”中的值发送到google页面。下面是一个复制我想要做的事情的示例代码。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import pandas as pd
# Create a test dataframe
fruit = ['This is apple', 'This is orange', 'This is mango']
b