我想连接几个列,这些列可以是字符串列表,也可以是ints列表。
到目前为止,我已经这样做了;
data1 = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]})
data1['D'] = [' '.join(str(row)) for row in data1[data1.columns[0:3]].values] # add a new column by concatenating the existing columns
A B C
我有带有字符串和数字列的大DataFrame。在字符串列中,值有重音,我需要将它们转换为“普通”字母。如何将函数应用于熊猫DataFrame中的所有特定类型列(在本例中我需要所有字符串列)?
import unicodedata
def strip_accents(text):
try:
text = unicode(text, 'utf-8')
except NameError: # unicode is a default on python 3
pass
text = unicodedata.normaliz
如果我们有一个DataFrame:
Column1 Column2
0 Alpha This is bananas
1 Bravo This is not
2 Charlie This is not bananas
3 Delta This is not a banana
4 Echo This is not a Banana
5 Foxtrot This is not a banananananana
我们只想从一个字符串列表中选择包含所有字符串的行,我们如何创建一个函数来过滤这些字符串呢?对案件不敏感。
例如,如果我想专门为['no
我在一个具有以下格式的pd.DataFrame列中有数据:
col
0 ['str1', 'str2', 'str3']
1 []
2 ['str1']
3 ['str20']
我使用以下代码构造查找层:
lookup_layer = tf.keras.layers.StringLookup(max_tokens=335)
lookup_layer.adapt(df.col)
在以下几个方面都失败了:
ValueError: Failed to convert a NumPy array to a T
我有一个包含字符串列的dataframe。我想要创建一个新列,它将索引号和字符串列组合在一个列表理解中。下面的代码在循环中执行此操作:
df=pd.DataFrame({'strings': ['string1','string2','string3']})
new_col=[]
for i in df['strings'].index.values:
new_col.append(str(i)+','+df['strings'][i])
df['new_col
如果列表中的任何字符串列为空,我想过滤一个pyspark dataframe。 df = df.where(all([col(x)!='' for x in col_list]))
ValueError: Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame boolean expressions.
我有一个带有字符串列的DataFrame 'df‘。我正试图从这个专栏中删除一个特殊值的列表。
例如,如果‘FOur4’列是:number,我希望它更改为1;如果该列是number,我希望它更改为4
我使用了以下代码:
for i in ['onE','TwO','ThRee', 'FOur']:
print(i)
df['new_number'] = df['number'].str.replace(i,'')
尽管print(i)显示了I遍历字符串列表,但
我的一只熊猫df有日期时间字符串列。格式如下: TimeStamp value
11/12/2015 10:07:34 AM 24.5
11/12/2015 10:07:35 AM 55.1
so on 我尝试使用以下命令将列TimeStamp的值转换为纪元: dataframe['TimeStamp'] = pd.to_datetime(dataframe['TimeStamp']).values.astype(np.int64) // 10 ** 6 将日期时间字符串转换为unix时间戳时出现错误。帮助将是非常有价值
我需要用选定行上的一些字符串来更新DataFrame列,我为这些行建立了索引。到目前为止,我已经通过列表理解实现了我所需要的东西:
[data.particleIDs.values[idx[i]].append(particlenames[i]) for i in range(len(idx))]
其中data.particleIDs是需要更新的DataFrame列,particlenames是一个包含字符串的列表,idx是一个数组,对于每个字符串,该数组包含需要写入的DataFrame行。几个字符串对应于同一行,我需要将它们都写在DataFrame列中。
假设我有一个DataFrame和我用
我正在尝试使用regex来删除或替换dataframe中字符串列中特定单词后面的单词。这意味着我不想把这些空格替换掉。只是这个词指的是特定的单词
import pandas as pd
df = pd.DataFrame({'STRING': [r"THERE IS NO REASON WHY THIS SHOULDN'T WORK!", r"I AM WITHOUT DOUBT VERY BAD AT REGEX", r"I CAN'T SOLVE A PROBLEM HAT HAS NO INTRINSIC
我有一个熊猫数据,其中一个列包含一个字符串列表,例如:
“”,“你好”,“房子很暖和”,“”,“几点了”
对于dataframe的每一行,字符串是不同的,但是每一行上的所有列表都包含空字符串。我怎么才能移除这些?
该列称为“描述”。
我尝试了以下方法:
df['Description'] = df['Description', [i for i in df['Description'] if i]]
while("" in df['Description']):
df['Description