如果另一列包含特定字符串,则需要填充列中的单元格。
我需要根据C中的内容填充列B,就像C中包含“hello;”,然后用“问候”填充B中相应的单元格。如果C包含“拜拜”,则在B中的相应单元格中填写“别”。
df1
A B C D
0 w hello; Jon q
1 x bye; Jon r
2 y hello; Jack s
3 z bye; Jack t
df1['B'] = np.where(df1['C'].str.contains(&
我有下面A列的数据,我想创建一个名为“基于A列的复杂性”的新列,但是输出没有反映我想要的输出。有人能帮忙吗?
A
dev DH
dev DHGP
dev SEA
dev MONO
dev SLIM DH
dev SLIM MONO
def complexity_column(df,classes):
conditions_region = [
(df[classes].str.contains("DH")),
(df[classes].str.contains("DHGP")),
(df[classes].str.conta
我试图编写一个函数,根据文本列中的字符串条件,从数字列中提取一些空值。
我的尝试例子:
def fill_nulls(string, val):
if df['TextColumn'].str.contains(string) == True:
df['NumericColumn'] = df['NumericColumn'].fillna(value=val)
“string”和“val”参数是手动输入的。我尝试将函数应用于我的数字列,但它给出了以下错误:
ValueError: The truth value of a Series
我有一个dataframe,我想在其中将函数传递给特定的列:
希望根据某些要求更改“Channel”列值:
if 'Facebook' or 'FacebookPaid' or 'FacebookFree' in df['utm_Campaign']:
df['Channel'] = 'FB'
elif 'Newsletter' in df['utm_Campaign']:
df['Channel'] = 'Email
我想要创建一个新的列,根据跟踪代码中的子字符串对记录进行分类。例如,它的跟踪代码包含“KNC-”新列频道应该是“付费搜索”
通过这篇文章,我找到了一个解决方案。
desc = {"KNC-":"Paid Search","SL-": "Display",'SNP-':'Social','EMC-':'Email'}
def check_desc(x):
for key in desc:
if key.lower() in x.lower():
我正在处理一个项目,该项目识别两个Excel工作簿之间的差异。当单元格值存在差异时,代码使用字符串"old value Changed to "new value“填充单元格。”
下面第一行代码中的df_orig包含比较,并突出显示了所有更改。然后,我开始创建数据帧来提取df_orig中包含值"Change“的行,如下所示。
我要做的是检查df_orig中的每一列,如果值"Change“出现在任何行中,则拉出该行,并创建一个包含具有该"Change”值的所有行的新数据帧,并将其输出到新的Excel工作簿。在我的df_orig中有187列,所以我下面使用的
df:
first last email
0 Corey Schafer CoreMSchafer@gmail.com
1 Jane Doe JaneDoe@gmail.com
2 John Doe JohnDoe@gmail.com
从一个大的CSV文件中,我怎样才能找到像John这样的特定单词,而不知道他是哪一列或哪一行呢?如果约翰有几个名字,我能在名字所在的行或列中得到所有的信息吗?
我想要写一个sql查询,如果特定列的和为零,那么结果将被检索。我尝试了如下:(我只写了检查部分,因为错误只会出现在这个部分)。
query=.... WHERE SUM(column1)='0'
coumn1有整数数据类型。我得到了以下错误:
java.sql.SQLException: Invalid use of group function
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:946)
任何帮助都是非常感谢的。谢谢。
我有以下数据
col1 col2 col3
a b c
d e f
g h i
我写了以下内容
df['col1'] = np.where((df['col2'].str.contains('b',case = False,regex=True,na=False)) &
(df['col3'].str.contains('c',case = False,regex=True,na=False)),'s',
我有一个字符串列表,需要对数据框架中的某一列进行搜索:
search_strings = ['foo bar', 'bar such foo', 'very wow foo']
我试图在dataframe中检索与列表中每个字符串中的单词按任何顺序匹配的行。dataframe可能如下所示:
ID string_col
1 foo bar
2 bar foo
3 foo very bar
4 bar such foo
5 foo wow very
我很高兴地发现,我可以在str.contains中使用一个‘AC.26’操作符(检索所有5行)
我有一个有3列的dataframe,我想删除所有行,其中包含字符串(搜索键)的一部分。
我的数据帧:
user_name user_first_name user_email
Max Mustermann max.musterman@gmail.com
Tom Hans tom.musterman@web.de
Tom1 Hans1 tom.musterman@test.de
我的搜索关键词是:@gmail.com,@web
我有一条生产线,有四个工作站(ws1,ws2,ws3,ws4)。有三种不同的过程方法(Push、Pull3、Pull1)。根据处理方法的不同,每个工作站的延迟时间在每个操作期间可能不同(例如,与"ws1timeParameter“相关联)。现在我有三张桌子,(Push,Pull3,Pull1)。每个表都有包含工作站ws1、ws2、ws3和ws4延迟时间的列。当我固定到一种流程方法(在本例中,推送过程)时,下面的操作很好
selectFrom(push)
.where(push.period.eq(ws1timeParameter))
.uniqueResult(push.ws1, d
如果所有三个单词都是必需的,这是可行的,但是当'A','B','D‘是输入时,它会打印:"X是一个框“。我希望'A','B','D‘只打印:"X是一个三角形“,"X是一个框”,只有在’A‘’B‘C’是输入时才打印。
while True:
begin = input('prompt ')
if 'A' and 'B' and 'C' in begin:
answer = ('\n X i
我有一个dataframe df,它有4列'A','B','C','D'
我必须在每个列中搜索一个子字符串,并按照搜索顺序返回完整的dataframe,例如,如果我在列B行3,4,5中获得子字符串,那么我的最后一个df将有3行。为此,我使用的是df[df['A'].str.contains('string_to _search'),它工作得很好,但是其中一个列包含列中的每个元素,如B列中的字符串列表
A B C D
0
假设数据集,
Name Value
0 K Ieatapple
1 Y bananaisdelicious
2 B orangelikesomething
3 Q bluegrape
4 C appleislike
我有关键字列表
[apple, banana]
在此数据集中,匹配列'Value‘-关键字列表
*我的意思是匹配是“值”中的关键字。
我想看看列表匹配列中的关键字,所以..。我想知道匹配率是多少。
最终,我想知道的是“找到关键字和列之间的匹配率”,如果可以的话,过滤数据
谢谢。
编辑
在我真实的数据集中,句子中有关键词
我尝试使用contains在dataframe列中的字符串中进行搜索 1. for idx, row in df.iterrows():
if(row['name'].str.contains('abc')): 上面代码抛出了这个错误 AttributeError: 'str' object has no attribute 'str' for idx, row in df.iterrows():
if(row['name'].contains('abc')): 第二个代码抛出这