我对Python还是个新手,所以请耐心听我说。 我有一个数据帧,其中每列引用一个不同的id (公司),我还有两个包含在list1和list2中的字符串(单词)列表。如果某一列中的任何行至少包含一个来自List1的单词,并且至少包含一个来自列表2的单词,我该如何返回一个哑元(1或0)?我不确定如何将每一列的虚拟对象附加到列表中,以便将其连接到df1。下面的代码返回一个语法错误。 dummy=[]
display(df1())
for column in df1:
if df1.iloc[:,0].str.contains[list1,list2]:
return
如何将numpy数组转换为dataframe列。假设我已经创建了一个空的dataframe,df,并且我循环通过代码来创建5个numpy数组。在for循环的每次迭代中,我希望将在该迭代中创建的numpy数组转换为dataframe中的一列。为了清楚起见,我不想在每次循环迭代时都创建一个新的数据帧,我只想在现有的列中添加一列。我下面的代码是粗略的,语法不正确,但说明了我的观点。
df = pd.dataframe()
for i in range(5):
arr = create_numpy_arr(blah) # creates a numpy array
df[i] = # co
我试图使用pandas.read_sql_query查询一个表,在该表中,我希望将多个列与作为param参数传入的python列表匹配。在尝试完成此操作时,会遇到各种psycopg2错误。
理想情况下,我会提供一个可重复的示例,但不幸的是,由于SQL连接要求,这在这里是不可能的。如果有办法提供一个可重复的例子,请让我知道,我将编辑下面的代码。假设col1的条目是字符串,而col2的条目是数值。
请注意,我正在努力确保col1和col2的每一行与list1和list2的对应组合相匹配,因此不可能为每一行执行单独的where子句,即where col1 = any(%(list1)s) and c