给出了一个包含字符串的Python列表和一个具有X、Y、Z列的Pandas DataFrame。我需要顺序地查询列Y == mylist[index]所在的dataframe中X列的值。我尝试了以下几点,但没有结果:
filelist = glob.glob('/somedir/*.txt')
for f in filelist:
f = os.path.basename(f)
df.loc[df['Y'] == f, 'X'].item()
我正在尝试进行一个查询,从数据库中选择一个表。我创建了一个表名列表并将其导出到一个列表中,将必要的列表字段保存为变量,然后将这些变量插入数据库查询以导出数据。我最初不知道表的名称,但通过逻辑找到它,并将它写入变量。它给了我一个错误:
uch = "_uch"
kam = "_kamera"
pot = "_uzvvod"
conn = sqlite3.connect("kotelnaya.sqlite")
table = pd.read_sql_query("SELECT name FROM sqlite_master
我正在尝试创建一个遍历列表的脚本,并使用list值作为WHERE条件的一部分运行sql查询。所讨论的SQL服务是GBQ,我正在通过python运行脚本过程。
我让脚本按预期工作,将结果保存到一个动态变量中,在这个变量中,我打算使用f字符串。我的代码如下(出于隐私原因编辑):
import pandas_gbq
import pandas as pd
list = ["1", "2"]
for i in list :
query = f'''SELECT *, FROM TABLEA, WHERE CONDITION LIKE &
我定义了一个名为CODE的参数。
代码是一个字符串列表,例如'Car‘、'Bike’、'Boat‘等等。
我需要执行具有以下模式的SQL Querys:
Select * from Table when CODE=Car
或
Select * from Table when CODE=Bike
诸若此类。
在查询中直接使用参数是可行的吗?
就像一件事:
Select * from Table when CODE = Parameter CODE?
编辑:
我使用Python进行查询。变量代码来自DataFrame的一个颜色,如下所示:
import pandas as
我在excel工作簿中有一个带有逗号分隔值的单元格。
此单元格可以具有以下模式的值。
0或123或123, 345。
我希望使用XLRD或pandas.read_excel将它们提取为整数列表。
我尝试过使用xlrd和下面的代码片段。
book = open_workbook(args.path)
dep_cms = book.sheet_by_index(1)
for row_index in range(1, dep_cms.nrows)
excelList = []
excelList.extend([x.strip() for x in dep_cms.cell(
我是Pandas的新手,并且已经开始使用这个库来处理Power BI中的数据集。我最近不得不写一段代码来对一列整数运行一些计算,但很难将我的代码从标准python转换为Pandas。代码本质上是将列转换为列表,然后对列表中的项运行循环,将结果数字附加到一个新列表中,然后我将其添加到它自己的列中。
我读到过在Pandas中运行循环可能会很慢,而且下面代码的执行确实看起来很慢。如果能帮我指明正确的方向,我将不胜感激!
下面是我正在尝试优化的代码:
import pandas as pd
df = dataset #Required step in Power BI
gb_list = df[&
我试图使用Pandas和SQLAlchemy来运行MySQL实例上的查询。在实际查询中,有一个“WHERE”语句引用特定日期。我想对Python列表中的每个日期分别运行这个查询,并迭代地将每个日期的数据附加到另一个Master dataframe。我的代码现在看起来如下(不包括SQLAlchemy引擎创建):
dates = ['2016-01-12','2016-01-13','2016-01-14']
for day in dates:
query="""SELECT * from schema.table W
我正在努力使用pandas的to_datetime函数将csv文件中的条目转换为datetime对象,这样我就可以将它们用于可视化。关于如何创建datetime对象或参数,我似乎误解了一些简单的东西。
我有一个包含多个日期记录的csv文件,一个日期/时间记录的示例(即一行csv文件的示例)……
date_column: 17-Apr-18 # day first (not-zero-padded), month abbrev, year
hour_and_seconds_column: 23:58:40 # hour, minute zero-padded, second
我想使用matplo
目前,我知道如何使用BigQuery Python API在表单中从<company_warehouse>.<table>进行查询
SELECT id, field1, field2, ...
FROM '<company_warehouse>.<table>'
WHERE field1==...
我想要做的是执行上面的查询,但是添加一个限制,只搜索全部数据的一个子集,限制为我在Python中拥有的ID的大集合(列表)(列表或pandas Series)。即,与添加一个子句WHERE id IN (id1,...,idn)相同,但
我有一个简单的Pandas数据框架(df),结构如下:
a b c d
0 WW XX YY ZZ
1 AA BB CC DD
2 EE FF GG HH
3 ...
我想把它放到列表中的嵌套元组结构中,如下所示:
[ ((WW, XX), YY, ZZ), ((AA, BB), CC, DD), ((EE, FF), GG, HH) ... ]
我刚刚开始使用Python/Pandas,所以我不太确定该如何做。
我想根据已识别的关键字在dataframe中添加新列:
这是当前数据(Dataframe= df):
Topic Count
0 This is Python 39
1 This is SQL 6
2 This is Paython Pandas 98
3 import tkinter 81
4 Learning Python 94
5 SQL Working 85
6 Pandas and Work 67
我正在学习Pandas,我正在将我的python代码迁移到Pandas。我想用一个sub比较每个值和下一个值。所以第一个和第二个等等。第二位是第三位,但不是第一位,因为我已经做到了。在python中,我在列表上使用了两个嵌套循环:
sub match_values (a, b):
#do some stuff...
l = ['a', 'b', 'c']
length = len(l)
for i in range (1, length):
for j in range (i, length): # starts from i, n
我试图过滤一个包含字符串列表作为参数的表,但是由于我想使参数可选(在Python用户的情况下),我不能在操作符中使用。
使用postgresql,我能够构建如下查询:
SELECT *
FROM table1
WHERE (id = ANY(ARRAY[%(param_id)s]::INT[]) OR %(param_id)s IS NULL)
;
然后,在Python中,可以选择传递一个param_id列表,或者只传递None,这将返回来自table1的所有结果。例如pandas.read_sql(query, con=con,