我使用python和pandas调用带有元组Time、Name、Good、Bad的Excel数据。 我想将数据帧重新处理为满足特定条件的另一个数据帧。 具体地说,我想打印出一个数据帧,它存储了整个时间内每个名称的好数据和坏数据的总和。 请帮助我谁知道蟒蛇,熊猫。 enter image description here
我正在尝试使用python读取我的csv文件,将特定的列提取到一个pandas.dataframe中,并显示该数据帧。但是,我没有看到数据框,我收到Series([],dtype: object)作为输出。下面是我正在使用的代码:我的文档包含: product sub_product issue sub_issue consumer_complaint_narrative
company\_public\_response company state zipcode tags
consumer\_consent\_provided submitted\_via date
因此,我正在尝试创建一个python脚本,该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。 我能够成功地创建其他所有内容,但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”,在这里我将使用我的SQL查询来拉取数据,但是我得到了一个"AttributeError:' dataframe‘object has no attribute 'cursor’“错误。 我没有看到很多pandas.read_sql_query()的例子,所以我很难理解我将如何在其中使用我的数据帧。
我是python和pandas数据帧的新手,我正在努力地思考如何将python生成器转换为pandas数据帧。
我想要做的是用这个函数将一个大表分成块,生成一个生成器:
def fetch_data_into_chunks(cursor, arraysize=10**5):
while True:
results = cursor.fetchmany(arraysize)
if not results:
break
for result in results:
yield result
然后
假设我有一个名为df1的Python/Pandas数据帧,其中包含列a和b,每个列只有一条记录(a =1和b= 2)。我想创建第三列c,它的值等于a+b或3。
使用Pandas,我会写道:
df1['c'] = df1['a'] + df1['b']
我更喜欢写一些更简单、更容易阅读的东西,比如下面这样:
with df1:
c = a + b
SAS允许在其“数据步骤”中使用这种更简单的语法。如果Python/Pandas有类似的东西,我会很高兴的。
非常感谢!肖恩
我有一个包含u'\u2019‘的pandas dataframe (python 2.7),它不允许我将结果提取为csv。
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 180: ordinal not in range(128)
有没有办法查询数据帧并将这些字符替换为另一个字符?