我是Python和StackOverflow的新手。希望我能正确地发布:)
问题:在每个for循环中,我都试图创建一个新的dataframe,向其中添加列,并将数据填充到列中。
方法:通过阅读以前的文章,我了解到我可以使用“”创建新的数据格式,但这不是最佳实践。或者,我可以创建一个dic,然后修改df。也一直试图使用嵌入式for循环
问题:实际上修改和填充创建的(和空的) df
代码:
df1 = an existing dataframe with date as its index and profit, tax, and revenue for columns
#tablelist w
我是新来的蟒蛇和熊猫。我必须读取几个csv文件,这些文件具有相同的列,并创建了一个结果dataFrame(它包含来自每个csv文件的所有行)。我试过了,但是当我打印dataframe时,它是打印空的DataFrame
栏:[]索引:[]
守则是:
def readCSV(dir):
list = getFilesInDir(dir) # my function which returns list of files.
dataframe = pandas.DataFrame()
for name in list:
df = pandas.read_csv(name)
我有两个填充的DataFrames,df1和df2。我还有一个空的Dataframe (测试): df1 = pd.read_excel(xlpath1, sheetname='Sheet1')
df2 = pd.read_excel(xlpath2, sheetname='Sheet1')
test = pd.DataFrame() 我想遍历df1的行,并将这些行添加到空的测试数据帧中。当我尝试执行以下操作时,我没有得到任何类型的错误,但是没有向测试DataFrame添加任何内容: for i, j in df1.iterrows():
test.a
我用Python语言创建了一个名为middle_dataframe的简单dataframe,它看起来像这样,只有一行数据:,我想把每次在循环中生成的新数据帧附加到这个现有的数据帧中。这是我的程序:
k = 2
for k in range(2, 32021):
header = whole_seq_data[k]
if header.startswith('>'):
id_name = get_ucsc_ids(header)
(chromosome, start_p, end
我想用firstname + ' ' + (姓氏的首字母)替换dataframe中重复的名字。
Last Name First Name Value
Simpson Bart 10
Monroe Lisa 20
Colbert Bart 15
变成了
Last Name First Name Value
Simpson Bart S 10
Monroe Lisa 20
Colbert Bart C 15
到目前为止我已经做过了
df.loc
我是Python的新手,所以请原谅我的无知。我已经使用openpyxl和pandas尝试了几个不同的代码,但是都不能正常工作。
我需要的是复制Python中现有列表变量(即文件路径数组)的文本,并将其粘贴到给定单元格处的现有xlsx工作表中。
例如,给定Python中的列表变量“苹果”、“橙色”、“葡萄”,我需要工作表1的单元格A2、A3和A4来读取相同的列表变量。任何帮助都是非常感谢的!
import pandas as pd
import os
folder = "C:\\Users\\user\\Documents\\temp"
x = []
for path in o
我正在尝试将记录附加到DataFrame对象。因此DataFrame对象变得越来越大,最终记录的数量达到了200万条。
我使用的代码是:
for item in item_list:
if some_condition:
fitered_df = filtered_df.append(pd.Series([my_record]), ignore_index=True)
我注意到,当filtered_df变大时,程序会变慢。感谢@Goyo的回答,我知道这是因为append()函数每次都会为filtered_df重新分配内存。
有没有更好的方法来实现这个目标,或者有更有效的
我正在尝试创建一个for循环,它将迭代一些文件的操作。for循环可以正常工作,直到到达附加操作为止。它给出了以下错误:
TypeError: append()从2到5个位置参数,但给出了8个
怎么可能解决这个问题呢?
>>> index = 0
>>> for value in Sample:
... data = read_file(value)
... #operations
... #operations
... #operations
... Data =pd.DataFrame([[Car_Model,
实际上,我正在尝试将付款收据列的记录转换为pandas数据帧。我逐行读取记录,确定哪些数据应该在哪一列中。所以我像这样创建了空的数据帧: df=pd.DataFrame
df['QTY']=None
df['Unit Price']=None 并尝试像这样填充那个空的df :在本例中,记录是"1X527,000“ i=0
buff=[]
for line in df1.iterrows():
if 'X' in line:
try:
buff=[float(a.replace(',
使用Python 0.19.1。
我在循环中调用一个函数,它每次返回长度为4的数字列表。将它们连接到DataFrame中最简单的方法是什么?
我要这么做:
result = pd.DataFrame()
for t in dates:
result_t = do_some_stuff(t)
result.append(result_t, ignore_index=True)
问题是它沿着列连接,而不是按行连接。如果dates的长度为250,那么它将给出一个包含1000行的单列df。相反,我想要的是一个250 x 4 df。
我正在尝试创建一个基于Python中另一个数据框的值的数组。我希望它像这样填充数组。 If x > or = 3 in the dataframe then it inputs a 0 in the array.
If x < 3 in the dataframe then it inputs a 1 in the array.
If x = 0 in the dataframe then it inputs a 0 in the array. 下面是我到目前为止的代码,但结果如下所示 array = np.array([])
for x in df["disc&
我想在R中将MySQL查询从python脚本转换为类似的查询。python使用循环结构来使用基因组坐标搜索特定值:
SQL = """SELECT value FROM %s FORCE INDEX (chrs) FORCE INDEX (sites)
WHERE `chrom` = %d AND `site` = %d""" % (Table, Chr, Start)
cur.execute(SQL)
在R中,染色体和位点位于一个dataframe中,对于数据中的每一行,我想提取一个值并将其添加到
我有一个Pandas (attendance_records)。它包含了当地学校的出勤率记录。
每行有4列: 1)缺席学生的姓名(姓名),2)学生地址(地址),3)缺勤的第一天(开始),4)缺勤的最后一天(结束)。
例如,一行可以是:
Bobby 101 1st Street 9/1/2014 9/3/2014
这意味着鲍比在9/1和9/3 (包括在内)之间每天都缺席。
我想把这张桌子展开如下:
Bobby 101 1st Street 9/1/2014
Bobby 101 1st Street 9/2/2014
Bobby 101 1st Street 9/3/2014
到目前