我希望将文件夹中的所有.csv文件加载到每个文件的独立数据帧列表中
这个文件夹被称为硬币。
for file in './coins':
logs_total = [pd.read_csv('./coins/'+file, engine='python')]
错误:
IsADirectoryError: [Errno 21] Is a directory: './coins/.'
如果没有engine='python‘its:
ParserError: Error tokenizing data. C erro
我正在从一个网站上抓取数据,所以我创建了一个for循环来从多个网页收集数据并生成单独的数据帧。但是,我不知道如何用不同的名称保存它们。
我首先创建了数据帧名称列表:
dataframe_names=[]
for i in range(0,50):
text='item'+str(i)
dataframe_names.append(text)
然后,我在创建数据帧的循环中包含了以下代码:
df=[name for name in dataframe_names]
预期的输出是从for循环创建的数据帧,并分别保存,如df1、df2、df3、.....df50。
然而
我相信这很简单,但我对Python还是个新手。在每次循环迭代之后,我遇到了如何将列表添加到数据帧列或行的问题。我想使用外部的for循环遍历大约100个URL的列表,并使用内部循环提取数据。每次 有了这段代码,我就可以创建一个dataframe,将所有列表一起附加到dataframe中的一列或一行。但是我希望内部循环的每一次迭代都单独出现在数据帧的新列或行中。 list_rows = []
for x in link_href_list:
urllib.request.urlopen(x)
html = urlopen(x)
bs = BeautifulSoup(h
我正在写一个脚本来绘制一些数据。我在windows上使用python 3.7.1,并且有以下代码要绘制:
import pandas as pd
import matplotlib.pyplot as plt
files=['path']
for i in range(len(files)):
data = pd.read_csv(files[i], sep=';', skiprows=17, header=None,engine='python', decimal=",")
c=files[0].spli
我有一段python代码,它从数据帧(df1)中收集信息,如下所示 for ind, data in enumerate(df1.Link):
print(data)
result = getInformation(driver, links)
for i in result['information']:
df1.loc[ind, "numOfWorkers"] = i["numOfWorkers"] 输
我有以下数据框架,我正在构造一个Python函数(在Labview中使用它),它基本上只做:数据对&数据清理。
数据框架如下:
我需要熊猫单独挑选每一列(“日期”除外),并将其与'Date'(自定义索引)配对。在单独写入各个CSV文件之前,我需要确保压力柱数据不包含任何'0'编号,对于每个温度柱,等于0 or bigger than 150的数据将被过滤掉。
下面是我的Python函数,参数x1 and x2将通过LabVIEW输入来指定用户选择的“日期范围”。
def data_slice(x1, x2):
import panda
我正在尝试删除pandas数据帧中某个值后面的百分号,相关代码如下:
for i in loansdata:
if i.endswith('%'):
i = i[:-1]
我在想i= i:-1会设置新值,但它没有。我该怎么做呢?为了清楚起见:如果我在For循环中打印i,则打印时不带百分号。但是如果我打印整个数据帧,它并没有改变。
我将用Python清理一个4*4数据帧中的数据,其中包含元素'a‘和'?’。在里面。我想要替换“?”通过NA。
在R中,我写道:
for (i in 1:4){
DATA[DATA[,i]=='?',i]=NA}
当我尝试用Python编写代码时:
for i in range(3):
DATA[DATA.iloc[:,i]=='?'].iloc[:,i]=np.nan
当我使用Python时,我不能改变任何东西。我应该如何编写命令?谢谢。
根据我的juptyer笔记本查询,Python 3.6.5和Pandas 0.23.0。
我正在合并两个数据帧:
df_merged1=pd.merge(df_RL, df_BR, how='left',left_on=df_RL['Business Service Manual'], right_on=df_BR['Names'])
左边的数据帧df_RL.dtypes
Server object
Server Farm object
Business Service Man
我有一个数据帧列表,对于每个数据帧,我想将特定的列乘以10倍。我通常使用python,在R中很难实现这一点。在python中,结果如下所示:
files.list = list(zt2, zt6, zt10, zt14, zt18, zt22)
for (f in files):
for (i in 3:ncol(f)){
f[i] = f[i]*10
}
}
然而,在R中,这只是创建一个df 'f‘并将我上次迭代的df的值存储在其中。在R中做这件事的正确方法是什么?
/usr/local/bin/python3: Error while finding module specification for 'system.__main__' (ImportError: cannot import name 'LANG' from partially initialized module 'system' (most likely due to a circular import) (/Black-Lightning/system/__init__.py))
首先,我不熟悉第一个错误,我没有同名的模块system,
我正在尝试使用我自己的函数从数据帧中计算多个值。该函数当前仅返回数据帧中的一个值。我的for循环似乎不能正常工作。我也试着把结果放在一个新的列表中...
我的数据帧:
A B C D E
ES -0.03 -0.08 -0.07 -0.03 -0.11
我的函数:
w <- function(x){
for(i in 1:length(x))
{
return( (1/x[i]) / (sum(1/x)) )
}
我第一次使用.Rda文件。我将它从Github中拉出,并将项目加载到R中的文件中。我可以将其移动到全局环境中,但当我使用以下代码时: load("~/Desktop/textCF/act_blue.Rda")
View(act_blue.Rda) 我得到以下错误消息: Error in View : object 'act_blue.Rda' not found 我看了看环境,它说数据框是字符(空)。这是我导入数据的方式的问题,还是数据帧的问题?
我有一个数据框架,如下所示,
df1 =
Index bins one two three four
a 1 0.760207 0.313230 1.257121 3.777180
b 2 0.920607 0.350345 -0.424963 0.032379
c 3 -0.975032 0.580298 1.819454 -0.807784
d 4 -0.886256 0.656349 0.306178