我有证券的主要原始数据,我需要在其中创建基于某些筛选标准的多个证券投资组合。我习惯于在C++中工作,不太清楚如何用Python语言实现下面的代码。
我尝试使用嵌套的for循环创建不同的数据帧:
i -用于循环从2007年到2017年的年份(原始数据中的yr列)
j -用于遍历从1到4的区域(原始数据中的列区域)
for i in range (2007, 2018):
for j in range (1,5):
dfij_filter = (df['yr'] == i) & (df['Region'] == j)
我正在尝试创建许多数组,这些数组对应于大数据帧中每个列的数据值,并且我希望每个数组与其相应的列共享相同的名称。下面是我如何尝试处理这个问题的一个例子:
x = [a b c] <- column names
[1 2 3]
[1 2 3]
names = [a b c]
For i in names:
i = numpy.array(x[i])
我想创建三个数组(a、b和c):
a = [1, 1]
b = [2, 2]
c = [3, 3]
但我得到的只是一个数组:
i = [3, 3]
我该如何解决这个问题?
我创建了一个map,其中他们的key是一个字符串,值是一个元组。我也有一个数据帧,看起来像这样 d = {'comments' : ['This is a bad website', 'The website is slow']}
df = pd.DataFrame(data = d) 的映射值This is a bad website包含如下内容 [("There isn't enough support to our site",
'Staff Not Onsite',
0.732394366
我正在尝试学习如何使用使用键的字典集合。我有一个用特殊字符分隔的文本文件。使用VBA宏录制器,我学会了如何删除连续的分隔符以及如何排列列,以防止文本文件在不同位置出现标题。
数据包含申请者信息:
Name | Date | State | University | Age
Ann | 2015-01-14 | NY | Boston | 18
Bob | 2015-02-11 | MA | Stanford | 17
出于本例的目的,数据存储在工作表1上。从第1行第1列的标题开始。
我创建了一个名为Applicant的用户定义对象:
Type Appli
我有一个CSV文件,有很多行和不同的列数。
如何根据列的计数对数据进行分组,并在不同的帧中显示?
CSV文件具有以下数据:
1 OLEG US FRANCE BIG
1 OLEG FR 18
1 NATA 18
由于每一行的列数不同,所以必须按列数对行进行分组,并显示3帧才能设置标头:
ID NAME STATE COUNTRY HOBBY
FR1: 1 OLEG US FRANCE BIG
ID NAME COUNTRY AGE
FR2: 1 OLEG FR 18
FR3:
ID NAME
我有12个包含环境数据的数据帧-每个数据帧中有9934行和38列的不同月份的数据。
为了使我的代码尽可能流畅,我想创建一个for循环,它循环遍历内存中的所有数据帧,并对它们执行一个任务,例如设置每个数据帧的索引。
我尝试通过以下方法创建内存中所有数据帧的列表:
alldfs = [var for var in dir() if isinstance(eval(var), pd.core.frame.DataFrame)]
然而,当我尝试的时候:
for df in alldfs:
df.set_index(['LABEL'], inplace = True)
我得到了
我在一个循环中从一个大的数据帧中创建了子数据帧,并且我一直在尝试在循环中的那些子数据帧上创建一个列:
Partidas=data2['Partida'].unique()
Partida2=[w.replace(' ','_') for w in Partidas]
for i, j in zip(Partidas,Partida2):
globals()['%s' % j]=data2.loc[data2['Partida']==i]
for k in globals().items()
[
我已经将文件夹中的文本文件作为Dataframe加载到一个以文件名为关键字的字典中。如果我对字典中的项运行循环,以对我的数据帧单独执行某些操作,则iloc函数将用于第一个操作,然后生成一个位置索引错误。
i = 0
dict = {}
for root, dirs, files in os.walk(root):
for file in os.listdir(root):
if file.endswith(".tlm-raw"):
name = os.path.splitext(file)[0]
dict[name] = pd.r
我对Python非常陌生,我正试图编写一个脚本,它循环遍历现有的字典并重新组织数据,因此它位于嵌套字典中。现有的字典是根据我在网上找到的一些代码创建的,这些代码将SQL查询中的一行转换为字典。我知道这有点多余,我只是不知道如何编辑这段代码,让它显示我想要的。
下面是脚本:
无论如何,当我这样做时,嵌套字典会自动覆盖以前的嵌套字典,即使嵌套字典的字典键正在更改。我搜索并找到了一些其他StackOverflow问题,但没有找到我的代码的解决方案。
以下是我的相关代码:
row=curs.fetchone
d={}
D={}
while row is not None
给定以下数据帧:
df = pd.DataFrame({'a':['a','c','b'],
'b':['foo','bar','baz']})
df
a b
0 a foo
1 c bar
2 b baz
当我从列中创建一个dict时,我得到这样的结果:
dict(zip(df.a,df.b))
{'a': 'foo', 'b': 'ba