Pandas在更宽的数据帧中转换虚拟对象中的变量列表_为pandas数据帧中的序数创建虚拟变量_pandas中的数据帧列表 - 腾讯云开发者社区

、

我有一个pandas dataframe，其中一列包含每个实例的唯一字符串列表： obj_movies['unique_genres'].head() 0 [Action, Fantasy, Adventure, Science Fiction] 1 [Action, Fantasy, Adventure] 2 [Action, Adventure, Crime] 3 [Action, Drama, Thriller, Crime] 4

浏览 18提问于2018-06-14得票数 0

回答已采纳

2回答

使用pandas在dataframe中创建动态列

、

如何从此pandas数据帧创建动态列。 Name, Sex a, M b, F c, M d, F 预期的数据帧： Name, M, F a, 1, 0 b, 0, 1 c, 1, 0 d, 0, 1 我试过pandas.pivot()，但是没有用，你们能推荐点什么吗？

浏览 4提问于2016-08-01得票数 1

4回答

构建多元回归模型会抛出错误：‘`Pandas data cast to numpy dtype of object。使用np.asarray( data ).`检查输入数据

、、、

我有一些分类预测因子(即变量)为0& 1的pandas数据帧，以及一些数值变量。当我把它放到一个stasmodel中时： est = sm.OLS(y, X).fit() 它抛出： Pandas data cast to numpy dtype of object. Check input data with np.asarray(data). 我使用df.convert_objects(convert_numeric=True)转换了DataFrame的所有数据类型在此之后，所有数据帧变量的数据类型都显示为int32或int64。但在最后，它仍然显示dtype: object，如

浏览 0提问于2015-11-21得票数 34

1回答

删除并释放单个pandas数据帧的内存

、、

我在pandas中运行了一个很长的ETL管道。我必须创建不同的pandas数据帧，并且我想为一些数据帧释放内存。我一直在阅读如何释放内存，我发现运行此命令不会释放内存： del dataframe 下面是这个链接：How to delete multiple pandas (python) dataframes from memory to save RAM?，其中一个答案说del语句并不删除实例，它只是删除了一个名称。在答案中，他们说将数据帧放在列表中，然后删除列表： lst = [pd.DataFrame(), pd.DataFrame(), pd.DataFrame()] del

浏览 171提问于2020-10-15得票数 2

回答已采纳

1回答

使用Pandas模块写入Excel文件

、、

如何使用Pandas模块将项目列表[1,2,3,4,5]写入excel文件中的特定选项卡中，从特定的行和列位置开始？是否涉及pandas.DataFrame.to_excel函数?在将list写入excel文件之前，是否需要将其转换为dataframe？我是否要先将列表转换为序列，然后将序列转换为数据帧，然后将数据帧写入excel文件？

浏览 24提问于2016-08-04得票数 0

2回答

pandas.DataFrame和pandas.Series对象对pandas.get_dummies()的作用不同

、、

我有一个名叫dataframe的列“质量”。 >>>train['quality'].unique() array([5, 6, 7, 4, 8, 3], dtype=int64) 现在get_dummies和train[['quality']]给出了 >>>pd.get_dummies(train[['quality']]).head() quality 0 5 1 5 2 5 3 6 4 5 但有了train['quality'] >>>pd.

浏览 0提问于2018-12-10得票数 0

回答已采纳

1回答

无法将3d数组转换为数据帧python

我有一个3d列表 l=[ [ [1,"ab",119.0] ] , [ [2,"cd",129.0] ] , [ [ 3,"ef",139.0] ] ] 代码 import pandas as pd , numpy as np l=[ [ [1,"ab",119.0] ] , [ [2,"cd",129.0] ] , [ [ 3,"ef",139.0] ] ] b=np.array(l) print(pd.DataFrame(l)) print(pd.DataFrame(b)) 可以将

浏览 3提问于2018-08-31得票数 2

2回答

如何将Python Dataframe转换为列表列表？

、、

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

1回答

如何将多个hdf5文件聚合到一个映像中

、、

我有几个(多达几百个) hdf5文件，其中包含并行模拟的结果:每个计算节点创建一个独立的hdf5文件，以避免任何同步问题。有没有任何方法来创建hdf5文件中所有数据的“映像”，比如，这个“映像”看起来像是拥有所有数据，但实际上，它将提供来自其他文件的数据？我要找的是： "data-node0.h5" spike/PopulationA -> pandas data frame columns=[0,3,6,9] "data-node1.h5" spike/PopulationA -> pandas data f

浏览 4提问于2017-10-21得票数 2

1回答

Pandas数据帧和字典的深度副本

、、、

我正在创建一个小的Pandas数据帧： df = pd.DataFrame(data={'colA': [["a", "b", "c"]]}) 我把那个df拷贝了一遍。我使用的不是Pandas方法，而是通用Python，对吧？ import copy df_copy = copy.deepcopy(df) 一个df_copy.head()提供以下内容： ? 然后我将这些值放入字典中： mydict = df_copy.to_dict() 字典看起来是这样的： ? 最后，我删除了列表中的一项： mydict['colA&#

浏览 42提问于2020-01-10得票数 3

回答已采纳

3回答

使用boto3从S3存储桶中读取多个csv文件

、、、

我需要用python中的boto3从S3存储桶中读取多个csv文件，最后在pandas中将这些文件合并到单个数据帧中。我能够从以下python脚本中读取单个文件 s3 = boto3.resource('s3') bucket = s3.Bucket('test-bucket') for obj in bucket.objects.all(): key = obj.key body = obj.get()['Body'].read() 下面是我的道路 files/splittedfiles/Code-345678 在Co

浏览 2提问于2018-10-17得票数 6

1回答

在Windows7 (x64)上读取pandas数据帧中的大型SPSS文件的性能

、、

我有一个很大的SPSS文件(包含100多万条记录，列略低于150列)，我想将其转换为Pandas DataFrame。将文件转换为列表需要几分钟，将其转换为数据帧需要几分钟，设置列头也需要几分钟。有没有什么我遗漏的优化方案呢？ import pandas as pd import numpy as np import savReaderWriter as spss raw_data = spss.SavReader('largefile.sav', returnHeader = True) # This is fast raw_data_list = list(raw_d

浏览 2提问于2014-08-07得票数 4

2回答

将dataframe列中的一维数组元素列表转换为常规数值。

、、

已经在数据集上实现了ANN回归。预测值和实际值存储在数据帧中。实际值为float类型，当我使用df.info()检查它时，数据帧中的预测值被显示为类型对象。 dataframe中的预测值类似于以下代码： import pandas as pd a=[[1.4],[3.6],[6.7]] df = pd.DataFrame() df['a']=a 但是，我希望df‘’给出以下输出。 df['a'] = 1.4 3.6 6.7 我试过df‘..astype(Float)，df’..flatten()，但是它们没有工作。如何将dataframe列中的一维数组元素的列表

浏览 7提问于2022-02-23得票数 0

1回答

使用相关矩阵中的目标变量列填充Python Pandas Dataframe

、、、、

我有一个由不同数据类型的45个变量组成的pandas数据框架，我正在使用'dython.nominal‘包来创建每个变量之间的关联矩阵。然后我想：答:子集我的数据帧(按地理位置过滤)，并在该子集上计算关联矩阵，然后 B:使用在步骤A中创建的数据帧中的目标变量的列，创建第二个pandas数据帧并添加到第二个pandas数据帧中。然后，得到的数据帧将是一个相关性矩阵，其中列索引是地理位置，行索引是其他44个变量。到目前为止，我拥有的代码是： import pandas as pd from dython.nominal import compute_associations t

浏览 0提问于2020-10-26得票数 2

1回答

将h2o模型结果转换为pandas数据帧

、、、

我在h2o中训练一个模型，如下所示： import h2o h2o.init() trainFrame = h2o.import_file(path = "C:/train.csv") train, test = trainFrame.split_frame([0.8]) x = ["A", "B", "C"] y = "Target" m = h2o.estimators.H2ORandomForestEstimator(model_id="RF_defaults") m.train(x,

浏览 6提问于2017-08-14得票数 0

回答已采纳

1回答

创建抽象动画类

、、、

我正在用c++和SFML创建一个简单的2d游戏，我有一个简单的框架，用于使用"SpriteSheet“图像(包含动画的所有”帧“)来动画精灵。我已经很好的工作了，我试图从另一个我熟悉的引擎(Starling for Flash)中复制这个概念。其中，他们使用一个"Juggler“，它根据时间线更新一个精灵的属性，独立于精灵. 我让动画用我创建的一个名为吐温的类来交换帧。它调用一个函数更新(Float gameTime)；它将sprites subRect更新为正确的框架. 我想让这更多的篮板孤独，允许吐温班做更多的帧动画。我一直在尝试使用多态性来创建"Anim“、&#

浏览 0提问于2012-03-05得票数 1

回答已采纳

1回答

如何在Sklearn管道中进行Onehotencoding

、、、

我正在尝试oneHotEncode我的Pandas数据帧的分类变量，其中包括分类变量和连续变量。我意识到使用pandas .get_dummies()函数可以很容易地做到这一点，但我需要使用管道，以便稍后可以生成PMML文件。这是创建映射器的代码。我想要编码的分类变量存储在一个名为'dummies‘的列表中。 from sklearn_pandas import DataFrameMapper from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoder

浏览 15提问于2017-02-13得票数 13

回答已采纳

2回答

我如何循环工作空间中的所有Pandas数据帧？

、、

我希望能够迭代所有数据帧(而不是名称！)当前在工作区中的。为了获得所有数据帧的列表，我找到了以下解决方案 import pandas as pd # create dummy dataframes df1 = pd.DataFrame({'Col1' : list(range(100))}) df2 = pd.DataFrame({'Col1' : list(range(100))}) # check whether all variables in scope are pandas dataframe. # Dir() will return a li

浏览 3提问于2020-08-08得票数 0

回答已采纳

1回答

Pandas dataframe，ValueError:无法将字符串转换为浮点型：

、、

我在400,000 x 600大小的数据帧(800MB)的Pandas数据帧上使用scikit-learn预处理和随机森林集成技术。当我通过算法传递这个数据帧时，我得到了这个值错误，可能是由于数据帧中的某个地方有额外的空格。我如何从我的数据框中清理所有应该只包含数值而绝对不包含字符串的空格？

浏览 0提问于2017-01-31得票数 1

1回答

将pandas数据框的多列转换为虚拟变量- Python

、、、

我有这个数据框架：据我所知，要使用Python中的scikit learn包执行机器学习任务，应该将分类变量转换为虚拟变量。例如，使用scikit learn库，我尝试将第三列的值转换为虚拟值，但我的代码不起作用： from sklearn.preprocessing import LabelEncoder x[:, 2] = LabelEncoder().fit_transform(x[:,2]) 那么我的代码出了什么问题呢？如何将数据框中的所有分类变量转换为虚拟变量？编辑:完整的回溯如下： ------------------------------------------

浏览 1提问于2014-09-29得票数 0

3回答

PANDAS:修剪多个数据帧

、、

我想从几个数据帧中删除行，这样它们的长度都是n。当我尝试使用for- loop时，更改不会在脚本的其余部分持久存在。 n = 50 groups = [df1, df2, df3] for dataset in groups: dataset = dataset[:n] 单独重新定义名称(例如，df1 = df1:n )是可行的，但有哪些替代方法？(通过python或pandas) 更重要的是，为什么for- loop在这里不起作用？ pandas == 0.10.1 python == 2.7.3

浏览 0提问于2013-03-30得票数 1

回答已采纳

2回答

循环遍历具有不同输出的报价器列表

、、

我有一个自动收报机列表，我想从pandas datareader输出带有财务信息的单个数据集。我尝试创建一个简单的循环，该循环接受一组报价器并将其输入到pandas datareader函数中。 import pandas as pd import pandas_datareader as pdr myTickers = ['AAPL', 'PG'] for ticks in myTickers: print(ticks) ticks = pdr.DataReader(ticks, 'yahoo', start='20

浏览 1提问于2019-08-24得票数 0

3回答

如何从pandas dataframe内的列表中调用值？

、、、

我有一些数据，我把它们放到了熊猫数据框中。在单元格0,5中，我有一个列表，上面列出了我想要调用并打印出来的次数。数据帧： GAME_A PROCESSING_SPEED yellow_selected 19 red_selected 0 yellow_total

浏览 12提问于2019-12-31得票数 1

回答已采纳

2回答

将Pandas Dataframe写入DBF文件？

、、、

我正在使用shapefile，它将属性数据存储在DBF文件中。我需要使用Pandas操作属性，并将新的DBF数据写回磁盘。不幸的是，Pandas数据帧没有df.to_dbf方法(而R有)。我到处寻找，但似乎没有看到任何明显的方法来完成这项任务。如何将pandas数据帧保存为DBF文件？

浏览 208提问于2017-07-04得票数 4

回答已采纳

1回答

使用pandas将JSON转换为dataframe

、、

我正在尝试获取数据帧，但在指定文件后，根据我在read.json中指定的参数，不断遇到各种错误消息。我已经浏览了pandas.read_json文档中的许多参数，但是还没有找到解决方案。 import pandas json_file = "https://gis.fema.gov/arcgis/rest/services/NSS/OpenShelters/MapServer/0/query?where=1%3D1&outFields=*&returnGeometry=false&outSR=4326&f=json" pandas.read_j

浏览 6提问于2019-07-10得票数 1

1回答

迭代列表以创建数据帧输出Pandas

、、、、

亲爱的，我需要你的帮助来微调我的Python，Pandas的代码。我有一个列表: my_list = 405218,405211,309211,234589 我想迭代这个列表，使用每个元素进行细化，生成由1行25列的数据帧表示的输出。然后，我想创建一个dataframe，其中每一行代表一个输出，这样我就有了一个包含所有输出的dataframe。在本例中，由于我的列表基于4个项目，因此数据帧结果将是一个25列4行的数据帧。谢谢你的建议，

浏览 6提问于2020-09-15得票数 2

1回答

使用常规单词的Python循环(不是对象的元素)

、、、、

我尝试通过pandas "read_excel“循环一个常规单词的python列表，理想情况下循环的元素不会被定义为任何类型的python对象。原因是，我需要它们在一个区域中是字符串，而在另一个区域中，它们可以用作数据帧名称…… ...seems我面临着让它们成为字符串和不字符串之间的权衡:让它们在循环中使用字符串不允许它们成为数据帧名称(下面的选项1)，而让它们不使用字符串(我称之为“常规单词”)允许它们成为数据帧名称，但会使"read_excel“函数崩溃(下面的选项2)。更多背景-我正在尝试将3个excel文件转换为pandas dataframe( excel文件名为l

浏览 3提问于2019-03-08得票数 0

2回答

尝试使用rpy2将pandas数据帧转换为R的数据帧时出现无符号整数错误

、、、

我有以下数据： grp_m1 grp_m2 grp_m3 grp_m4 $50-$75 $50-$75 $50-$75 $50-$75 $50-$75 $50-$75 $50-$75 $50-$75 $150-$175 $150-$175 $150-$175 $150-$175 $100-$125 $100-$125 $100-$125 $100-$125 $150-$175 $125-$150 $125-$150

浏览 2提问于2018-04-12得票数 4

1回答

如何替换pandas数据框中特定列中的特定值

、、、

获取格式为字符串L和pandas数据帧df的代码列表： list = ['A', 'D', 'G'] df = Code Type Score Price A 1 1.3 5 A 2 4.5 6 C 4 4.32 7 D 5 2.4 8 E 6 2 9 F 7 1.3 2 G 7 1 1

浏览 1提问于2019-08-23得票数 0

1回答

如何获取两列之间的相关性？

、

浏览 24提问于2021-05-18得票数 3

2回答

Python :丢弃重复函数-不寻常的行为

、、、、

错误-> TypeError: unhashable type：'list‘保存数据帧并再次加载后消失. 保存和加载、生成的数据帧都具有相同的dtype. 可复制-> --> import pandas as pd --> l1 = [[1], [1], [1], [1], [1], [1], [1], [1], [6], [1], [6], [1], [6], [6], [6], [6], [6], [6], [6], [6], [6]] ## len(l1) is 21 ## --> l2 = ['a']*21 --> l3

浏览 16提问于2022-01-15得票数 0

回答已采纳

2回答

如何在pandas中迭代合并数据帧？

、、

给定一个数据帧列表，我希望迭代地合并它们并返回单个数据帧。输入：frames (熊猫数据框列表)和on_columns (包含要合并的列名的字符串或字符串列表)。如何使用df.merge完成此操作？“给定数据帧列表，以迭代方式合并它们并返回单个数据帧 """HINT: Use slice on frames when iterating and merging. Arguments: frames {list} -- a list of pandas DataFrames on_columns {string or list} -- a string

浏览 4提问于2018-10-11得票数 1

1回答

如何向量化python for循环，修改数据帧的每个元素？

、、、、

我有一个Python脚本，使用pandas dataframe，它通过转换另一个dataframe的元素来填充dataframe。我可以用一个简单的for循环或itertuples来做这件事，但我想看看是否有可能将它矢量化以获得最大的速度(我的数据帧非常大，大约60000x12000)。下面是我想要做的一个例子： #Sample data sample_list=[1,2,5] 我有一个类似上面的值列表。我的新矩阵中的每个元素都是这个列表中的某些两个元素除以一个常量n的和。 new_matrix[row,col]=(sample_list[row]+sample_list[

浏览 17提问于2019-06-23得票数 1

回答已采纳

1回答

如何将返回pandas数据帧的函数应用于一系列输入，以便返回单个数据帧？

、、、

我在Python语言中使用Pandas，它返回一个alpha_vantage数据框表。我已经编写了一个函数，如下所示，它接受一个股票名称，重置数据帧的索引并将其重命名。如何将此函数应用于几个输入，以便为它们返回单独的数据帧？目前，我必须手动完成此操作，并为每个输入单独运行该函数。如果我用股票列表创建一个pandas序列，并将函数应用于该序列，是否有效？ def get_stock(ticker): stock, meta_data = ts.get_daily_adjusted(symbol=ticker, outputsize='compact') ti

浏览 18提问于2021-02-07得票数 0

回答已采纳

1回答

字符串(对象)数据的to_sql内存不足错误

、、、

我正在使用to_sql将pandas数据帧写入SQL server数据库。数据帧很小(1列，100行)。然而，我得到了一个错误： cursor.executemany(statement, parameters) MemoryError 该列的dataType为object (即string)。如果我将dataType转换为INT，则代码执行时不会出现错误。为什么对象数据会导致内存不足错误?我如何修复它？

浏览 3提问于2020-09-19得票数 0

6回答

如何向嵌套字典列表中添加值列表？

、、、、

我想用新的键名将列表的每个值添加到不同列表的每个嵌套字典中。字典清单： list_dicts = [{'id': 1, 'text': 'abc'}, {'id':2, 'text': 'def'}] 列表： list = ['en', 'nl'] 期望产出： list_dicts = [{'id': 1, 'text': 'abc', 'language': 'en'}, {{'

浏览 5提问于2020-10-12得票数 0

回答已采纳

2回答

如何编辑数据框并转换为列表(pandas，read_html())？

我使用了pandas库，read_html()从网页中导入一个表格。我想插入msl表中read_html表中的值，但为此，我必须编辑表read_html并转换为列表。这很难做到，因为.read_html()会生成一个数据帧列表。我的python代码： import requests import pandas as pd r = requests.get('URL') pd.set_option('max_rows',10000) df = pd.read_html(r.content) print(df) 结果打印(Df)-数据帧： [

浏览 6提问于2018-01-29得票数 0

回答已采纳

1回答

pandas groupby aggregate用于具有项目列表的列，返回string和not list

、、、

考虑以下数据帧： sample_DF.tsv 我想按这个数据帧分组，所以我应用了以下逻辑： df = pd.read_csv('sample_DF.tsv',sep='\t') df.groupby('col3',as_index=False).aggregate(lambda x:list(x)).reset_index(drop=True) 但是输出不会作为列4和列5的列表的列表加入列表。当我尝试使用虚拟数据帧进行同样的操作时，例如： df = pd.DataFrame({'P':[['a','b&

浏览 11提问于2019-09-24得票数 0

回答已采纳

2回答

将spark dataframe转换为不带pandas dataframe的元组列表

、、

我有一个现有的逻辑，可以将pandas数据帧转换为元组列表。 list(zip(*[df[c].values.tolist() for c in df])) 其中df是一个熊猫数据帧。有没有人能帮我在pyspark中实现同样的逻辑呢？

浏览 17提问于2019-10-15得票数 1

1回答

numpy大小在大列表上失败

、、、

我有一长串熊猫的数据框架，根据类型，"pandas.core.series.Series“。这个列表中可能有一百万个条目。我通过用numpy.array_split分割数据帧来创建它。据推测，目前每个数据帧只包含一个数字： In[29]: df1[0:5] Out[29]: [1 12149992.0 Name: 3121916261129, dtype: float64, 2 12149995.0 Name: 3121916261129, dtype: float64, 3 12149997.0 Name: 3121916261129, dtype: float

浏览 0提问于2018-10-04得票数 0

回答已采纳

1回答

将值追加到pandas数据帧

、

我在我的结果中有这个常量值和列表。我需要将常量及其对应的列表列表添加到pandas dataframe中的一行中。数据帧将有2列- Col1和Col2。我在for循环中生成这些值。用于生成值的代码： for key, elem in dict.items(): print key length = len(elem) elements = list(elem) values = [] firsthalf = elements[:len(elemlist)/2] print firsth

浏览 2提问于2017-01-28得票数 1

回答已采纳

1回答

使用FeatureUnion向来自不同列的countvectorizer添加功能

、、、、

我目前正在尝试添加一个额外的功能到一个countvectorizer矩阵，这个矩阵是用scikit-learn创建的。工作流程如下:我有一个dataframe，它包含一个包含文本的列和一个包含附加特性的列。我首先将我的数据分成训练数据帧和测试数据帧。然后，我在训练数据的文本列上应用countvectorizer。然后，我用计数分解器矩阵作为输入来拟合RandomForest分类器。我现在试图确定的是，我想使用矩阵和数据帧中另一列中的附加功能来运行RandomForest分类器。我怎样才能做到最好呢？我已经读到过scikit功能联合，但无法在我的数据框架中使用不同的列。下面是一个代码

浏览 22提问于2021-01-25得票数 0

回答已采纳

2回答

pandas -将df.index从float64更改为unicode或字符串

、、、、

我想将数据帧的索引(行)从float64更改为字符串或unicode。我以为这能行得通，但显然不行： #check type type(df.index) 'pandas.core.index.Float64Index' #change type to unicode if not isinstance(df.index, unicode): df.index = df.index.astype(unicode) 错误消息： TypeError: Setting <class 'pandas.core.index.Float64Index'&g

浏览 5提问于2016-02-13得票数 71

回答已采纳

1回答

比较来自两个不同数据帧pandas的列

、、

我正在向AD查询机器列表。我用pandas按上次登录日期过滤这个列表。当我处理完这些数据时，我在一个数据帧中有一列。我有另一份报告，其中列出了我们使用的产品已安装的计算机列表。我清理了这些数据，剩下要用来与AD数据进行比较的设备。这只是数据帧中的一列。我还试着将列表与列表进行比较。我不确定最好的方法是什么。我尝试了合并，但我猜这是将DF1行1与DF2行1进行比较。 DF1 = comp1,comp2,comp3,comp5 DF2 = comp1,comp2,comp3 如何检查DF1中的每一行，以确保DF2中的每个值都存在，并返回true或false？我正在尝试找出DF2中不存在的

浏览 1提问于2019-08-06得票数 1

1回答

创建拼写相似的pandas数据框变量名称列表

、、、

在我的环境中，我有一个由几个pandas数据帧组成的列表，它们的名称类似。例如： import pandas as pd import numpy as np df_abc = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_xyz = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_2017 = pd.DataFrame(np.random.randn(

浏览 0提问于2017-06-19得票数 1

2回答

使用Python在Panda数据文件中添加新列时遇到的问题

、、、、

我尝试过各种方法将新列添加到Panda dataframe中，但结果是相同的。尝试过的方法： call_duration是一个具有与数据帧中相同数量的项的列表。 df['Duration_sec'] = pd.Series(call_duration,index=np.arange(len(df))) 和 df['Duration_sec'] = pd.Series(call_duration,index=df.index) 和 # df['Duration_sec'] = np.array(call_duration) 三个人给出的结果和下面的

浏览 2提问于2019-11-02得票数 0

回答已采纳

2回答

高效地将大型pandas数据帧转换为列表

、、

我想要将一个大型熊猫数据帧中的前50项转换为一个列表，对于数据帧中的每个索引，该列表将具有该值。即使dataframe在该索引中没有任何值，我也希望该列表的值为0。例如，pandas数据帧，如下所示： ID Count 0 20 1 50 2 60 4 90 5 20 . 49 65 . 9999999 60054 将被转换为以下列表，只有数据帧的前50个元素是相关的： [20, 50, 60, 0, 90, 20......,65] 请注意，在index=3中，列表中的值是0，因为在pandas数据帧中找不到ID

浏览 5提问于2018-09-06得票数 3

1回答

变量作用域和共享“全局”引用数据帧

、

老派程序员，全新的Python & pandas。可变的数据类型非常酷，但是它们让我们很难直观地知道如何设置“全局”引用数据结构。我有一堆参考数据(目前是几十MB，但最终版本将是数百MB )。许多不同的类和脚本需要引用相同的数据。这是历史参考数据。它很少更改，通过从.CSVs批量更新。将这些数据多次加载到内存中是非常低效的。我想在第一次使用数据时加载一次数据，然后在每次需要时引用相同的副本。请原谅老式的引用(我在20世纪70年代学会了编程)，但这样做的“旧方法”是声明一个全局指针变量，该变量指向包含引用数据的几个pandas数据帧的单个副本。数据帧将在第一次被引用时从.CSV加载

浏览 13提问于2019-08-23得票数 0

4回答

怎样才能更快地计算嵌套列表中出现的相等子列表？

我有一个Python列表，我想(尽可能快:非常重要.)将其出现在嵌套列表中的时间追加到每个子列表中。我已经在一些pandas数据帧中这样做了，但是这似乎非常慢，我需要在非常大的范围内运行这一行。我完全愿意牺牲漂亮的阅读代码来换取高效的代码。例如，我的嵌套列表在这里： l = [[1, 3, 2], [1, 3, 2] ,[1, 3, 5]] 我需要： res = [[1, 3, 2, 2], [1, 3, 5, 1]] 编辑 res中的顺序根本不重要。

浏览 0提问于2019-01-25得票数 9

回答已采纳

1回答

如何在pandas中处理字符串

、、、

我正在处理几乎只有字符串的大型csv文件。我想做一些统计测试，比如定义集群，但为此我需要将字符串转换为int。(我对python，pandas，scikitlearn也是完全陌生的)。下面是我的代码： #replace str as int df.WORK_TYPE[df.WORK_TYPE == 'aaa']=1 df.WORK_TYPE[df.WORK_TYPE == 'bbb']=2 df.WORK_TYPE[df.WORK_TYPE == 'ccc']=3 df.WORK_TYPE[df.WORK_TYPE == 'ddd

浏览 1提问于2018-11-10得票数 0