如何根据字典列表过滤数据帧？_如何根据大小过滤数据帧字典？_根据列字典值过滤数据帧 - 腾讯云开发者社区

python、pandas

我已经将几个.xlsx文件作为数据帧加载到来自特定文件夹的列表中，并希望将列表中的这些数据帧“解压缩”到环境中。我来自R，在那里list2env()函数可以完成这项工作，但我似乎找不到在python (新手)中的解决方案。 file_names = os.listdir() df = [] for file_names in file_names: df.append(pd.read_excel(file_names)) 如何将'df‘列表中的数据帧解压到环境中？谢谢!

浏览 11提问于2020-10-08得票数 0

回答已采纳

1回答

Pandas，Python:将数据帧的名称传递给循环中的函数

python、pandas

我有任意大小的n数据帧和df1, df2, df3,..., df_n，我想把它们传递给各种函数/方法。一次传递一个，foo(df1)到foo(df_n)，看起来很简单，所以我想在一个循环中完成。如果我创建一个list dfs = ['df1', 'df2',..., 'df_n']并在list上运行一个循环，并将元素(即数据帧名称)传递给函数，那么我实际上是在传递字符串，而不能对函数中的字符串执行数据帧操作。如果我创建了一个列表dfs = [df1, df2, ..., df_n]，我似乎仍然无法使用dfs[df1]访问各个数据帧。

浏览 11提问于2019-10-08得票数 2

回答已采纳

1回答

在for循环中为pyspark dataframe创建动态名称

dataframe、apache-spark、for-loop、variables、pyspark

我有一个主数据帧df_PROD，对于特定的年份范围，我想从主df中过滤这些记录，如果记录的数量超过0，就会将它们推入一个单独的df (即df_PROD_year)，并将该年份附加到一个列表中，供以后使用。我尝试在for循环中为数据帧创建动态名称，如下所示，如果记录大于0，我将添加到一个单独的df_year中，并尝试将该年份附加到另一个列表中，如下所示。 PROD_years_list = [] year=int(datetime.datetime.today().year) for i in range (year, 2016, -1 ): print(i) df_PROD_{i}

浏览 15提问于2021-03-05得票数 0

回答已采纳

1回答

Pandas:将列表值替换为来自另一个数据帧的值的字符串

python、pandas

我尽了最大的努力在这里找到任何答案，或者在谷歌上搜索都没有成功。我正在尝试用来自另一个数据帧的值的", ".join替换一个单元格内的Id列表，该数据帧包含元素的"Id“和"name”。 | id | setting | queues | |-------------------------------------| | 1ade | A | ['asdf'] | | 2ade | B | | | 3cfg | C | [

浏览 19提问于2020-10-28得票数 1

回答已采纳

3回答

现有数据帧的数据帧字典

python、pandas、csv、dictionary、dataframe

我有以下代码，用于使用csv文件创建数据框字典： l = ['employees','positions'] d = {} for x in l: d[x] = pd.read_csv("P:\\python_work\\data_sets\\" + x + ".csv") 如何使用内存中已有的数据帧列表执行相同的操作？这不起作用，但也许它有助于弄清楚我想要做什么： l = ['df1','df2'] d = {} for x in l: d[x] = x 然后，我可以像这样访问单

浏览 0提问于2018-07-03得票数 1

1回答

将许多pandas Dataframe赋给变量

python、pandas

我想给130个数据帧列表分配不同的变量名。使用较少的数据帧，我可以做到： df1, df2, df3 = [list of dataframes] 然而，有130个这样的人，必须有更好的方法来实现这一点。我试过了： [list of dataframe names] = [list of dataframes] 但是，这是行不通的。最终，我想创建一个数据帧列表，每个数据帧都有不同的变量名，这样我就可以通过变量名访问每个数据帧。

浏览 7提问于2019-05-07得票数 0

2回答

基于列表值列表创建Python列

python、pandas

我有一个列表和一个数据帧df： test_list=[[A,B,C],[A,B,D],[A,B,E],[F,G]] 数据帧是 ID B C D E List of list的元素代表层次结构.I想要在数据帧中创建一个新的列"type“，其值代表其父级。我的最终数据帧应该是这样的： value parent B A C B D B E B 我有一个非常大的数据集，test_list也非常大

浏览 6提问于2019-05-17得票数 0

回答已采纳

1回答

从pandas数据框创建列表字典

python、pandas、dataframe、dictionary

我正在尝试创建基于pandas数据帧的列表字典，我需要一个列表字典来传递给我的Plotly仪表板 In: df.head() Model Make Ford F-150 Ford Escape Ford Mustang Jeep Grand Cherokee Jeep Wrangler 我发现df.to_dict()是通过列标题来定向的，但是我需要根据相邻的行值来定向。要做到这一点，唯一的方法是将我的数据帧重塑为列by Model，它们各自的制造商在它们下面？ Out: makes_by_model= { 'Ford':

浏览 7提问于2020-04-30得票数 1

回答已采纳

2回答

如何在python中通过键来命名循环中的熊猫数据帧？

python、loops、pandas、python-3.4

我想在循环中创建数据帧，但使用关键字命名每个数据帧，以避免覆盖循环中的每个数据帧。这是我的数据框的简化版本： ID Field Value 1 A 1.1 2 A 1.2 3 A 2.4 4 B 1.7 5 B 4.3 6 C 2.2 因此，在这种情况下，我想以名为A、B和C的3个数据帧结束，所以这是我所疲惫的： df2= df.groupby(['Field']) for key, group in df2: key = group.reset_index() 当然，每

浏览 0提问于2015-07-21得票数 4

3回答

使用FOR循环将CSV文件读取到单独的数据帧中

python、csv、for-loop

我有600个csv文件，我想使用pd.read.csv读取这些文件以分离数据帧。我已经尝试了下面的代码。 for stock in stock_list: df_stock = pd.read_csv("D:/Stocks/CSV/" + stock + ".csv") 我希望每个数据帧在stock_list中分别存储为df_the各自的股票名称(例如df_pfizer、df_ICBC等)，但我的代码将其读取到单个数据帧中。股票名称在列表stock_list中。

浏览 3提问于2021-06-18得票数 1

1回答

如何统计存在于另一个字典列表中的Dataframe中的字符串的出现次数？

python、pandas、dataframe

我有一个数据帧，看起来像这样： ngram -------------------------- 0 [] 1 [_ting, tingk, ...] 2 [_pend, pendi, ...] 3 [_teat, teate, ...] ... ... 999 [] 我还有一个字典列表，如下所示： [ { "label": "Academic", "gram

浏览 11提问于2020-03-06得票数 0

1回答

使用布尔掩码创建新的数据帧

python、pandas、dataframe

我有一个数据帧，其中包含名为text的列中的文本，以及lang列中存储的文本所使用的相应语言。我要做的是创建一个辅助数据帧，其中只包含英语文本wrritten (在lang列中也包含值en )。dataframe还包含其他值，所以我不能直接复制它。这是我尝试过的： english_only = df['lang'] == 'en' df_2 = pd.DataFrame(df[english_only]['text'],columns = ['text','sentiment']) 当我运行代码时，我得到一个与原始

浏览 8提问于2020-05-28得票数 1

回答已采纳

1回答

读取多个CSV文件，然后根据文件名重命名文件

python、pandas、dataframe

当前，下面的代码读取路径中的所有csv文件，然后保存在一个列表中。我想用文件名的名称保存每个数据帧，例如echo.csv path = r'M:\Work\Experimental_datasets\device_ID\IoT_device_captures\packet_header_features' # use your path all_files = glob.glob(os.path.join(path, "*.csv")) li = [] for filename in all_files: df = pd.read_csv(file

浏览 15提问于2019-10-17得票数 1

回答已采纳

2回答

如何对数据帧列表中的每个数据帧应用相同的过滤器

如何对数据帧列表中的每个数据帧应用相同的筛选器。例如，如果我想像这样应用一个突变： test_df <- test_df %>% filter(id != 0) 在数据帧列表上

浏览 16提问于2020-06-17得票数 0

1回答

PANDAS索引特定列对应于列表中的字符串

python、pandas、list

我有一个Pandas数据帧，它有几列和一个列表。如果想要一个接一个地索引与列表中的元素相同的列(例如，首先是“apple”列，然后是“grape”列)，我如何实现这一点？如果我使用像fruits[list]这样的代码，它不能工作，只有水果‘’apple‘才能工作。 columns = ['apple', 'mango', 'pear','grape','number'] fruits = pd.read_csv('fruit', names=columns) list = ['apple&#

浏览 0提问于2021-06-06得票数 1

1回答

Pandas:数据帧字典

python、pandas

我有一个分析实验数据的函数(所有单独的.txt文件) 此函数输出Pandas Dataframe的字典({} 有没有一种有效的方法来迭代这个字典并输出单独的数据帧？假设我的字典叫做analysisdict for key in analysisdict.keys(): dfx=pd.concat([analysisdict[key]['X'], analysisdict[key]['Y']], axis=1) 其中dfx将是一个单独的数据帧。(我猜可能需要第二个循环？也许我应该遍历df名称的列表？) 输出将是df1...dfn

浏览 1提问于2017-12-29得票数 0

回答已采纳

1回答

如何根据列值从python H2O数据帧中选择行？

python、dataframe、subset、h2o

如何根据列表而不是在python中对框架进行子集？例如，在R中使用%in%，在熊猫中可以使用.isin()。如果有意义的话，我想做这样的事情： df.loc[df['column name'].isin(pickTheseValues)] 它在h2o中是如何工作的？或者，我是否可以将h2o数据帧转换为熊猫，并按上面的方式进行操作？

浏览 5提问于2019-12-02得票数 0

2回答

将数据框行替换为列值上另一个数据框中相同的行

python、pandas

我有一个数据帧data，在其中我使用了它的一个子集g2_data来执行一些操作。如何将原始数据帧中的值替换为子集的值，并使用其中一列中的值作为引用？ data中的列结构保留在如下所示的子集g2_data中。 data: idx group x1 y1 0 27 1 0.0 0.0 1 28 1 0.0 0.0 2 29 1 0.0 0.0 3 73 1 0.0 0.0 4 74 1 0.0 0.0 ...

浏览 20提问于2021-10-15得票数 0

回答已采纳

4回答

如何从列表中删除空数据框？

我有几十个列表，每个列表都是11个数据帧的集合。一些数据框是空的(另一个脚本没有输出任何数据，不是bug)。我需要通过一个函数来推送每个列表，但是当它看到一个空的数据帧时，它就会卡住。那么我该如何编写一个函数，它将接受一个列表，对每个元素(即数据帧)执行dim操作，如果它是0，则跳到下一个元素。我尝试了这样的东西： empties <- function (mlist) { for(i in 1:length(mlist)) { if(dim(mlist[[i]])[1]!=0) return (mlist[[i]]) } } 但很明显，这并不管用。我会在这一

浏览 0提问于2010-07-16得票数 25

回答已采纳

1回答

为什么"X for X in DataFrame“只给出了列名

python、pandas

y = [x for x in train] 这里，train是mnist数据集的数据帧。我知道这段代码是要转换列表中的所有内容，但它只给了我列名(pixel1，pixel2...)数据帧的大小。为什么它不将我的全部数据作为列表提供给我？

浏览 38提问于2019-10-24得票数 1

1回答

调用在For循环中使用globals()创建的Pandas数据帧

python-3.x、pandas、global-variables

我正在遍历python中的50个文件，并将每个文件转储到熊猫数据帧中。然后，根据原始数据帧中特定字段中的值创建三个新的数据帧。这三个新框架有新的名称，其中包括它们被过滤的值。很管用耶！我得到了我所有的数据帧！问题是，我正在使用全局()调用创建这些数据帧，而且我不知道如何在不将每个单独的数据帧名称显式地键入内核的情况下访问它们。你可能会问我为什么要这么做？例如，我想抓取以“cd”结尾的所有数据帧，并将它们附加(合并)到最终的数据框架中。我不想直截了当地给他们打电话。为了完成这项任务，我想循环一遍数据帧的列表。对于如何做到这一点，或者重新编写代码，有什么建议吗？我对使用iPython的

浏览 4提问于2014-09-04得票数 2

回答已采纳

1回答

如何将字典列表转换为单个pandas数据帧？

python、pandas

我之前的代码是pandas数据帧列表列表，如下所示 rowResults = [ [df, df, df], [df, df, df], ... [df, df, df] ] results=results.append(rowResults) 因为所有的数据帧都有完全相同的列，所以当我追加上面的列表时，它将整个数据结构转换为单个数据帧，其中的列与单独的数据帧相同。现在，由于性能问题，我已经将小数据帧转换为字典。如果我创建了大量的数据帧，我发现在存储由pandas数据帧使用的元数据信息时存在某种类型的内存泄漏。当我使用字典时，这不会发生。我的新代码如下所示 rowResults = [ [

浏览 0提问于2013-01-23得票数 4

回答已采纳

1回答

使用字典值作为df的变量

python、pandas、dataframe、dictionary

我正在导入多个数据帧，并编写了以下过程: 1.要转换为数据帧的文件列表+ 2.我想要的相应数据帧的名称列表。3.我将列表合并到字典中： tbls = ['tbl1', 'tbl2', 'tbl3'] dbname = ['dfABC', 'dfrand', 'dfXYZ'] dictdf = dict(zip(tbls, dbname)) 然后我循环使用tbls来导入数据帧。(下面的getdf是我写的一个简短的函数，它读取表格(数据)所在的excel/csv文件的路径、表名等，并导入数据。 fo

浏览 11提问于2020-04-18得票数 0

1回答

遍历数据帧的名称列表

python、pandas、dataframe、loops、formatting

我有一个数据帧列表，每个数据帧都是由一个唯一的web查询创建的； bngimp = parse_forecast_data(get_json('419524'), None) belimp = parse_forecast_data(get_json('419525'), None) braimp = parse_forecast_data(get_json('419635'), None) chilimp = parse_forecast_data(get_json('419526'), None) chinimp = par

浏览 12提问于2020-10-08得票数 1

回答已采纳

1回答

如何查找和删除IDF值分别为低和高的单词？

python、tfidfvectorizer

我在一个列表中有36k个单词&我有来自list.Now的24k个单词的IDF值，我如何将每个单词映射到它们的IDF值，以便更容易地进行过滤。我已经存储了数据帧中的所有唯一字(36k)&我有其中24k的IDF值 a=list(project_data['final_input_text'].str.split(' ', expand=True).stack().unique()) 我希望单词映射到它们的IDF值，无论是在字典中还是在数据帧中

浏览 22提问于2019-05-16得票数 1

1回答

通过列表字典迭代过滤spark数据帧

python、apache-spark、pyspark、apache-spark-sql

我有一个字典，它看起来像这样的a_dict={"E1":["a",10,20,"red"],"E2":["b", 7, 14,"green"],"E3":["c",40,50,"blue"]]，但更长，我想用每个列表元组同时过滤一个spark数据帧。让我们来看一个数据帧的例子： +----------------------+ | User| value| color | +----------------------+ | a| 12

浏览 12提问于2021-04-30得票数 1

回答已采纳

2回答

基于列名结尾拆分pandas df

python、python-3.x、pandas、dataframe、split

data = {"name": [], "value": [], "x1xyz": [], "x2xyz": [], "x3xyz":[], "x1abc": [], "x2abc": [], "x3abc": []} df = pd.DataFrame (data, columns = ['name', 'value', 'x1xyz', "x2xyz", "x3xyz", '

浏览 0提问于2020-07-14得票数 0

2回答

在Pandas中计算两个数据帧之间的集合差异

python、pandas

想知道如何在Python的Pandas中使用两个不同的数据帧来计算集合差值。其中一个数据帧(df1)的格式为： State City Population NY Albany 856654 WV Wheeling 23434 SC Charleston 35323 OH Columbus 343534 WV Charleston 34523 并且第二数据帧(df2)是 State City WV Wheeling OH Columns 并且我需要一个返回以下数据帧的操作

浏览 5提问于2017-02-24得票数 4

回答已采纳

1回答

pymongo在列表中查找，而不是在数据库中查找

python、python-2.7、filter、pymongo

有没有一种方法可以对字典列表(或可迭代)使用pymongo find方法，而不是在数据库上执行搜索？我有一个字典列表，我想用pymongo中的查询来过滤它们。有没有能做到这一点的库呢？

浏览 0提问于2014-10-30得票数 1

1回答

从分组数据帧中选择前n个最大组

python-3.x、pandas

数据帧(Df)结构 col1 col2 x 3131 y 9647 y 9648 z 9217 y 9652 x 23 分组： grouped = df.groupby(col1) 我想选择前两大组，即， y 9647 y 9648 y 9652 和 x 3131 x 23 我怎么能用熊猫做这件事。我使用list实现了它，但这使它再次变得笨拙，因为它变成了一个元组列表，我必须将它们转换回数据帧类型。

浏览 1提问于2019-02-14得票数 3

回答已采纳

3回答

遍历python中的列，并根据条件插入列名

python、python-3.x、pandas

我有一个数据帧，它被划分为数字和列表的范围，与这些范围相对应。我想遍历每一列，并获得最大值，然后根据范围将列的标题放在正确的列表中。我拥有的列表和数据帧是： range A B C 0 0-300 20 0 427 1 300-500 66 16 341 2 500-800

浏览 5提问于2018-08-30得票数 0

回答已采纳

1回答

从Dask数据框列创建列表的方法

python、dask、dask-dataframe

我想从Dask Dataframe列创建一个列表/集合。基本上，我希望使用此列表通过将值与此数据帧中的列进行匹配来过滤另一个数据帧中的行。我尝试过使用list(df[column])和set(df[column])，但它们花费了很多时间，最终导致创建集群时出现错误，有时当达到内存限制时，它会重新启动内核。我可以使用dask.bag或多处理来创建列表吗？

浏览 10提问于2020-12-31得票数 0

回答已采纳

1回答

如何从pickle文件列表创建多个Pandas数据帧？

python、pandas

我想为一个pickle文件列表中的每个文件创建一个Pandas数据帧。如果我使用以下代码： dfs = [pd.read_pickle(file) for file in DATA_PROCESSED.iterdir()] 我将获得一个列表，但我还希望在文件名和数据帧名之间建立一个对应关系。在这种情况下，我将只获得dfs，例如你能帮我一下吗？

浏览 37提问于2018-08-05得票数 0

回答已采纳

1回答

Python:循环遍历目录并使用文件名作为数据帧名保存每个文件

python、pandas、loops、assign

在R中，有一个名为assign的函数，它为环境中的名称赋值。例： assign("Hello", 2) > Hello [1] 2 在python中，我似乎不能这样做。我最初尝试过： import numpy as np import pandas as pd import os for file in os.listdir('C:\\Users\\Olivia\\Documents'): if file.endswith(".csv"): os.path.splitext(file)[0] = pd.read_

浏览 0提问于2017-10-26得票数 4

回答已采纳

1回答

动态创建和命名Spark DFs

python、pyspark、apache-spark-sql

我有一个元组列表，其中包含数据帧名称和指向该数据帧的路径。我想遍历列表，读取每个数据帧，并将其分配给它的名称。 paths = [('table1', 's3://my_bucket/data/table1/'), ('table2', 's3://my_bucket/data/table2/')] 我如何遍历它并用相应的表名创建每个df？下面的代码不起作用，因为它将数据帧创建为“name”。 for x in paths: name = x[0] name = spark.read.parquet(x[1])

浏览 3提问于2021-10-05得票数 0

1回答

如何将具有多个参数的自定义函数应用于每组数据帧，并在Scala Spark中合并生成的数据帧？

scala、dataframe、apache-spark、group-by、user-defined-functions

我有一个自定义函数，如下所示，它返回不同的数据帧作为输出 def customizedfun(data : DataFrame, param1 : Boolean, param2 : string) : DataFrame = {...} 我想把这个函数应用到每一组 df.groupBy("type") 然后将来自每个type的输出数据帧附加到一个数据帧中。这与将自定义函数应用于分组数据帧的其他问题略有不同，因为此函数除了df.groupBy("type")中的数据帧外，还接受其他输入。做这件事最好的方法是什么？

浏览 21提问于2021-04-12得票数 1

回答已采纳

1回答

如果数据帧基于列值过滤，则从字典中提取行数据

python、pandas、dataframe、dictionary、concatenation

字典dict_set将dataframes作为其键的值。我正在尝试从一个数据帧字典中提取数据，该数据帧字典是基于数据帧中的'A‘列的过滤器，基于列中的值。 dict_set={} dict_set['a']=pd.DataFrame({'A':[1,2,3],'B':[1,2,3]}) dict_set['b']=pd.DataFrame({'A':[1,4,5],'B':[1,5,6]}) df=pd.concat([dict_set[x][dict_set[x]['A

浏览 1提问于2020-10-03得票数 1

3回答

如何将数据帧命名为组中第一次出现的函数

python、pandas

如何在数据帧上循环并创建新的数据帧，以模式命名并仅包含该模式。例如，对于像这样的数据帧： df= pd.DataFrame({'X': ['hello', 'hi', 'hello', 'salut','hi', 'hi', 'hello', 'salut'], 'Y': [1, 4, 3, 2, 9, 0, 4, 3]}) X Y 0 hello 1 1

浏览 46提问于2020-04-23得票数 0

回答已采纳

1回答

在python中对数据帧列表迭代用户定义的函数

python、pandas、dataframe

我有两个非常大的数据帧，我想合并，但无法合并，因为我的计算机内存无法处理它。相反，我想按组将其中一个数据帧拆分为较小的数据帧(其中有195个组，因此有195个数据帧)，然后将这195个数据帧中的每个数据帧连接到另一个大型数据帧。到目前为止，我已经尝试过groupby： split_data = list(bigdata1.groupby("GROUP")) 这产生了195个数据帧的列表我现在想知道如何将下面定义的连接函数应用于每个数据帧，并将每个数据帧分离并能够被调用以进行后续操作(例如分析)。我是一个全新的python新手，因此任何帮助都将不胜感激。提前感谢 def j

浏览 10提问于2021-07-15得票数 0

回答已采纳

1回答

在python中循环遍历内存中的所有数据帧

python、pandas、for-loop

我有12个包含环境数据的数据帧-每个数据帧中有9934行和38列的不同月份的数据。为了使我的代码尽可能流畅，我想创建一个for循环，它循环遍历内存中的所有数据帧，并对它们执行一个任务，例如设置每个数据帧的索引。我尝试通过以下方法创建内存中所有数据帧的列表： alldfs = [var for var in dir() if isinstance(eval(var), pd.core.frame.DataFrame)] 然而，当我尝试的时候： for df in alldfs: df.set_index(['LABEL'], inplace = True) 我得到了

浏览 0提问于2017-10-04得票数 1

1回答

将代码转换为numpy以获得更好的性能

python、numpy、scientific-computing

我有这个： partial = {} for d in devs["d"]: for k in a1km: total = len(cp[(cp["r"]==d) & (cp["s"]==k)]) partial.update({str(d)+str(k): total}) 变量cp和devs是pandas数据帧，a1km是一个字典，其中包含一个站点及其1 1km以外的所有站点(预计算)。我想要的输出是，对于每个d和每个站点k，cp数据帧中与查询匹配的所有记录，即存储的total，因此： d, k

浏览 14提问于2020-03-19得票数 0

2回答

如何将pandas数据帧的重复数限制为5？

python、pandas

col1= ['A','B','A','C','A','B','A','C','A','C','A','A','A'] col2= [1,1,4,2,4,5,6,3,1,5,2,1,1] df = pd.DataFrame({'col1':col1, 'col2':col2}) 对于A，我们有[1,4,4,6,1,2,1,1]，8个项目，但我想将数据帧转换

浏览 0提问于2019-08-20得票数 7

2回答

Python数据帧到csv -数组元素以分隔列。

python、csv

Python数据帧。我有一个数据帧，它在每一行中都有整数数组列表。如何将其写入csv文件，其中数组的每个出现都在csv的各个列中。我试着用csv命令然而，我的所有行元素都进入了csv文件中的一个列。 df如下所示 [123, 1234, 2334] [2345, 12, 12345, 4566, 567] [12, 1233, 112] 我想得到123,2345,12，12,1233在csv的第一栏，1234,12,1233在csv的第二栏，等等。这个是可能的吗？

浏览 2提问于2018-10-06得票数 0

回答已采纳

1回答

Python & Pandas:如何优雅地过滤多个数据帧？

python、pandas

我知道我可以使用isin来过滤数据帧我的问题是，当我对许多数据帧执行此操作时，代码看起来有点重复。例如，下面是我如何过滤一些数据集以仅限于特定的user数据集。 ## filter data df_order_filled = df_order_filled[df_order_filled.user_id.isin(df_user.user_id)] df_liquidate_order = df_liquidate_order[df_liquidate_order.user_id.isin(df_user.user_id)] df_fee_discount_ = df_fee_disc

浏览 17提问于2019-08-02得票数 1

3回答

Pandas:基于列中的多个对象值选择行

pandas、dataframe、where-clause

我有一个pandas数据帧，其中一列包含用户信息。该列的每条记录都是一个列表，该列表又包含用户信息的字典。就像下面的歌词： USER id 1 [{u'STATUS': u'INACTV', u'NAME': 'abc'},{u'STATUS': u'ACTV', u'NAME': 'xyz'}] 634618 2

浏览 3提问于2017-04-20得票数 3

2回答

返回pandas中每个数据帧的自定义变量

python、pandas、function

我觉得这是一个非常简单的问题，我只是没有足够的词汇在谷歌中表达出来。如下所示：我有一个数据帧，我想将其切片并拆分成几个数据帧。所以我为此创建了一个函数和一个for循环。示例表 col1 col2 col3 col4 col5 row1 A Hi my name is row2 A Bye see you later row3 B Bike on side walk row4 B Car on str drive row5 C Dog on grs poop 我的代码是这样的 list_ = list(df['

浏览 21提问于2020-03-11得票数 0

回答已采纳

1回答

这个对象的类型是什么?如何处理它？

r、list、dataframe

我迷失了R中的以下对象： # create a list of filenames files <- list.files("directory", full.names = TRUE) # read all files as csv data <- lapply(files, function(x) (data.frame(read.csv(x)))) 这很好，但我不知道数据的类型，也不知道如何掌握它。让我们看看： data[1] [[1]] Date value1 value2 ID 1 2003-01-01 NA NA

浏览 1提问于2015-04-19得票数 0

1回答

从word文件中提取表格，并将每个表格另存为单独的数据帧，该数据帧应具有各自word文件的名称

python、pandas、for-loop

如果这是一个重复的问题，很抱歉。我有100个单词的文件，我需要从中提取表格数据。我使用下面的代码来实现这个功能： import zipfile from lxml import etree import pandas as pd def read_docx(docx_file, **kwargs): """Read tables as DataFrames from a Word document """ ns = {'w': 'http://schemas.openxmlformats.or

浏览 17提问于2020-04-17得票数 0

1回答

如何根据另一个数据帧中的键过滤数据帧中的列

python、pandas

我的第一个数据帧是 obj1 obj2 obj3 01 02 03 02 03 04 另一个数据帧是： col1 col2 col3 obj1 M N obj2 M T obj3 M N 我只需要第一个dataframe中标记为 {'col2':M, 'col3':N} 想要的结果是 obj1 obj3 01 03 02 04 我似乎不能以一种得体的方式来实现这一点。

浏览 12提问于2020-01-06得票数 2

回答已采纳

2回答