使用模糊重新标记pandas数据帧中的类别值_使用索引值作为pandas数据帧中的类别值_具有最大和值的类别列的pandas组数据帧 - 腾讯云开发者社区

、、

我有用df = pd.read_stata('mydata.dta', convert_categoricals=True)加载的.dta数据。当我从Stata转换类别时，我可以更容易地“看到”我的类别是关于什么的。但是我找不到一个选项来处理这种格式的数据。它实际上被转换为字符串/对象。我在SA上发现了一个类似的问题，但没有任何答案：Pandas doesnt recognize categorical — access original codes when convert_categorical=True 我的解决方法是不将猫从dta转换。df = pd.read_st

浏览 12提问于2019-06-17得票数 1

回答已采纳

1回答

是否有一个pandas函数可以将特定标题行的所有列标题转换为该特定标题的行

、、、

我有一个像这样的熊猫数据框架，其中所有类别的头部数据都是可用的： Table depicting category wise head wise values where the heads are in the columns 现在，我想要一个pandas函数返回一个数据帧，如下图所示，其中head值将显示为每个类别的行： Table where all the heads for a particular category appears as a separate row instead of column

浏览 14提问于2020-06-23得票数 2

回答已采纳

2回答

如何求出一个特定类别的平均值，并将缺失的值类别用共同响应的中值来计算

、、

你好，我有如下数据： import pandas as pd import numpy as np 将数据加载到数据帧中 X = pd.read_csv('demo.csv') 感兴趣的两栏是“类别”和“总计”栏： Category Totals estimates A 2777 0.43 B 1003 0.26 D NA 0.65 D 2638 0.17 B NA 0.74 C 2196 0.13 D 2630 0.91 A

浏览 2提问于2020-04-08得票数 0

回答已采纳

1回答

Pandas GroupBy查询

、、

我在pandas中有一个数据帧，如下所示：Snapshot of my pandas dataframe 现在我希望转换数据帧，如下所示，根据排序的日期值(%m/%d/%Y)，使用分隔符为每个customerid连接属性'category‘。日期较早的订单具有对应的客户id，其类别列在第一位。 Desired/Transformed data frame

浏览 12提问于2019-02-24得票数 3

回答已采纳

2回答

模糊匹配单个数据帧中的行，以查找pandas和python中的重复项

、、、

我偶然发现了我一直在引用的这篇文章：。我引用的代码在答案部分，使用了模糊的wuzzy和pandas。它使用模糊wuzzy为2个数据帧中的重复行提供资金。我的目标是修改这段代码，这样我就可以在单个数据帧中检查行重复项。以下是我到目前为止拥有的代码： from fuzzywuzzy import fuzz from fuzzywuzzy import process import pandas as pd import SQLAlchemy import pyodbc con = sqlalchemy.create_engine('mssql+pyodbc://(localdb)\\L

浏览 4提问于2018-12-05得票数 1

1回答

如何显示熊猫列模糊？

、、、、

我有一个熊猫数据框，我想展示一下。我的一些专栏包含个人数据。是否可以显示一列并使其值变得模糊？考虑下面的示例数据帧： # initialize list of lists data = [['tom', 10, 'New York'], ['nick', 15., 'London' ], ['juli', 14, 'Berlin']] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name'

浏览 9提问于2020-02-03得票数 0

回答已采纳

2回答

索引到Dask系列可以返回Dask系列

、、

我有Dask系列的Dask数据帧。我想在本系列中建立索引，以获取dask数据帧以供后续工作使用。但是，使用loc[0]会导致另一个dask系列。使用to_frame也不起作用，因为结果是"Dask系列Dask数据帧的Dask数据帧“。下面是一个使用Dask系列Pandas数据帧的最小示例(不完全相同，但说明了问题)： import pandas as pd import dask.dataframe as dd pdf1 = pd.DataFrame({'a': [1,2,3,4], 'b': [4,3,2,1]}) pdf2 = pd.Data

浏览 3提问于2020-02-03得票数 1

1回答

如何按pandas groupby绘制条形图，然后循环显示所有唯一值

、、

我有以下数据，其中有人名、分数和尝试次数： # Import pandas library import pandas as pd import numpy as np # Data data = [['tom', 10,1], ['nick', 15,1], ['dom', 14,1], ['tom', 15,2], ['nick', 18,2], ['dom', 15,2], ['tom', 17,3] , ['nick', 14,3], [&#

浏览 11提问于2020-07-17得票数 0

回答已采纳

3回答

在数据帧连接时保留分类数据类型

、、

我有两个数据帧，它们具有相同的列名和数据类型，如下所示： A object B category C category 每个数据帧中的类别并不相同。当正常连接时，pandas输出： A object B object C object 这是根据的预期行为。但是，我希望保持分类，并希望联合类别，因此我尝试了跨数据帧中的列的union_categoricals，这两列都是分类的。cdf和df是我的两个数据帧。 for column in df:

浏览 48提问于2017-08-12得票数 17

回答已采纳

2回答

删除列中不常用的值

我有一个带有ID和类别的Pandas数据帧，以及后面的一些标志。当我运行以下代码时 df['category'].value_counts().tail(15) 我看到其中有十几种情况发生的次数不到7次。因此，我想从数据帧中删除包含这些类别的行。我想运行这样的东西，但它给了我错误： df.drop(df[df.category.value_counts() < 7].index, inplace=True) IndexingError:作为索引器提供的不可对齐的布尔系列(布尔系列的索引和索引对象的索引不匹配)。如何从数据帧中删除那些出现次数少于7次的行？谢谢你。

浏览 40提问于2021-03-01得票数 1

回答已采纳

2回答

将分类列添加到数据框架中，并将类别与现有的分类列匹配

、

我有两个数据框架，包含逻辑上相互关联并包含相同数量类别的分类列( df1 <->类别1在df2中，类别2在df1 <->类别2在df2中，等等)。数据帧有不同的长度，行没有排序，所以我不能简单地重新排序和连接它们。我希望将df2的分类变量添加到df1中，以便两个分类列的类别匹配。下面是一个例子： import pandas as pd foo = pd.Categorical(values=[0,1,2,3],categories=[0,1,2,3],ordered=True) bar = pd.Categorical(values=['b',&#

浏览 2提问于2020-03-23得票数 0

回答已采纳

1回答

在python中基于部分字符串匹配连接到数据帧

、、、

我有两个数据帧，有一个共同的关键产品名称，我想做的是通过连接前两个数据帧来创建第三个数据帧，这两个数据帧基于80-90%的相似度的部分字符串匹配，数据集相当大，我已经尝试使用scikit-learn的tfidf，但我一直丢失我的参考索引。在下面的例子中:迷你无线蓝牙运动立体声耳机和OnePlus 6砂岩保护套都需要在df3中，帮助将非常感谢。输出示例： import pandas as pd df1=pd.DataFrame({'Product_Name1': ['Mini Wireless Bluetooth Sports Stereo Headset',

浏览 12提问于2018-12-19得票数 0

2回答

在Python中将2列的数据帧转换为一系列2列

、

我正在尝试处理一些时间序列数据，并且对pandas dataframe还是个新手。我有一个包含两列的数据帧，如下所示： +---+-----------------------+-------+--+ | | 0 | 1 | | +---+-----------------------+-------+--+ | 1 | 2018-08-02 23:00:00 | 456.8 | | | 2 | 2018-08-02 23:01:00 | 457.9 | | +---+-----------------------+------

浏览 0提问于2018-08-16得票数 0

3回答

熊猫按两列分组并绘制曲线图

、

我有一个这样的数据帧： import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline df = pd.DataFrame({'category': list('XYZXY'), 'B': range(5,10),'sex': list('mfmff')}) 我想从“类别”栏中绘制基于类别的男性或女性的性别计数。我试过了： df.groupby(['category','s

浏览 5提问于2019-01-02得票数 15

回答已采纳

2回答

如何在pandas中合并交叉表的类别？

、

假设我的pandas数据帧有3个variable X类别：[A, B, C]和2个variable Y[D,E]类别。我想用下面这样的东西来交叉标记： +--------+----------------------+-----+ | X/Y | D | E | +--------+----------------------+-----+ | A or B | count(X=A or B, Y=D) | ... | | C | count(X=C),Y=D) | ... | +--------+-------------

浏览 15提问于2019-12-21得票数 1

回答已采纳

2回答

如何使用应用于每行多个切片的函数来转换pandas中的DataFrame？

、

我想将函数f应用于pandas DataFrame的每一行中的许多切片。例如，DataFrame df将如下所示： df = pandas.DataFrame(np.round(np.random.normal(size=(2,49)), 2)) 因此，我有一个2行乘49列的数据帧，并且我的函数需要应用于两行中7个数据点的每个后续切片，以便结果数据帧看起来与输入数据帧相同。我是这样做的： df1=df.copy() df1.T[:7], df1.T[7:14], df1.T[14:21],..., df1.T[43:50] = f(df.T.iloc[:7,:]), f(df.T.iloc[

浏览 9提问于2014-11-16得票数 1

2回答

摄像机抖动存在下的基准标记检测

、、

我试图使我的基于OpenCV的基准标记检测更加健壮，当用户剧烈移动相机(手机)时。标记是ArTag风格的，在黑色边框内嵌入汉明代码。通过对图像进行阈值化检测边框，然后根据所发现的轮廓寻找四值体，然后检查四值体的内部。通常，如果识别出黑色边框，则标记的解码是相当健壮的。我试过最明显的一件事，那就是对图像进行两次降采样，并在这些级别上执行四次检测。这有助于相机在极近距离的标记上离焦，也有助于极小程度的图像模糊，但对相机运动模糊的一般情况没有太大帮助。是否有关于如何使检测更加可靠的研究？我想知道的想法包括： thresholding?On 可以进行某种光流跟踪来“猜测”下一帧中标记的位置，然后在

浏览 2提问于2012-02-16得票数 7

回答已采纳

1回答

如何根据Python列表中的列号过滤数据帧中的行？

、、、、

我有一个Pandas数据帧，它有两列，x和y，分别对应于一个大信号。它的大小约为300万行。 Wavelength from dataframe 我在试着从信号中分离出峰值。在使用scipy之后，我得到了一个1D Python列表，对应于峰值的索引。但是，它们不是信号的实际x值，而只是其对应行的索引： from scipy.signal import find_peaks peaks, _ = find_peaks(y, height=(None, peakline)) 因此，我决定通过将y列中的所有值设置为NaN来过滤原始数据帧，除非它们位于峰值列表中的索引上。我迭代地做了这件事，但是，因

浏览 22提问于2020-02-01得票数 2

1回答

有没有一个函数可以根据pandas数据帧中的多个特定列值删除多个行？

、、、

我有一个特定的Pandas数据帧，它在一个特定的列'A‘中有多个不同的字符串类别。我想创建一个新的数据帧，其中只包含来自A列的7个独立类别的行，总共15个。我知道我可以使用以下命令单独删除/添加类别： df1 = df[df.Category != 'a'] 但我也尝试使用列表来尝试在一行中完成它，如下所示： df1 = df[df.Category = ['x','y','z']] 但这给了我一个语法错误。有什么方法可以实现这个功能吗？

浏览 8提问于2020-06-10得票数 0

1回答

在pandas中，当布尔运算符的长度不匹配时，如何处理？

、

给定这样的数据帧a和idx import pandas as pd import numpy as np idx = np.array([False, False, True, True, False]) a = pd.Dataframe(np.full((5),0)) 我想将n添加到a中，n表示每个值位置之前的True数。因此，a应该变成：0,0,1,2,2。你知道怎么用矢量化的方式来做吗？谢谢!

浏览 3提问于2016-06-27得票数 0

1回答

逗号分隔的in字符串映射到python Pandas中的值

、

我在pandas DataFrame的列中有一个逗号分隔的字符串： ? 我有一个映射数据帧 ? 我想要最终的数据帧： ? 我想要一个新的列，并用映射数据帧中的值替换ids，写pythonic + pandas的方法是什么？

浏览 22提问于2021-11-02得票数 0

回答已采纳

1回答

跨数据框计算不同价格类型的价格- Python

、、

对于我正在做的一个项目，我目前有3个数据帧。这些是针对产品、客户和订单的。这些的简单版本可以在下面找到，实际的订单框架大约有10.000列。情况如下:产品有不同的价格类别，每个客户对每个类别都有一个特殊的价格。我目前有一个订单数据框架，其中包含订单客户、产品编号、订购产品的数量和日期。现在我想在order dataframe中的一个新列中添加订单的价格。我设法获得了产品的类别，但我不知道如何从那里开始，甚至不知道是否正确的方式。任何帮助都将不胜感激，在数据帧图片下面，我包含了制作这些样本数据帧的代码。 df_products： ? df_customers： ? df_orde

浏览 17提问于2020-03-21得票数 0

1回答

Pandas:对列类别中的每一行进行排序/百分位数

、、、、

我想知道是否有一个雄辩的方法来对Pandas数据帧中的列进行排序(计算百分位数)，条件如下：在每个类别中进行百分位数计算。每一列将属于一个类别，并在每个类别中进行百分位数计算(请参阅图形描述的链接)。我了解到，我可以执行以下操作，而忽略类别： TargetRanking = StartingData.rank(axis="columns", pct=True) 但我需要按每列的类别对每行进行分组。请参阅以下链接中的图形描述。

浏览 56提问于2017-03-10得票数 1

回答已采纳

1回答

从现有数据帧的某些列创建新的pandas数据帧

、、

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

2回答

将Pandas Dataframe写入DBF文件？

、、、

我正在使用shapefile，它将属性数据存储在DBF文件中。我需要使用Pandas操作属性，并将新的DBF数据写回磁盘。不幸的是，Pandas数据帧没有df.to_dbf方法(而R有)。我到处寻找，但似乎没有看到任何明显的方法来完成这项任务。如何将pandas数据帧保存为DBF文件？

浏览 208提问于2017-07-04得票数 4

回答已采纳

4回答

使用value_counts()在pandas中查找类精度

、

我在pandas数据帧中有两列:label(基本事实)和pred (模型预测)。我在标签中有4个类别:狗，猫，大象和蛇。我想要的是每类预测的准确性或精确度。例如，如果我有下面的数据帧： label pred dog cat elephant elephant dog snake cat cat snake snake snake cat dog dog 我所做的是为每个类使用value_counts，然后手动插入比率以获得pandas的准确性。问题是，标签是按原始计数数排序的，因此value_counts和pred的顺序可能不同。 numerator

浏览 26提问于2020-05-26得票数 1

1回答

如何根据条件获取透视表中的值

、

给定一个数据帧 import pandas as pd data = [[1, 10, -1], [1, 7, -2], [1, 3, 14], [2, 11, 1], [2, -2, 2], [1, 13, 4]] DfObj = pd.DataFrame (data, columns = ['A', 'B', 'C']) 和数据透视表 pivot = DfObj.pivot_table (index=['A', 'B']) 我想要得到每个A值对应的C值到最高的B值，即4和1。 4是对应于类别

浏览 9提问于2020-02-26得票数 2

回答已采纳

2回答

从pandas df更新数据库中的现有行

、、

我有一个PostgreSQL数据库。Pandas有一个“to_sql”函数，可以将数据帧的记录写入数据库。但我还没有找到任何文档，说明在我使用完dataframe时如何使用pandas更新现有的数据库行。目前，我可以使用pandas read_sql_table将数据库表读取到数据帧中。然后，我会根据需要处理数据。但是，我还不能弄清楚如何将该数据帧写回数据库以更新原始行。我不想覆盖整个表。我只需要更新最初选择的行。

浏览 73提问于2015-04-13得票数 25

1回答

在Python Pandas中删除数据框行名称

、、

我在Pandas中有一个这样的数据帧： # https://www.datasciencemadesimple.com/reshape-long-wide-pandas-python-pivot-function/ import pandas as pd import numpy as np from platform import python_version print(python_version()) #3.7.7 #Create a DataFrame d = {'countries':['A','B','C'

浏览 75提问于2020-10-18得票数 0

4回答

如何按行对数据帧进行排序？

、、

我有一个数据框架： import pandas as pd df = pd.DataFrame(data={'x':[7,1,9], 'y':[4,5,6],'z':[1,8,3]}, index=['a', 'b', 'c']) 它显示：如何按行‘a’对此数据帧进行排序:对数据帧进行排序后，可能是：

浏览 0提问于2016-08-14得票数 1

1回答

matplotlib pandas plot中的附加“类似轴”图

、、、、

我将一些数据存储在pandas数据帧中。另外，我使用matplotlib来创建显示数据的图。请看这张漂亮的图片：红线显示了一些对应于x轴点的值。它只是数据帧中的一列。我想添加额外的注释，对x轴点进行分类。这些类别作为附加列存储在原始数据帧中。它不必看起来与图片中的完全一样。目标是以某种方式显示x轴范围分类。添加这样一个注解的聪明而优雅的方式是什么？

浏览 7提问于2017-07-18得票数 4

回答已采纳

1回答

有没有办法根据有序类别中的项目数量来过滤熊猫数据帧？

、、

基本上，我有一个pandas数据帧，它有一个不方便的有序类别字段，我甚至可能不知道类别值是什么，我只知道它是有序的，类别中有三个值： import pandas as pd dfs = pd.DataFrame({'C1': pd.Categorical(list('abbacabac'), categories=['a', 'b', 'c'], ordered=True), 'C2': [1,2,3,4,5,6,7,8,9]}) 例如，我可以通过执行以下操作来获取第二类中的所有项： df1 =

浏览 22提问于2020-09-16得票数 2

回答已采纳

2回答

熊猫散点图

、

我是Python和Pandas的新手，但我有一个包含多个列的CSV文件，我已经将其读入到一个数据帧中。我想画一张数据和y=‘x=Index’的散点图。其中索引是数据帧的索引，是日期。谢谢堆，杰森

浏览 0提问于2012-12-18得票数 8

回答已采纳

4回答

如何在不换行的情况下创建.csv文件？

、、

我有一个可以在pandas DataFrame中完美读取的.csv文件，它有一列，让我们称它为Column1，有5个不同的值(0,1,2,3,4)，我正在尝试创建四个新的csv文件，每个类别一个。为此，我使用带有默认参数的pd.to_csv。然而，我的问题是，我的数据帧的第二列是由字符串(用引号括起来)组成的，其中可能有断点，所以当我创建新文件时，Column2的数据将被移动到Column1。如下所示： Column1 Column2 0 'this is correct' 1 'th

浏览 0提问于2018-09-18得票数 0

2回答

在IX上调用Pandas缓存值吗？

、

我注意到在大型熊猫数据帧上使用IX时出现了一些奇怪的行为。当我连续对同一数据帧调用.ix 50次时，它的运行速度比我对50个不同数据帧调用.ix时快10倍。在.ix上有没有在幕后进行缓存？我注意到底部循环会使我的内存使用量加倍。为什么内存会增加？有什么方法可以修改这个行为吗？请注意，如果你直接使用numpy，它在两种情况下都运行了7.4秒，内存增加为0，这让我相信pandas正在缓存。显然，您永远不会想对每个单独的元素调用.ix ... import pandas as pd import numpy as np import datetime as dt print 'pa

浏览 0提问于2012-12-04得票数 1

回答已采纳

2回答

优化PySpark与pandas DataFrames之间的转换

、、、、

我有一个13M行的pyspark数据帧，我想把它转换成pandas数据帧。然后，将根据其他参数以不同的频率(例如1秒、1分钟、10分钟)对数据帧进行重新采样以进行进一步分析。从文献[，]中，我发现使用以下任何一行都可以加快pyspark到pandas数据帧之间的转换： spark.conf.set("spark.sql.execution.arrow.pyspark.enabled", "true") spark.conf.set("spark.sql.execution.arrow.enabled", "true") 但是，

浏览 11提问于2021-11-19得票数 0

1回答

将pandas数据帧数据存储到python - ValueError中的变量

、

我是Pandas的新手，我已经在stackoverflow上找到了这个问题的答案，但似乎仍然不能让它工作-尽管我看到了很多关于这个问题的参考。我有一个包含两个移动平均列MA13和MA48的数据帧。我想要迭代数据帧，在每一行上从另一个减去一个，并使用结果来执行各种操作-按照下面的代码： Df.iterrows()中行的positions=0： if (df['13MA'] > df['48MA'])and positions == 0: positions==1 print('Buy') elif (

浏览 0提问于2016-04-24得票数 0

2回答

如何根据条件在recyclerView中隐藏子项？

、、

首先，我使用了下面的代码，但它没有显示带有Food类别的物品的易腐性。 if(model.main_category=="Food"){ holder.itemView.tv_dashboard_item_type.text="Perishable" }else{ holder.itemView.tv_dashboard_item_type.visibility=View.GONE } 然后我使

浏览 5提问于2021-06-21得票数 1

回答已采纳

1回答

一次热编码-将多列编码为一列

、

我想编码一个数据帧，它有多个相同“类型”的列，例如： import pandas as pd df = pd.DataFrame(data=[["France", "Bupapest", "Sweden", "Paris"], ["Italy", "Frankfurt", "France", "Naples"]], columns=["Countries 1", "Cities 1", "Countries 2", &

浏览 22提问于2018-02-08得票数 3

1回答

使用x，y坐标从Pandas dataframe中移除数据并插入到另一个Dataframe中

、、

我正在尝试使用pandas在数据帧中搜索数据，然后使用收集的数据将这些数据插入到新数据帧上的特定位置。假设我的代码是这样的： If row contains [A] then x=data.iloc[<row>, <column selection>] y=data.iloc[<row>, <column selection>] z=data.iloc[<row>, <column selection>] insert x to newdataframe at location (y,z

浏览 0提问于2019-09-05得票数 0

1回答

Wordpress自定义域输出未超链接。不管怎样，也要做同样的事情？

、、

我在文章末尾使用了名为company_name的wordpress自定义字段来显示公司名称。我可以显示自定义字段的值，但输出并不像wordpress类别那样是超链接的。我想要的是，当访问者点击公司名称时，wordpress应该会显示与该公司相关的所有帖子。我不想使用wordpress类别来解决这个问题。谁可以帮助我与自定义字段。

浏览 0提问于2010-10-23得票数 0

1回答

pandas多指数平均和分组

、、

我已经为我的数据创建了一个嵌套字典，它想要转换为pandas数据帧，并在以后对数据的某些子集进行平均。简而言之，我从一本空字典开始 scores = {} 然后通过循环遍历4个类别来填充它 scores[(subdir, method, time, 'nMI')].append(nMItemp) 我把它转换成了熊猫数据帧 df = pd.DataFrame(scores) 这个看起来像这样 ? 我现在想要做的是，例如，在类别“0.316228 0.562341 1.000000 1.778279 3.162278 ...”中逐行计算所有数据的平均值“nMI”。在父组

浏览 12提问于2019-12-28得票数 2

回答已采纳

1回答

为什么pandas.where()返回'None‘

、

我试图使用pandas.where()从数据帧中的列中删除负值。删除负值的最明显方法是在列上运行pandas.abs()。所以： import pandas as pd frame = pd.DataFrame([-1,-1,-3,-4,-5],columns=["amount"]) frame.amount = frame.amount.abs() 但是我想使用pandas.where()来尝试同样的方法。因此，我尝试了以下几点： frame.amount = frame["amount"].where(frame["amount"] &

浏览 0提问于2019-05-27得票数 2

回答已采纳

2回答

在将NaN数据帧插入到BigQuery表中时处理Pandas值

、、、、

我使用以下代码将具有多个NaN值的Pandas数据帧插入到BigQuery表中。数据帧是在云数据实验室中准备的。 import google.datalab.bigquery as bq bqtable = ('project_name', 'dataset_name', 'table_name') table = bq.Table(bqtable) table_schema = bq.Schema.from_data(df) table.create(schema = table_schema, overwrite = True) tab

浏览 23提问于2018-10-24得票数 9

1回答

使用值填充列(pandas)

、、、、

我在使用pandas的列中填充值时遇到问题。我想添加描述客户年收入类别的字符串。我希望数据帧长度的20%得到“最低”值，9%的数据帧应该得到“中下”值，等等…我考虑创建一个列表并附加值，然后将其设置为列的值，但随后我得到值的ValueError长度(5)与索引的长度(500)不匹配 list_of_lists = [] list_of_lists.append(int(0.2*len(df))*"Lowest") list_of_lists.append(int(0.09*len(df))*"Lower Middle") list_of_lists.appen

浏览 25提问于2020-12-08得票数 0

回答已采纳

0回答

熊猫交叉表平均值

、、、

我正在尝试对Pandas数据框执行交叉表查询。它看起来像这样： | Category | Score1 | Score2 | Score3 | Score4 | 1 | 2 | 3 | 5 | 12 | 1 | 3 | 4 | 2 | 5 | 2 | 1 | 6 | 8 | 6 我想创建一个交叉表查询，如下所示，类别为列，分数为行： Category| 1 | 2 | 3 | Score 1 |

浏览 2提问于2018-07-06得票数 1

回答已采纳

2回答

ModuleNotFoundError:数据库中没有名为“”xlsxwriter“”的模块

、

我正在尝试将pandas dataframe的内容保存到windows/azure databricks的excel文件中。将熊猫作为pd导入根据数据创建一个Pandas数据帧。 df = pd.DataFrame({'Data'：10，20，30，20，15，30，45}) 使用XlsxWriter作为引擎创建一个Pandas Excel编写器。 writer = pd.ExcelWriter('pandas_simple.xlsx'，engine='xlsxwriter') 将数据帧转换为XlsxWriter Excel对象。 Df.to

浏览 234提问于2020-07-03得票数 2

1回答

汇总Pandas数据帧中的列的部分

、、

假设我的Pandas数据帧中有两列 Category Price Weekend 30 Weekend 20 Thursday 10 Wednesday 5 Weekend 55 我想要总结类别并添加值。例如，我想将"Weekend"的所有值相加，并将其存储在字典中。所以我有一些类似的东西： summary = {"Weekend":105, "Thursday": 10, "Wednesday": 5} 我该如何轻松地做到这一点呢？

浏览 17提问于2017-02-15得票数 1

1回答

将H2o中的范畴特征(Enum)转换为布尔值

、、、、

在我的Pandas中，我有很多布尔特征(True/False)。如果我做bool的话，熊猫将它们正确地表示为df.dtypes。如果我将数据帧传递给h2o (h2o.H2OFrame(df))，则布尔功能将表示为enum。因此，他们被解释为两个类别的分类特征。是否有办法将特性的类型从enum更改为bool？在Pandas中，我可以使用df.astype('bool')，在H2o中有类似的吗？其中一个想法是在将True/False转换为H2O框架之前，将df编码为它们的数字表示形式(1/0)。但H2o现在承认这是int64。提前感谢您的帮助！

浏览 0提问于2018-06-22得票数 2

1回答

在pandas dataframe中添加列，但逐行添加

、

我似乎没有找到一个完全适合我需要的问题。我逐行迭代了一个熊猫数据帧。然后，根据行中的每一项，我对其他一些数据帧和文件集进行一些复杂的操作，并进行回归。THe输出的那个回归，我想把它作为一个列插入到这个原始数据帧中。尝试了几个方法，但都不起作用。这就是我正在尝试的 import pandas as pd ... dfd = <my dataframe> dfd['new column'] = 0 #initializing with 0. THis also did not work for i, row in dfd.iterrow(): <

浏览 0提问于2014-04-21得票数 0