使用数据帧中每行的最近点追加pandas行_panda数据框中每行的最近点_查找数据帧中每个点的最近点 - 腾讯云开发者社区

、

我有一个m行n列的pandas数据帧。我想要找到每一行中出现的最大值的列索引。我尝试使用idxmax，但它只返回第一次出现的最大值。数据帧每行有多个最大值，我想要获得每行中最大值的所有索引。

浏览 1提问于2018-05-29得票数 0

3回答

如何在Pandas数据帧中找到最大值的行和列的索引？

、、

我有一个很大的Pandas数据帧，我想找出最大值所在的列和行(在整个数据帧中)。不幸的是，df.idxmax()只返回每行/列的最高值的索引，而不是整个数据帧的索引。有没有办法做到这一点？

浏览 136提问于2021-07-28得票数 2

回答已采纳

1回答

Pandas append函数添加新列

我想将一行附加到我的数据帧中。下面是代码 import pandas as pd citiesDataFrame=pd.read_csv('cities.csv') citiesDataFrame=citiesDataFrame.append({ 'LatD': 50, '"LatM"' : 70, '"LatS"' : 40, '"NS"': '"S"', '"LonD"': 200, '&#

浏览 40提问于2020-11-25得票数 0

1回答

如何提取pandas数据框列中的数据框

、、、、

从pandas数据框(3* 5)中，如何将一列(包含数据框对象的行作为值(每行数据框2* 10) )提取到单独的数据框(6* 10行) log_df['df_inside'] = log_df['input'].apply(lambda x :parser(x)) parser(x)在应用之后为每一行返回一个数据帧(2* 10)。在上述步骤之后，如何从日志条目中提取df_inside数据帧？

浏览 22提问于2021-06-22得票数 0

2回答

如何迭代地将一个随机值添加到Pandas Dataframe中的许多行？

、、、

假设我有一个名为df的Pandas Dataframe，它的结构如下： Column 1 Column 2 ......... Column 104 Row 1 0.01 0.55 3 Row 2 0.03 0.14 1 ... Row 100 0.75 0.56 0 我正在尝试完成的是，对于所有符合下面给定条件的行，我需要生成更多的行，并将0和0.05之间的随机值添加到每行中：-

浏览 45提问于2019-06-07得票数 1

回答已采纳

2回答

我在pandas中有一个数据帧，看起来有点像这样： A B C 1 0.5 0.6 1 0.7 0.1 2 0.3 0.2 3 0.1 0.3 3 0.2 0.1 在jupyter中打印熊猫数据帧时，默认输出样式是使用交替的浅色和灰色背景对每行进行着色。我希望能够调整每组列A值的背景颜色，以便每组都有一个交替的配色方案。因此与默认样式类似，除了每行背景不是灰色和白色交替，而是由来自列A的一组值交替。我在这里找到了一些文档：https://pandas.pydata.org/pandas-docs/stable/us

浏览 19提问于2019-08-27得票数 2

回答已采纳

2回答

pandas，尝试每个movie_id仅采样5行，来自数据帧，其中有太多行

、、

就总行数而言，我有一个巨大的dataframe df，实际上它里面有太多的行。我需要以一种合理的方式限制行数，同时仍然保持每部电影在数据帧中有相同数量的评论(目前差异很大) 数据帧的形状如下所示第一列是userID，第二列是animeID (本质上是movieID)第三列是用户自己对该电影的评分。每一行都是一个电影评论。在animeID列中应该有大约300个movieIDs。在movieID中，我需要做的是限制行的数量，以便重采样该数据帧，使其每个pandas (即pandas)只有5行左右，并且新的数据帧应该只有那些新采样的行。我完全纠结于如何在pandas中做到这一点，也许我可以在e

浏览 28提问于2019-03-11得票数 1

回答已采纳

1回答

Python Pandas:在每个元素中使用pd.Series填充数据帧

、、

sktime库需要一个非常“特殊”的data format。对于n个时间序列，每个序列的T值需要存储在长度为T的pandas序列的pandas Dataframe中，如下所示： DataFrame： index | Data 0 | pd.Series 1 | pd.Series ... | ... n-1 | pd.Series 我试图通过读取另一个数据帧来填充循环中n=2和T=3的空数据帧，但没有成功。下面是我的简化版本，在每一行中使用一个常量pd.Series： import pandas as pd df = pd.DataFrame(

浏览 14提问于2020-06-17得票数 1

回答已采纳

2回答

从Python dataframe的列的每一行中移除前x个字符

、、、、

我有一个大约1,500行15列的Python数据帧。对于一个特定的列，我想删除每行的前3个字符。作为一个简单的例子，这里有一个数据帧： import pandas as pd d = { 'Report Number':['8761234567', '8679876543','8994434555'], 'Name' :['George', 'Bill', 'Sally'] } d = pd.DataFrame(d) 我想

浏览 5提问于2017-02-21得票数 43

回答已采纳

2回答

如何通过插入带有缺失值的新行来规范化我的数据帧？

、、、、

我正在尝试使用缺少的值更新我的数据帧，当前的数据帧如下所示 from pandas import DataFrame boxes = { 'A': [0, 4, 10, 15, 30, 50], 'B': [3, 7, 14, 21, 44, 100], } df = DataFrame(boxes, columns= ['A','B']) 但是我需要编写一个函数，该函数可以用列A和列B的缺失值更新数据帧。例如，添加新行的值A是8，B是9，A是22，B是29，A是45，B是49

浏览 7提问于2020-07-03得票数 0

回答已采纳

1回答

VS代码终端格式

、、、

我在VS代码中使用了Python3和pandas。由于家庭办公，我买了一台比工作时小的显示器。我刚刚打印了一个pandas数据帧，正如你在图片中看到的，格式很奇怪-它把每行的最后几个字符放到一个新行中？有人知道为什么会这样吗？如果有很多列，pandas不会自动跳过中间的列以避免这种情况发生吗？顺便说一句，很抱歉图片中的油污，不得不覆盖一些私人数据。 ?

浏览 16提问于2021-04-09得票数 0

2回答

如何在每列只有1个非空条目的pandas数据帧中将多行合并到一行中？

、、

我正在使用json_normalize解析pandas列的json条目。但是，作为输出，我得到了一个数据帧，其中有多行，每行只有一个非空条目。我想在pandas中将所有这些行组合成一行。 currency custom.gt custom.eq price.gt price.lt 0 NaN 4.0 NaN NaN NaN 1 NaN NaN NaN 999.0 NaN 2 NaN NaN NaN NaN 199000.0 3 NaN NaN other NaN NaN 4 USD NaN NaN NaN NaN

浏览 24提问于2019-06-16得票数 2

回答已采纳

1回答

关于按索引将二维数据帧整形为三维数据帧

、

我想问一下，pandas中有没有什么函数可以根据索引将数据帧从2d重塑到3d呢？ col1 col2 col3 id 1 1 2 3 1 4 5 6 1 7 8 9 例如，我有3行具有相同的id(+1 id行)，每一行都有3个参数，丢弃id，数据帧是1x3 (每行)，我想让它(3x1x3)(通过相同的id)。我尝试了groupby concat和join，但不起作用。谢谢

浏览 10提问于2021-10-14得票数 0

回答已采纳

3回答

比较pandas数据帧的行(行有一些重叠值)

、、

我有一个包含21列的pandas数据框架。我将重点放在具有完全相同的列数据值的行子集上，除了每行唯一的6个之外。我不知道这6个值对应的是先验的列标题。我尝试将每一行转换为Index对象，并对两行执行set操作。例如。 row1 = pd.Index(sample_data[0]) row2 = pd.Index(sample_data[1]) row1 - row2 它返回一个索引对象，其中包含row1独有的值。然后，我可以手动推断哪些列具有唯一值。如何以编程方式获取这些值在初始数据帧中对应的列标题？或者，有没有办法比较两个或多个数据帧行，并提取每行的6个不同的列值，以及相应的标题？理想

浏览 4提问于2013-05-14得票数 8

1回答

pandas数据帧追加的效率

、、

我发现数据帧的检索速度非常快。我创建了100万行数据帧，过滤所需数据只用了不到1秒的时间。但是，当我使用append方法将数据添加到一个空的dataframe中时，它为什么会这么慢呢？这是我的代码，它花了2个多小时来执行。我遗漏了什么？或者有比df.append方法更好的添加数据的方法吗？ import pandas as pd import datetime import random data = pd.DataFrame(columns=('Open','High','Low','Close','Avg20&#

浏览 27提问于2021-11-02得票数 2

回答已采纳

1回答

删除pandas dataframe中每个列中符号后面的字符串的一部分

我想删除pandas数据帧中每行一列中'-‘之后的所有内容。我已经试过str.split了，但没有用。

浏览 3提问于2017-01-13得票数 0

1回答

使用Vincent向现有的织女星可视化添加'domainMax‘属性

、、、

我用StackedBar创建了一个Python。数据来自pandas数据帧，每列表示一个百分比，每行总和为100% Vincent / Vega正在尝试提供帮助，并在Y轴上添加一个缓冲区，以便当我想成为100时，它在110 (%)时达到最大值。我需要添加的属性是Y标度语法中的'domainMax‘，但是在导入Pandas数据帧之后，我不知道如何使用文森特的PropertySet或类似的命令来添加这个属性。以下是手动添加domainMax的数据示例，有人能建议如何在Python语言中执行此操作吗 "scales": [ { "domain&

浏览 1提问于2013-12-12得票数 2

1回答

如何用层次指数计算大熊猫的平均数

、

我有一个具有1mi行和分层索引(国家、州、城市，按此顺序)的pandas数据帧，每行都有一个产品的价格观察。我如何计算每个国家、州和城市的均值和标准差(请记住，由于我的df很大，我正在避免循环)？对于每个级别的均值和标准差，我希望将值保存在此数据框中的新列中，以供将来访问。

浏览 16提问于2017-06-23得票数 1

回答已采纳

3回答

如何在覆盖模式下将熊猫数据帧保存到csv？

、

我想在覆盖模式下将pandas数据帧保存到csv。我希望每当程序再次运行时，如果有任何更改，那么它应该将数据帧保存到csv，并在该位置覆盖已经保存的csv文件。

浏览 4提问于2020-08-11得票数 0

1回答

删除分号作为行分隔符使用pandas.read_csv读取csv文件

、、

我正在处理我想要绘制的熊猫数据帧。数据帧中的一些值不是浮点数，而是字符串，因为它们有一个分号。当要绘制数据帧时，这会导致ValueError。我发现分号只出现在每行的末尾。在read_csv方法中是否有一个关键字可以让pandas识别分号，以便将其删除？

浏览 7提问于2020-12-11得票数 1

回答已采纳

1回答

用Pandas解析excel文件

有没有办法强制Pandas将excel文件中的每一列/每行一个单元格地读取到Dataframe中？我有一些非常时髦的电子表格，有很多奇怪的格式-合并的单元格，遗漏的行，等等。解析器试图读取这些内容时会抓狂。是否可以强制pandas创建n行、m列的数据帧，哪些内容将直接对应于从"A1“单元格开始具有相同维度的excel表表子集的内容？一种选择是在excel中将其另存为.csv (编写一个vba脚本以执行多个文件)，然后以.csv格式读取pandas，但我正在寻找更简单的解决方案。

浏览 2提问于2014-01-11得票数 2

1回答

按多列对数据帧进行分组

、

我想按多列对Pandas Dataframe进行分组。每行都有一个整数、一个名称和一个额外的数值。我希望最终的Dataframe包含名称具有最高整数的每一行。 values = {'Int': [1,1,1,2,2,1], 'Name': ['Tom', 'Jim', 'Jan','Tom', 'Tom', 'Lucas'], 'Bill':[0.5,0.2,0.2,0.7, 0.8, 0.2]} df = p

浏览 0提问于2019-04-08得票数 0

1回答

如何通过引用更新数据帧？

、、

我正在处理一个CSV文件，它被加载到一个数据帧(python/pandas)中。原始数据帧是df_origen，每行都有一个名为value的度量值，该度量值以1小时为间隔。我需要按15分钟的周期将新数据帧中的每行“调整”为4行。data df_origen中可能会有跳变。我做到了。 df_destiny = pd.DataFrame(pd.date_range(start, periods=96 * diff.days, freq='15Min'), columns=['from_time']) 之后，我迭代了dataset value以将值放入字段“df_

浏览 0提问于2016-11-29得票数 0

3回答

检查dataframe是否包含零元素

、、

在pandas数据帧中，检查是否至少有一个元素为0的最快方法是什么？假设数据是： Name Asset Revenue A 10 20 B 0 21 我需要返回true，因为至少有一个元素是0。数据帧中有一个元素，而不是每行/列有一个元素

浏览 0提问于2018-06-09得票数 7

回答已采纳

2回答

将3d numpy数组转换为1列pandas df和2d数组

、、、

我会将3Dnumpy数组转换为由2dnumpy数组组成的具有1列的pandas数据帧。具体示例： np_array = np.zeros((10,3,5)) print(np_array.shape) # (10, 3, 5) 因此，从这个数字数组中，我想创建一个1列的数据帧，它有10行，每行都有一个形状为(3,5)的项。尝试将其按原样转换为pd.DataFrame(np_array)会抛出ValueError: Must pass 2-d input错误。谢谢!

浏览 59提问于2021-01-07得票数 1

回答已采纳

1回答

Python Pandas识别错误数据

、、

我有一个用逗号分隔的csv文件，每行有215列。文件非常大，我使用pandas dataframe pd.read_csv()和块来读取数据。文件中的一行有214列，而不是215列，但dataframe读取数据时将NaN应用于最后一列。有没有办法在pandas dataframe中标识此行，因为我更喜欢dataframe而不是csv_reader。注意:最后一列也可以为null，因此按等于null的最后一列过滤数据帧将不起作用

浏览 19提问于2020-09-30得票数 0

3回答

在dataframe中复制x次行-提高性能

、、

我正在寻找复制数据帧行的最有效的解决方案。每一行都应该复制x次，其中x对于每一行都是唯一的。假设这是我给定的数据帧： | id | count | |----|-------| | a | 1 | | b | 2 | | c | 5 | 因此，数据帧应该如下所示，其中每一行都按照“count”列中给出的数量进行了复制： | id | count | |----|-------| | a | 1 | | b | 2 | | b | 2 | | c | 5 | | c | 5 | | c | 5 | | c

浏览 1提问于2020-08-24得票数 4

3回答

pandas:将数据帧拆分为多个csvs

、

我有一个大文件，导入到Pandas中的单个数据帧中。我使用pandas根据数据帧中的行数将文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9 有没有一种方法可以做到这一点，而不必创建更多的数据帧？

浏览 0提问于2017-11-22得票数 2

2回答

pandas:数据帧逐行比较

、、

我有两个数据帧，我想以行的方式比较它们是否相等。我感兴趣的是计算非连接属性具有相同值的行数。例如, import pandas as pd df1 = pd.DataFrame({'a': [1,2,3,5], 'b': [2,3,4,6], 'c':[60,20,40,30], 'd':[50,90,10,30]}) df2 = pd.DataFrame({'a': [1,2,3,5], 'b': [2,3,4,6], 'c':[60,20,40,30], 'd'

浏览 12提问于2020-02-29得票数 0

回答已采纳

2回答

列子集和过滤器Pandas

、

如何在一个命令中过滤Pandas数据帧中的行并仅获取pandas数据帧中的列的子集。我正在试着应用像这样的东西... frame[(frame.DESIGN_VALUE > 20) & (frame['mycol3','mycol6']))] 谢谢。

浏览 0提问于2015-10-02得票数 17

回答已采纳

1回答

将数据分割成两个或多个部分

我想要创建单独的数据帧，其中两个连续行之间的差值并不完全是60。从示例数据中，应该有两个数据(每行3行)。 from StringIO import StringIO myst="""905034, 'A', 'some value' 905094, 'B', 'some other value' 905154, 'C', 'some value other' 43, 'x', 'some' 103, 'y', 'v

浏览 0提问于2015-03-07得票数 0

回答已采纳

2回答

Pandas:如何从excel文件中读取DataFrame文件，其中多行有时用换行符分隔(\n)

、、、、

我正在尝试用pandas读取一些excel文件。在某些文件中，感兴趣的表的格式不是很好，即多行被格式化为单行，但每行都有多行。因此，当您查看excel文件时，数据显示得很好。此外，当使用pandas解析它时，每行的末尾确实有一个换行符(\n)。问题是，当我使用read_excel()函数读取它时，它将它转换成一个DataFrame，它不将换行符视为单独的行，而是将其放入包含\n的一行中。我想写一段代码，将每一行都转换为N行(使用换行符作为新行的指示符)。在解析文件或在Python中对数据帧进行后处理时，有没有办法做到这一点？在这里，我提供了一个非常简单的版本我的虚拟excel文件和一些代

浏览 6提问于2019-04-11得票数 6

3回答

将python迭代器输出转换为pandas数据帧的最快方法

、

我有一个生成器，它返回未知数量的数据行，我希望将这些数据转换为索引的pandas数据帧。据我所知，最快的方法是将CSV写入磁盘，然后通过'read_csv‘解析回来。我知道创建一个空的dataframe，然后不断地追加新的行是没有效率的。我不能创建预置大小的dataframe，因为我不知道将返回多少行。有没有一种方法可以将迭代器输出转换为pandas数据帧而不写入磁盘？

浏览 1提问于2017-03-24得票数 12

2回答

作为DataFrame列的Scipy稀疏矩阵

、、、、

我正在开发基于pandas DataFrame对象的工具。我希望将scipy稀疏矩阵保留为DataFrame的列，而不是将其按行转换为dtype('O')的列表/数值数组。下面的代码片段不起作用，因为pandas将矩阵视为标量，并建议添加索引。当在矩阵中的行索引上提供pd.RangeIndex时，矩阵将对数据帧中的每一行重复(因为pandas认为它是标量)。 ma = scipy.sparse.rand(10, 100, 0.1, 'csr', dtype=np.float64) df = pd.DataFrame(dict(X=ma)) 这是可行的： df

浏览 12提问于2016-09-12得票数 4

回答已采纳

3回答

如何使用自定义标头将pandas.DataFrame写入csv文件？

、、、

我有一个数据帧 import pandas as pd df = pd.DataFrame([[1, 2], [3, 4]], columns=['a', 'b']) 我希望在不使用列['a', 'b']的情况下将df写入csv文件。第一行是我的自定义字符串，其余行是df.values的内容。例如： numrows numcols note 1 2 3 4 我能用pandas来做这件事吗?或者我必须手动遍历内容并写入文件？

浏览 0提问于2019-05-16得票数 6

回答已采纳

1回答

如何在Dask中获取从拼图文件读取数据帧的单行值？

、

问题: DASK数据帧 loc[concrete_row, concrete_column] 返回多行的pandas数据帧，每行都有相同的索引： 0 [1,2,3] 0 [1,2] 0 [3] 而不是一个行值。 0 [1,2,3] 我正在阅读许多拼图文件： dd.read_parquet(dataset_dir+'/train/date*/*.parquet') 拼图文件中的每一行都有一个数组！似乎在调用具体行时，dask data

浏览 48提问于2019-06-05得票数 0

1回答

将每个二元语法从列表格式移动到Pandas或Pyspark数据帧中的新行

、、、、

我有pandas和pyspark数据帧，每天每行都有二元组的列表。我想打破列表，并将每个二元组合移动到一行，计数按降序排列。如下所示是我拥有的数据帧。我已经按event_dt进行了排序。在“merged”列中，显示了二元语法的列表。例如，“漂亮的相遇”和“相遇后付费”是两个二元语法。双连词的列表每天都在继续... ? 现在，我想要将每个biagram移动到同一日期的新行。例如，“nice meet”将在一行中，而“meet postpaid”将在另一行中，而event_dt列则显示相同的日期。我还希望双字母组的计数在降序，也希望得到前10或前20个计数双字母组为每个日期。这里我希望

浏览 40提问于2020-10-23得票数 0

回答已采纳

2回答

Pandas数据操作-每行多个度量到每行一个度量

、

我正在使用Python中的Pandas操作数据框以匹配特定的格式。我目前有一个数据帧，每个测量位置(A或B)都有一行。每行都有一个标称目标和多个测量数据点。这是我目前使用的格式： df= Location Nominal Meas1 Meas2 Meas3 A 4.0 3.8 4.1 4.3 B 9.0 8.7 8.9 9.1 我需要操作此数据，以便每行只有一个测量数据点，并将位置和标称值从源行复制到新行。测量数据也需要放在第一列中。这是我需要的格式： df =

浏览 54提问于2018-06-07得票数 2

回答已采纳

1回答

包含列表的列条目上的Pandas .isin

、、

我尝试使用isin()函数过滤数据帧，方法是传入一个列表，并与也包含列表的dataframe列进行比较。这是下面问题的延伸： How to implement 'in' and 'not in' for Pandas dataframe 例如，现在每行包含一个国家/地区列表，而不是每行一个国家/地区。 df = pd.DataFrame({'countries':[['US', 'UK'], ['UK'], ['Germany', 'France'], ['

浏览 23提问于2019-08-22得票数 1

回答已采纳

1回答

将Eratosthenes筛法和最长通用后续算法应用于pandas数据帧去重

、

我想从数据帧中删除重复项。如果'summary'列中的30个字符匹配，我认为2行是重复的。所以我有最长的公共后续函数： def lcs(X, Y, th=30): '''X, Y- strings th-threshold ''' m=len(X) n=len(Y) if m<th or n<th: if X==Y: return True else: return False LCSuf

浏览 0提问于2020-08-24得票数 0

1回答

在pandas数据框行中求第k个数最小值的方法

、、、、

给定一个m行n列的数据帧，我希望每行的列名都是minimum。我使用的是for循环。接下来，我使用获得的列执行测试，如果测试失败，我希望在同一行中使用第二个最小值，依此类推。我当前的代码对每一行的数据帧进行排序。当然，第一个值是最小值。我执行测试。如果测试失败，我转到第二个值，依此类推。代码附在下面。data和dfObj是pandas数据帧对象。 for i in data.index: #for each row dfObj = data.sort_values(by = i, axis=

浏览 18提问于2020-05-14得票数 0

2回答

将azure kinect JSON输出转换为BVH

、、、

我当前的流程是这样的我使用Azure-Kinect SDK v1.41附带的k4arecorder录制了两个MKV视频。在第一种情况下，人处于T形，在第二种情况下，他们在做一些运动。然后，我使用来自Microsoft/Azure-Kinect-Samples/body-tracking-samples的offline_processor将这两个视频转换为JSON对象。对于每一帧，JSON包含x，y，z位置，其中z相对于相机位置，y+指向下方，以及每个关节的四元数方向。对于T-Pose json对象，我提取了1帧位置和旋转，其中T-Pose是完美的。然后，我将这个JSON对象解析为位置

浏览 111提问于2021-05-05得票数 0

1回答

具有基于列和的自定义回看长度的Pandas滚动窗口

、、

给定由日期索引的具有两列"atbats“和" hits”的pandas数据帧，是否有可能获得最近的历史击球平均值(每atbat的平均点击数)？例如，历史平均击球率可能是最少的击球率大于10。这有点像一个滚动窗口，具有有条件的回顾周期数。例如，给定： date, atbats, hits, 2017-01-01, 5, 2, 2017-01-02, 6, 3, 2017-01-03, 1, 1, 2017-01-04, 12, 3, 2017-01-04, 1, 0, 在第一天，没有任何历

浏览 0提问于2017-09-14得票数 1

1回答

逐行高效地构建pandas数据帧

、、

我最近一直在通过迭代多个文件、行等来构建pandas数据帧。我一直在通过在字典中附加项目，然后转换为数据帧来构建它们：据我所知，还有其他工具，如apply()和interrows()，用于逐行应用或筛选数据。这不是这个问题的主题。 new_data_dict = {} for r in df.index: new_data = df.loc[r] **2 new_data_dict[r] = new_data new_df = pd.DataFrame.from_dict(new_data_dict, orient = 'index') 这是构建熊猫df的最

浏览 0提问于2017-02-23得票数 5

1回答

如何知道每个聚类标签对应的矩阵行？

、、、

完成聚类后，我最终得到了一个存储所有集群标签的对象，如下所示： clusterer.labels_ 上面通常是一个列表或数组。然后，我总是像这样将标签分配给原始的pandas数据帧(数据集)： df['cluster_lables] = cluster.labels_ 最后，我假设cluster.labels_的每个元素对应于原始数据集的每一行，这个假设正确吗？例如，在上面的专栏创建中，我最终得到了类似这样的结果： ColA ColB cluster_labels 1 3 -1 2 4 2 ... 89 90 45

浏览 0提问于2018-07-08得票数 1

1回答

重复并增加Pandas的列值

、、、

我是Pandas的新手，所以这听起来很愚蠢。我的数据帧如下所示：目标是检查字段'D‘并创建具有相同ID的D行，但每行的'Time’递增5。例如，如果ID = 3，时间=0，D=5，那么我希望在具有相同ID的原始行之后再增加5行，但每行的时间增加5行。因此，时间字段将是0、5、10、15、20、25，而行中的其他字段保持不变。这在熊猫身上是可能的吗？我尝试过以下几种方法 df = pd.DataFrame(probeTTableTups, columns=['ID','Time','D']) df2 = df.loc[df.in

浏览 17提问于2021-05-26得票数 1

回答已采纳

2回答

优化PySpark与pandas DataFrames之间的转换

、、、、

我有一个13M行的pyspark数据帧，我想把它转换成pandas数据帧。然后，将根据其他参数以不同的频率(例如1秒、1分钟、10分钟)对数据帧进行重新采样以进行进一步分析。从文献[，]中，我发现使用以下任何一行都可以加快pyspark到pandas数据帧之间的转换： spark.conf.set("spark.sql.execution.arrow.pyspark.enabled", "true") spark.conf.set("spark.sql.execution.arrow.enabled", "true") 但是，

浏览 11提问于2021-11-19得票数 0

1回答

文件结构不一致的Pandas中的Read_csv

、、

在行尾不是标准的情况下，将csv文件读入pandas数据帧时遇到问题。下面是我的代码： df_feb = pd.read_csv(data_location, sep = ",",nrows = 500, header = None, skipinitialspace = True,encoding = 'utf-8') 以下是输出(略去个人信息)：这是输入数据的样子：上面的输出将本应为一行的内容拆分为4行。对于每个电话号码(电话号码=划线比特)，应该开始一个新的行。我的目标是让每行代码看起来像这样：提前感谢您的帮助！

浏览 1提问于2018-07-10得票数 1

1回答

基于经度/纬度坐标数组创建用于贴图的多边形--Python PANDAs

、、、

我有一个PANDAs数据帧，每行有一个经度/纬度坐标数组，每行对应一个不同的区域。我想从每一行的坐标数组中创建一个带有边界的映射多边形组。 coords列的行看起来像这样，每个边界坐标用逗号分隔... coords 0 -88.12166374975578 42.13019789209025, -88.12166297898594 42.130077282796826, -88.12166229779616 42.12997073740438, -88.12165682902426 42.129114208546525, -88.12165440666122 42.12867029

浏览 5提问于2017-08-26得票数 1

回答已采纳

1回答

计算后续pandas数据帧行之间的营业天数

、、

我有一个大型的pandas数据帧(超过1000000行)，我需要以最快的方式获得两行(n和n+1)之间的营业天数(周末除外)，其中每行都包含一个date列。每次，我都需要将相同数据帧的第n行中的持续时间(结果)存储在名为“duration”的列中。结果以秒为单位。我正在使用下面的代码以我所知道的最快的方式进行计算(欢迎使用任何更好的方式;-)。 tmp_df['duration'] = tmp_df['origin_tick_generation_time_stamp'].shift(-1) - tmp_df[

浏览 0提问于2019-10-04得票数 1