无法拆分pandas数据报中的列_拆分pandas中的列_拆分Pandas中的date列 - 腾讯云开发者社区

、、、

我想从pandas dataframe中删除行，该数据帧包含长度大于所需长度的特定列中的字符串。例如：输入帧： X Y 0 Hi how are you. 1 An apple 2 glass of water 3 I like to watch movie 现在，假设我想从dataframe中删除包含长度大于或等于4的单词字符串的行。所需的输出帧必须为： X Y 1 An apple 2 glass of water 当列0中的字数为4和列3中的字数分别为5时，删除列'X‘中值为0、3的行。

浏览 144提问于2019-06-12得票数 9

回答已采纳

3回答

Regex用于选择直到特定字符的所有逗号

、

我在使用正则表达式的时候过得很糟糕。承认这一点对我来说很可怕，但我只是没有充分利用它们，在需要的时候做得很好。基本上，由于我们的应用程序的运行方式，我将一个.csv文件的内容提取到一个字符串中。实际上，我需要在已经存在的东西上面和下面插入一个新行。列数可以根据报表的不同而变化。我想要做的是获取字符串中不带任何其他字符(包括空格)的所有逗号，直到字符串中的第一组\r\n。这样，我就有了所有的列，我可以在顶部插入一个空白行，然后用我需要的内容填充这些列。以下是.csv文本的示例： "Date, Account Code, Description, Amount\r\n23-Apr-13,1

浏览 0提问于2013-04-24得票数 0

回答已采纳

1回答

当将熊猫DataFrame保存为羽毛时，可以指定列类型吗？

、、

当前，如果一个列碰巧只有空值，则会抛出一个异常，并带有以下错误：无效:无法推断对象数组的类型，均为空可以指定列的类型，而不是推断类型？版本： feather-format==0.3.1 pandas==0.19.1 样本代码： feather.write_dataframe(pandas.DataFrame([None]*5), '/tmp/test.feather')

浏览 1提问于2017-01-03得票数 4

回答已采纳

1回答

dataframe连接和重新分区大文件，用于时间序列和相关性。

、、、

我有11年的数据和记录(行)每秒钟，超过100列。它用一系列的日期时间(用Pandas to_datetime()创建)进行索引，我们需要能够在列之间进行一些相关分析，一次只能加载两个列。我们可能在较低的时间(例如48小时、1小时、月等)重新采样。在长达11年的时间里，把这些关联想象成11年。数据目前在11个单独的拼花文件中(每年一个)，从11个.txt文件中单独生成Pandas。熊猫没有对任何这些文件进行分区。在内存中，这些拼花文件中的每一个都加载了大约20 In的内存。预期的目标机器只有16 GB，即使在11年中只加载1列也需要10 GB，因此两列也不适合。是否有一个比使用Pandas

浏览 29提问于2022-06-20得票数 1

1回答

python:使用for循环将数据帧拆分到多个数据帧中

、、

我有一个名为df_portfolio的数据帧。我想根据报价器列和所有权列将此数据帧拆分为3个不同的数据帧。我无法让我的代码工作。这就是我到目前为止所拥有的，但是它返回一个空的dataframe。 # split dataframe print('splitting dataframe per ticker and ownership ... ') # set up empty dataframes df_vusa = pd.DataFrame() df_iaex = pd.DataFrame() df_vwrl = pd.DataFrame() # create

浏览 16提问于2021-01-23得票数 0

2回答

字符串之间的分钟数格式"hh:mm - hh:mm“python

、、、

我有pandas df和TimeOfWork列，它有一种str类型。所有值看起来都是这样的 "hh:mm - hh:mm“ 我需要每个人工作的分钟数新的列。例如，如果在列TimeOfWork中有一个值"10:00 - 11:30“，那么在新列中应该有90。人们可以在午夜工作，所以值可以是"22:00 - 01:00“

浏览 0提问于2021-05-06得票数 0

1回答

同时删除错误的dtype行和列

、、、、

我有一个大的数据集，有16列和大约10亿行。在这个数据集中，我面临两个主要问题我有错误行，因为某些行的列数是more or less，而不是16列。我使用的是跳过行的error_rows=False，但是我正在执行大约30个操作，每次都要花费太多的时间。其中一列是人类可读格式的DateTime。同时执行将人类可读的格式转换为Unix格式的操作之一。dtype无法读取，主要是因为error_rows 这给我带来了错误&关于dtype或插入low_memory=False的警告如果我要插入dtype，那么下一个错误和警告将转移到另一列。代码： for

浏览 4提问于2017-06-01得票数 0

回答已采纳

1回答

使用Pandas -Exception导入数据表:索引(列0)具有重复值[nan]

、

我是pandas的新手，所以如果我忽略了一些显而易见的事情，请原谅我，但我似乎在前面的问题中找不到答案。我试图将一个表导入到Pandas中，该表有任意数量的空格作为分隔符。下面是数据的一个示例： *PRODUCT : Backscatter Ratio - 1064.0 nm ^ Altitude 2010/03/23 17:01:00 2010/03/23 17:03:00 ... 1.50 1 1

浏览 6提问于2012-06-12得票数 1

1回答

BIRT报告:基于数据集数据向表中动态添加列

、

在我的报表中，有一个表显示了数据集的结果，它有6列。但有时数据集根据报表参数返回6个以上的列。因此，我需要一种向表中动态添加列的方法谢谢

浏览 3提问于2015-08-20得票数 0

1回答

Python Pandas -手动计算分位数

、、、

我试图手动计算列值的分位数，但与Pandas的结果输出相比，无法使用公式手动找到正确的分位数值。我四处寻找不同的解决方案，但没有找到正确的答案。 In [54]: df Out[54]: data1 data2 key1 key2 0 -0.204708 1.393406 a one 1 0.478943 0.092908 a two 2 1.965781 1.246435 a one In [55]: grouped = df.groupby('key1') In [56]: grou

浏览 1提问于2017-07-03得票数 3

回答已采纳

1回答

学习DecisionTreeClassifier F-每次跑都能得到不同的成绩

、、

我试图使用Python来训练决策树分类器。我使用MinMaxScaler()来缩放数据，使用f1_score作为我的评估指标。奇怪的是，我注意到我的模型给了我不同的结果，在每次运行模式。我的代码中的data是一个(2000, 7) pandas.DataFrame，其中有6个特性列，最后一个列是目标值。第1、3和5列是分类数据。以下代码是我对数据进行预处理和格式化时所做的工作： import numpy as np import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.model_s

浏览 0提问于2018-11-22得票数 1

回答已采纳

1回答

有没有一个蓝色机器学习工作室模块，它的工作方式类似于潘达斯的“面具”方法？

、

我试图在Azure Machine Learning Studio中执行以下Pandas操作，但找不到处理它的模块： df.credit_score = df.credit_score.mask(df.credit_score > 800, df.credit_score / 10) 因此，我实际上只是试图在我的“credit_score”列中找到大于800的所有值，并将它们除以10。到目前为止，我还无法在AML Studio中找到这样做的模块。此外，我还应该补充一点，我在AML Studio中的Python脚本有问题，这就是为什么我试图使用AML内置模块复制我的所有代码。

浏览 0提问于2017-01-19得票数 1

回答已采纳

3回答

使用Pandas将一列中的数字与另一列中显示的小数位数相加

、、、

我希望从使用Pandas的另一列中显示的小数位数(不完全相同)中舍入一列中的数字。我的数据 numbers decimal 1.2345 2 2.3456 3 3.4567 2 预期输出： numbers decimal newcolA 0 1.2345 2 1.23 1 2.3456 3 2.346 2 3.4567 2 3.46 我的代码#1 import pandas as pd df = pd.DataFrame( data = { 'numbers' : [1.2345, 2.

浏览 2提问于2021-09-14得票数 1

回答已采纳

2回答

如何在拆分测试集后使用pandas数据帧？

、、、、

我最近学习了如何对我的pandas数据帧进行验证拆分，但在拆分之后，我注意到我无法对列进行切片。 print(my_data['column name']) 它抛出错误，请帮助。我的代码是这样的： import pandas as pd from sklearn.cross_validation import train_test_split data = pd.read_csv("labeledTrainData.tsv" , header = 0 , \ delimiter = '\t' , quoting

浏览 4提问于2016-08-03得票数 2

1回答

pandas将data文件读取为DataFrame，当一列只有一位数数据时会出现问题

、、、

我正在使用python pandas来分析txt数据。我试图用pd.read_fwf读取txt文件，但只有一列有？如下所示的字母 824334 4141.854 6100.175 11.040 -117.810 841013 2028.294 6221.566 10.913 -178.340 854890 4214.858 6322.255 10.645 -125.390 864353 4326.768 6389.329 10.815 -98.650 ? 864918 3187.398 6392.824 11.050 -91.2

浏览 35提问于2021-02-03得票数 0

1回答

这是使用熊猫根据其他列中的条件更新列的一种有效方法吗？

、、

这是一种使用熊猫根据其他栏目的条件更新列的有效方法吗？我希望概括一个更新函数，它将移动高斯值，而且我在使用lambda时遇到了困难，因为有多个列可能是条件。同样，应用也是有问题的，因为我无法使变量以它想要的形式出现，尽管老实说，我可能会在这部分花更多的时间。问题陈述:我应该如何处理根据另一专栏中的值更新大熊猫dataFrames的方法，以便能够在可接受的速度参数范围内运行许多这些函数？请回答一个完整的例子，如果可能的话，使用我的'silly_series_generator‘，以确保我们保持相同的问题案例。谢谢。 import random import pandas def s

浏览 3提问于2022-03-14得票数 1

1回答

是否有一个Pandas等价于Excel的‘文本到列’，使用可移动的删除仪？

、、、

我想根据某些关键字和整数来分割数据中的一些列。在excel中，使用可移动的分隔符显示如下所示：。我知道Pandas的str.split，但这似乎一次只限于一个分隔符，而且似乎不考虑整数。使用regex，我可以这样做来相应地拆分字符串。 s = "zone entries bin 1 zone center" s = re.split(r'(bin)|(\s+[0-9]+\s+)', s) (我不擅长regex，对于后一个结果，我必须删除None值)。但是，regex表达式似乎不适用于Pandas str.split。实现文本到列功能的最佳方法是什么？

浏览 1提问于2021-03-02得票数 1

回答已采纳

4回答

熊猫read_csv期望错误的列数，与破烂的csv文件

、、、

我有一个csv文件，它有几百行和26列，但最后几列只有几行的值，它们接近文件的中间或末尾。当我试图使用read_csv()读取它时，我会得到以下错误。"ValueError:期望23列，第64行获得26列“ 我看不出应该在哪里显式地声明文件中的列数，也看不出它是如何确定文件应该有多少列的。垃圾场在下面 In [3]: infile =open(easygui.fileopenbox(),"r") pledge = read_csv(infile,parse_dates='true') --------------------------------

浏览 2提问于2013-11-22得票数 31

回答已采纳

3回答

将日期时间转换为正确格式的问题-列的长度必须与键的长度相同

、、

我正在对dataset ()进行一些数据分析，并且正在尝试将日期和时间列(lastModified)转换为适当的datetime格式。当我第一次尝试它时，它返回一个错误 ValueError: hour must be in 0..23 所以我试着这么做- data_df[['date','time']] = data_df['lastModified'].str.split(expand=True) data_df['lastModified'] = (pd.to_datetime(data_df.pop('date&

浏览 10提问于2021-12-04得票数 1

2回答

pandas中有多少列，python？

、

有没有人知道pandas，python中的所有列？我刚刚为pandas创建了一个包含超过20,000列的数据帧，但我得到了内存错误。非常感谢

浏览 5提问于2013-10-07得票数 1

1回答

如何在Python中使用pandas来计算txt文件中的属性(列)？

、

我有一个txt文件，里面有行和列的数据。我正在尝试弄清楚如何计算整个txt文件中的列数(属性)。下面是我读取txt文件并计算列数的代码，但它给出了错误的答案。 import pandas as pd data_file = pd.read_csv('3human_evolution.txt') data_file.columns = data_file.columns.str.strip() A=len(data_file.columns) print(A)

浏览 2提问于2017-11-29得票数 0

2回答

如何在Python pandas dataframe中拆分这些数据？

、、

这是我的pandas数据框，在索引列中，我只想保留双下划线(__)之后的值，并删除其余的值。 ?

浏览 19提问于2019-01-18得票数 1

回答已采纳

1回答

Python无法识别具有变量索引的列

、、、

我用pandas读取了一个包含python数据框的excel文件。最初使用ExcelWriter将数据框转换为excel文件。excel中的数据框如下所示： df: Index Variables 0 Index(['Growth', 'Pure growth', 'Value'], dtype='object') 1 Index(['Growth', 'Pure growth', 'Quality'], dtype='object'

浏览 22提问于2019-11-12得票数 1

2回答

如何将两个长度不同的列表合并为Pandas dataframe？

、、、、

我有两个名单要合并成熊猫数据。列将是CSV的头，并且数据包含数据行作为单个列表。 import pandas as pd columns = [column[0] for column in cursor.description] len(columns) >5 data = cursor.fetchall() len(data) >2458 len(data[0]) >5 df = pd.DataFrame(data=data, index=None, columns=columns) >ValueError: Shape of passed values is

浏览 0提问于2018-10-17得票数 1

回答已采纳

1回答

有必要在java UDP服务器实现中存储传入的消息吗？

、

大家好！我正在开发基于java NIO的简单java UDP服务器。我读到，我必须将所有传入的消息存储在某个缓冲区中，并以某种方式识别换行符。但是，如果传入的消息大小总是<=缓冲区大小，那么我有必要存储以前的状态吗？我的意思是我的ByteBuffer足够大，可以存储任何传入的消息。在某些情况下，是否更好地确保自己不处理像monolit这样的消息，而它们只是一些大消息的一部分？我只是不想做开销工作，而是想精确地确定分配足够大的缓冲区是否是危险的策略。

浏览 2提问于2013-03-15得票数 1

回答已采纳

1回答

星火中每列值之和

、、

我需要一些关于火花的帮助。我所做的是将我在Spark中获得的数据some转换为Pandas (使用Spark2Pandas命令)，然后对其进行如下工作：基本上，我有一个有100列的Pandas dataframe，每个列都称为"FirstP XX SecondP"，是从00到99的列号。因此，首先，我删除了每一列文本的"FirstP“和”SecondP“部分(基本上，我只保留数字)。之后，使用for循环创建一个新列，在该列中，我将添加每个列的所有值的总和。然后，我删除包含所有数据的原始列。我使用的代码如下： data.columns = data.columns.

浏览 3提问于2022-01-06得票数 -2

回答已采纳

1回答

熊猫以1级群为基础创建百分位域

、、、

鉴于以下数据框架： import pandas as pd df = pd.DataFrame({ ('Group', 'group'): ['a','a','a','b','b','b'], ('sum', 'sum'): [234, 234,544,7,332,766] }) 我想创建一个新的字段，它计算" group“中每个组"sum”的每个值的百分位数。问题是，我有两个头列，无法解

浏览 3提问于2016-05-07得票数 2

回答已采纳

1回答

Jquery划分，然后附加到多个div

、、

我有一个由用户选择确定的不同数量的列的页面。为了便于讨论，在将三列更改为两列时，我希望从所有三列中提取所有内容(子div)，然后在现在剩下的两列之间均匀地重新分配它们。这就是我到目前为止所拥有的。 // gather contents from source colums and store, store target divs as well var source = jQuery(".col").contents(); var target = jQuery("#cols").contents(); // clear target divs

浏览 0提问于2011-12-20得票数 2

1回答

计算UDP数据报校验和的最佳方法？

、、、、

计算UDP数据报校验和的最佳方法是什么？在Python的MD5、SHA256或任何其他方法中，哪种方法肯定有助于识别损坏的数据包?此外，我的数据报的格式如下： packet = struct.pack('HH', seq_num, checksum) + payload ，其中payload是我要发送给接收者的信息。那么，在这种情况下，我应该计算数据包的校验和吗？

浏览 2提问于2017-03-14得票数 0

回答已采纳

2回答

ValueError:仅在一行上工作时，列必须与键的长度相同

、、、

我试图根据一列的拆分向DataFrame添加列。对于两行，所有操作都正常，空列的值为“None”。当我只有一行而DataFrame不能展开时，我希望它也被赋值'None‘。工作实例： >>> import pandas as pd >>> df = pd.DataFrame({'auth':['dbname_user','dbname']}) >>> df auth 0 dbname_user 1 dbname >>> df[[&#

浏览 19提问于2022-08-23得票数 0

回答已采纳

3回答

查找pandas列中的百分位数

、

数据- df=pd.DataFrame({'city':['abc','abc','abc','abc','abc','abc'],'zone':['AA','AA','CC','CC','DD','DD'],'date':['1/1/2020','1/2/2020','1/1/2020','1/2/2

浏览 3提问于2020-05-05得票数 0

2回答

我的pandas数据框中有一列，其中也包含算术运算符(*

? pandas数据框中列的数据类型为object。它包含一个算术表达式，例如: 24 * 365。我想得到代替表达式返回的表达式的结果(24 * 365 = 8760)。有人能帮助解决这个问题吗？所示图片中的数量列的单位数乘以每个单位的数量。我想把它们相乘得到总数。

浏览 14提问于2020-06-10得票数 0

1回答

如何在Python中将数据从excel列提取到列表中？

、、、

我正在尝试从excel中的列中提取数据到Python中的列表。我有以下代码： #Extracting Labels read = pd.read_excel('Test-data-results.xlsx', sheetname=0) # can also index sheet by name or fetch all sheets labels = read['Labels'].tolist() print(labels) 当我运行这段代码时，我得到一个关键错误：.... File "pandas/_libs/index.pyx", lin

浏览 97提问于2018-08-13得票数 1

回答已采纳

3回答

熊猫数据从生成器，其中每一行是一个制表符分隔行。

、、

我正在尝试将生成器解析为dataframe构造函数pd.Dataframe testdf = pd.DataFrame(test)。我无法指定每一行都是制表符分隔的.结果是，我最终得到了一个单独的列dataframe，其中每一行都是用'\t'分隔的整行值。我尝试过其他几种方法： pd.read_csv(test) pandas.io.parsers.read_table(test, sep='\t') 但是它们的这两个工作都不起作用，因为它们没有接受输入类型生成器。

浏览 2提问于2014-11-04得票数 0

回答已采纳

2回答

如何删除字符串注释并保留值？

、

import pandas import numpy as np cols = ['DATA'] val = pandas.read_excel('ACC_HAMMER.xlsx' , names = cols) val.values main = np.array(val) print(main) 我得到的输出如下： [['0.00000000E+000,3.82345878E-002,1.80000000E+002'] ['1.25000000E+000,1.90616930E-001,-6.71922991E+001'] [

浏览 6提问于2017-09-29得票数 1

回答已采纳

2回答

如何将numpy数组作为对象存储在熊猫数据中？

、、

我有一系列图像，它们存储在CVS文件中，每个图像作为一个字符串存储，该字符串是一个9216空格分隔整数的列表。我有一个函数将它转换为96x96 numpy数组。我希望将这个numpy数组存储在dataframe的列中，而不是字符串中。但是，当我从列中检索该项时，它不再作为numpy数组使用。数据可以从这里加载，这是training.cvs文件中的最后一列。 import pandas as pd import numpy as np df_train = pandas.read_csv("training.csv") def convert_to_np_arr(im

浏览 4提问于2014-05-25得票数 5

回答已采纳

1回答

用于“一列”导入的pd.read_csv :它避免拆分为："ParserError: Error令牌数据。c错误:第4行中预期的10个字段，saw 16“。

、、、、

在运行时，使用只有一个列的csv pd.read_csv('/MYPATH/MYFILE.csv') 我得到了 ParserError: Error tokenizing data. C error: Expected 10 fields in line 4, saw 16 或者长时间输出： /usr/local/lib/python3.7/dist-packages/pandas/io/parsers.py in read(self, nrows) 2155 def read(self, nrows=None): 2156 try: -&g

浏览 9提问于2021-09-30得票数 0

回答已采纳

2回答

如何从.rdl报表生成平面excel文件？

、、、

我有一个将数据格式化为报告的.rdl报告。我想将这些数据导出到excel中，作为一个扁平表，其中包含根据报告中的参数返回的原始数据。默认的excel导出看起来就像我不想要的报表(我只想要行和列)。有什么简单的方法可以做到这一点吗？

浏览 10提问于2010-04-13得票数 1

回答已采纳

1回答

使用Python和Pandas将员工数据库与代理电子邮件合并

、、、、

我正在做一个项目，我需要获取Microsoft Office租户中每个人的唯一ObjectID，并将其与HR提供给我的表格结合起来。 import pandas as pd # Imports CSV files rawexporteddata = pd.read_csv('users_1_13_2021 4_55_49 PM.csv') hrlist = pd.read_csv('OutlookMasterList.csv') # Convert email address to lowercase so they'll match the fi

浏览 14提问于2021-01-14得票数 0

回答已采纳

2回答

仅当列数超过1时才解析CSV文件的条件

、

我正在尝试使用pandas从S3存储桶中存在的CSV文件中读取数据。然而，有时CSV文件只有1列，这是我不想解析的东西。我只想解析其中有超过1列的CSV。谁能告诉我要检查的条件是，如果列数> 1，那么只解析文件，否则退出循环。下面是我正在尝试的代码。 body = csv_obj['Body'] csv_string = body.read().decode('utf-8-sig') df = pd.read_csv(StringIO(csv_string),usecols = [3,4,6]) 下面是我尝试的第二个代码，但得到了错误：File "

浏览 9提问于2019-09-06得票数 0

1回答

通过过滤python中panda.merge输出的列来形成列表

、、、

我使用pandas合并了两个csv文件，并使用以下命令将合并后的输出保存在merged变量中： merged= pd.merge(f1,f2,on='name',how='inner') 这个merged大约有10列，我想从中选择两个列- name和type，并形成一个list of lists，它的输出应该类似于以下格式： [['Bread', 'Milk'], ['Bread', 'Diapers', 'Beer', 'Eggs'

浏览 1提问于2014-11-26得票数 0

1回答

有没有可能从一个非描述性列表中生成一个csv文件？

、、、

我正在处理超过100,000条数据，问题是它是以一种非常不利的格式pdf编写的。我不知道如何分离数据。我正在使用pandas和matplotlib在这些数据上做一些基本的绘图。我想不出怎么做一个csv。例如： Property 1 Data 1 Data 2 Data 3 Property 2 Data 4 Data 5 Data 6 我试过使用查找和替换，但由于没有格式，我无法弄清楚，但我没有时间逐一查看每一段数据并手动添加逗号。我希望能够将每个属性绘制为一个列，每个数据片段都是一个单元格。

浏览 9提问于2019-10-23得票数 0

1回答

excel从单元格中提取每个单词并存储到单独的列中

、

我有一个单元格，其中包含如下数据: 45677|abc|top|IG|pro|sjkdjs|cdf 我想把它们分别提取到单独的列中，有没有excel函数可以做到这一点，或者我必须使用pandas。

浏览 0提问于2021-05-21得票数 2

2回答

根据字数将列拆分为未知数量的列- Pandas

、

我有一个pandas数据框，它的一个列包含一些字符串。我想根据字数将该列拆分成未知数量的列。假设我有DataFrame df： Index Text 0 He codes 1 He codes well in python 2 Python is great language 3 Pandas package is very handy 现在，我想将text列划分为多个列，每个列包含2个单词。 Index 0 1 2 0

浏览 17提问于2020-06-29得票数 3

回答已采纳

1回答

使用现有列中的特定单词向dataframe添加额外的列

、

我是Python的新手，正在和Pandas打交道。更具体地说，我在数据框中有一列(感觉分数)，它由多个单词组成，如下所示： *Treatment* *Sensory scores* A soft, short B soft, tender C short, tender 现在我想在数据框中添加额外的列“soft”、“short”和“tender”，这样就可以像这样提取和量化各个分数： *Treatment* *Sensory scores* *soft* *short* *tender* A

浏览 19提问于2021-02-09得票数 1

1回答

在对枚举/类别类型列求和时，h2o dataframe GroupBy sum函数的作用是什么？

想知道当列类型是分类的(特别是h2o enum类型)时，在h2o dataframe GroupBy对象中求和列时会发生什么。将pandas数据帧转换为H2o数据帧。然后，我按某一列对行进行分组，并对其他列求和。 location_id price store ------------------ 1 10 JCP 1 15 SBUX 3 20 HOL then after grouping and summing; df.group_by('location_id').sum(['

浏览 26提问于2019-04-02得票数 0

回答已采纳

1回答

将火花分解成火车并进行测试

、、

我想把我的星火分解成火车，然后在以下条件下进行测试- I希望能够再现这个拆分，这意味着每次对于同一个DataFrame，我将能够进行相同的拆分。应该从列名序列-id.的每个唯一值中分离出来。目前，我通过将Dataframe转换为Pandas Dataframe并执行以下操作- test_padnas = df.toPandas() train_frac = 0.8 train = test_padnas.sort_values(by='sequence_id','timestamp']).groupby('sequence_id',group

浏览 4提问于2020-11-19得票数 2

1回答

如何将200列numpy数组转换为dataframe？

、、

我有一个200列的numpy。现在，我想将其与列名一起存储在数据报中。我该怎么做呢？ array([[0.47692407, 0.29395011, 0.54361545, ..., 0. , 0.69314718, 0. ], [0. , 0.41974993, 0.40546511, ..., 0. , 0.69314718, 0. ], [0.47692407, 0.53776803, 0.54361545, ..., 0. , 0.693147

浏览 6提问于2020-05-17得票数 1

回答已采纳

1回答

熊猫与RegExp生产领先和落后的南栏

、、

我和熊猫一起读的一个文件里有一些简单的数据： 2018:08:23:07:35:22:INFO:__main__:Info logger message 文件中没有开始或尾随制表符、空格等。我使用以下方法将该文件读入dataframe： df = pandas.read_csv("/u01/app/DataLake/tester/tester.log", header=None, index_col=False, sep=r'(\d{4}:\d{2}:\d{2}:\d{2}:\d{2}:\d{2}):(.+):(.+):(.+)',engine='py

浏览 0提问于2018-08-24得票数 0

回答已采纳

2回答