如何对Pandas dataframe中的列应用格式_对Pandas Dataframe列应用条件_对pandas dataframe的列应用函数 - 腾讯云开发者社区

python、pandas、sorting、python-datetime

我有一个时间顺序混乱的列表存储在一个名为“Compilado”的excel表中，我想要正确地重新排序，以便为数据分析做准备。我把它解析给一只Pandas Dataframe df = pandas.read_excel(r'C:\Users\KMBGSI\Downloads\Historico de Alertas.xlsx',sheet_name='Compilado', header=None, names= header_list, index_col=None, parse_dates=[0]) Dataframe预览： df.info()返回：

浏览 10提问于2022-03-30得票数 0

1回答

熊猫数据串接

python、pandas、dataframe

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

6回答

如果pandas.DataFrame中的列是绝对的，什么是一个很好的启发式方法？

python、pandas、scikit-learn

我一直在开发一个工具，可以自动地以pandas.DataFrame格式对数据进行预处理。在这个预处理步骤中，我想以不同的方式处理连续数据和分类数据。特别是，我希望能够只对分类数据应用(例如，OneHotEncoder )。现在，让我们假设我们被提供了一个pandas.DataFrame，并且没有关于DataFrame中数据的其他信息。使用什么好的启发式方法来确定pandas.DataFrame中的列是否是绝对的？我最初的想法是： 1)如果列中有字符串(例如，列数据类型为object)，则该列很可能包含分类数据。 2)如果列中某些值的百分比是唯一的(例如，>=20%)，那么该列很可能包

浏览 4提问于2016-03-06得票数 29

3回答

Pandas DataFrame to HTML:格式化以居中显示的值

python、html、python-3.x、pandas、dataframe

我有一个pandas DataFrame，正在使用DataFrame.to_html方法生成一个可以在HTML email消息中发送的表。我只想让某些列中的值居中，但也想知道如何将格式应用到表中。在使用to_html之前，我已经尝试应用找到的文档以及使用df.style，如下所示： df.style.set_properties(**{'text-align':'center'}) 但是我仍然让我所有的值左对齐(除了头，它是居中的)。将所有列值(或列值的子集)居中的正确方式是什么，还有哪些可用于格式化的其他选项？(例如，加粗文本、更改背景或边框颜色等) 此外，

浏览 3提问于2018-04-18得票数 4

回答已采纳

2回答

Pandas interpolate在0.24版之后抛出无效的填充方法错误

python、pandas

在使用method='time'参数时，pandas.DataFrame.interpolate()方法抛出以下错误： Error: Invalid fill method. Expecting pad (ffill) or backfill (bfill). Got time 这只是在pandas更新到0.24版后才开始发生的，这似乎改变了一些实现。用于使用0.24或更高版本的面包的代码。我认为这可能与列的数据类型有关，这意味着如果DataFrame包含非数字列，插值将失败。然而，情况似乎并非如此，因为我最近再次遇到了纯数字的DataFrame。我相信我在某个时候让它工作

浏览 2提问于2019-09-28得票数 3

2回答

Python :如何轻松获得行和列的小计？

python、python-3.x、pandas

我是Python的新手，正在竭尽全力让Pandas/XlsWriter做我想做的事情。我从CSV的一组数据开始，我将其加载到Dataframe中并对其进行操作。最终，在进行了透视之后，我最终得到了如下所示的数据。粉红色的突出显示表示我试图让Pandas/XLSwriter以编程方式生成的内容。所以行数和列数是可变的。两个问题： 1)请告诉我如何找到每行和每列的小计？ 2)如何应用数字格式将其转换为xxx，xxx，xxx.00？奖励问题：你会推荐OpenPYXL而不是XLSWriter (反之亦然)吗?为什么？

浏览 3提问于2017-09-11得票数 1

2回答

pandas.DataFrame.round输出不同数量的小数位数

python、pandas、dataframe

不出所料，在下面的DataFrame上调用round(2)会得到一列有两个小数位，但另一列只有一个小数位。 import pandas as pd df = pd.DataFrame([ [0.829, 0.801], [0.997, 0.997] ]) df.round(2) 当在笔记本中运行此命令时，它会输出： 0 1 0 0.83 0.8 1 1.00 1.0 我认为这是因为0.801舍入为0.8，因此只需要一个小数位，另一行转到1.0而不是1.00。但是我想将这个DataFrame输出到一个LaTeX表中，所以我希望两列的小数位数相同。有

浏览 29提问于2019-08-14得票数 2

回答已采纳

2回答

如何在导出到Excel文件时保持数据帧数据类型？

python、excel、pandas

我有pandas数据框架和int64、object和datetime64[ns]数据类型。导出pandas DataFrame.to_Excel选项时如何保留这些数据类型？我希望导出的Excel文件列如下所示： Excel中的int64数字格式 Excel中的object文本格式 Excel中的datetime64[ns]数据格式现在，我所有的Excel列格式都显示为General

浏览 10提问于2021-06-24得票数 2

3回答

在DataFrame上应用函数后更改其上的级数位置

python、pandas

我正在尝试使用pandas，以便使用简单的函数就地更改我的一个列。在阅读完整个Dataframe之后，我尝试在一个系列上应用函数： wanted_data.age.apply(lambda x: x+1) 它工作得很好。当我试图把它放回我的DataFrame中时，唯一的问题出现了： wanted_data.age = wanted_data.age.apply(lambda x: x+1) 或者： wanted_data['age'] = wanted_data.age.apply(lambda x: x+1) 抛出以下警告： > C:\Anaconda\lib\sit

浏览 0提问于2015-05-16得票数 28

回答已采纳

1回答

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

python-3.x、pandas、pandas-groupby

我在DataFrame上应用了groupby，之后它将DataFrame转换为pandas.core.groupby.groupby.DataFrameGroupBy格式。如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为常规DataFrame，或者如何从pandas.core.groupby.groupby.DataFrameGroupBy数据类型访问单个列？

浏览 7提问于2018-10-27得票数 1

7回答

将Pandas列转换为DateTime

python、datetime、pandas

我在pandas DataFrame中有一个字段是以字符串格式导入的。它应该是datetime变量。如何将其转换为日期时间列，然后根据日期进行筛选。示例： DataFrame名称：raw_data 列名：Mycol 列中的值格式:Mycol

浏览 143提问于2014-11-06得票数 362

回答已采纳

1回答

如何从Codeforces中获得Pandas？

python、dataframe、api、analytics

我想将CODEFORCERS用于某些Analytics (在Python / SQL /甚至XLS.中)。我试图获得一个足够的Pandas，但是我得到了一个0行13644列的Dataframe。我不知道如何从API中获取可用的Dataframe。我想对数据做些什么:分析不同的方面，如分数/参与者/分数变化/回合. 只需将数据拖到XLS工作表/ SQL中就可以了。最好的，Kiki 我试过了从sklearn导入数据集作为pd导入熊猫 contest_list = pd.read_csv(") pd.DataFrame(contest_list) 但得到了0行×13644列的Dataf

浏览 10提问于2022-11-07得票数 0

1回答

为什么pandas DataFrame.iloc返回的是类别数据类型的标量，而是对象数据类型的系列？

python-3.x、pandas

在pandas 0.23.0和python 3.6.5中，我看到了在DataFrame上使用iloc[int]时不理解的行为。如果DataFrame只有一列，并且该列的类型是“category”，则iloc[int]将返回标量值而不是系列。当"answer“列是一个对象数据类型时，我会得到一个预期的Series： >>> df = pandas.DataFrame({'answer': ['no', 'no', 'yes']}) >>> df['answer'] =

浏览 1提问于2018-08-24得票数 0

1回答

如何通过在每一行上操作来在dataframe中创建列？

python、pandas、dataframe、apply

我有一个apply函数，它对数据中的每一行进行操作。apply函数的结果是一个新的值。此新值用于该行的新列中。因此，在将此函数应用于dataframe中的所有行之后，该dataframe中将有一个全新的列。如何在pandas中做到这一点？

浏览 3提问于2015-12-20得票数 1

回答已采纳

3回答

ValueError: Pandas DataFrame上未转换的数据

python、pandas

data -这是我在Pandas DataFrame中的数据 CallDateAndTimeStart 01/01/2010 00:26:28.003613 MST 01/01/2010 00:28:54.230713 MST 01/02/2008 14:12:11 MST 05/19/2010 09:12:32.080728 MST 我试图将列dtype更改为datetime64ns df['CallDateAndTimeStart'] = pandas.to_datetime(df['CallDateAndTimeStart'], format=

浏览 3提问于2014-03-18得票数 7

回答已采纳

1回答

如何使用docx模块将样式对象的格式化值添加到Word文档表中？

pandas、dataframe、number-formatting、python-docx

我是在Word文档中添加表格，使用熊猫和Python模块使用数据数据。我希望数据值以我应用于dataframe的格式样式出现在Word文档表中。有些列有带有逗号分隔符{：、}的数字格式，而有些列具有百分比格式{:.2%}。但是，在我将格式样式添加到dataframe之后，dataframe就变成了一个样式对象。然后，我无法在Word中将样式对象的值添加到表中。如何将格式样式应用于dataframe中的值，以便它们在Word文档表中显示样式？ import pandas as pd import docx import openpyxl # initialize list of li

浏览 1提问于2021-03-04得票数 0

回答已采纳

2回答

ColumnarToRow是如何在Spark中高效运行的

apache-spark、pyspark、apache-spark-sql、query-optimization

在我的理解中，列格式更适合于MapReduce任务。即使对于某些列的选择，columnar也能很好地工作，因为我们不必将其他列加载到内存中。但是在Spark3.0中，我看到在查询计划中应用了这个ColumnarToRow操作，根据我从可以理解的，查询计划将数据转换为行格式。它如何比柱状表示更有效，管理该规则应用的洞察力是什么？对于下面的代码，我附加了查询计划。 import pandas as pd df = pd.DataFrame({ 'a': [i for i in range(2000)], 'b': [i for i in re

浏览 13提问于2020-11-12得票数 10

2回答

如何使用XlsxWriter将多种格式应用于一列

python、pandas、xlsxwriter

在下面的代码中，我将数字格式应用于excel工作表中的每一列。但是，我似乎不知道如何将多个格式应用于特定的列，无论是居中还是编号都会被覆盖。是否可以将两种类型的格式应用于一列？ def to_excel(video_report): # Create a Pandas Excel writer using XlsxWriter as the engine. writer = pd.ExcelWriter('pandas_simple.xlsx', engine='xlsxwriter') # Convert the dataframe

浏览 3提问于2015-06-01得票数 8

回答已采纳

1回答

如何将具有字符串格式(例如:1小时50m)的持续时间详细信息的Pandas列转换为以分钟为单位的整数列

python、pandas、dataframe

假设我有如下数据： import pandas as pd import numpy as np df = pd.DataFrame({'Duration': ['1h 50m', '50m', '3h', '2h 30m', '5h', '60m'] }) df 产生的产出： 📷 在熊猫数据帧中创建的列包含字符串格式的持续时间细节，如1h、50m、50m、3h等。我需要知道如何将这个列转换为一个整数，其值以分钟为单位显

浏览 0提问于2019-03-08得票数 0

回答已采纳

1回答

在Dask DataFrame中修改列(例如，执行数学函数)的最佳方法是什么？

python、pandas、dataframe、dask

我是Pandas DataFrame对象的老手，但我很难找到一种干净、方便的方法来更改Dask DataFrame列中的值。对于一个特定的例子，我试图将numpy.float列中的正值乘以-1，从而使它们为负值。下面是我当前的方法(我正在尝试更改DataFrame中的最后一列)： cols = df.columns df[[cols[-1]]] = df[[cols[-1]]]*-1 这似乎只有在列有字符串标题时才有效，否则它会使用索引号作为新列的字符串类型列名添加另一列。是否有类似于df.iloc[-1,:] = df.iloc[-1,:]*-1的Pandas方法，我可以在dataframe

浏览 1提问于2018-03-14得票数 1

回答已采纳

1回答

更快的熊猫应用modin.pandas

python、pandas、nlp、modin

尝试使用modin.pandas来使用此应用函数的所有核心 from nltk.sentiment.vader import SentimentIntensityAnalyzer sid = SentimentIntensityAnalyzer() # sentiment Score of essay data = data.merge(data.essay.apply(lambda s: pd.Series({'neg':sid.polarity_scores(s)['neg'],

浏览 0提问于2020-01-11得票数 2

回答已采纳

2回答

如何在多把钥匙上使用熊猫石斑鱼？

datetime、pandas-groupby

我需要通过datetime列和另一个str(object)列来转换一个dataframe，以便按组应用函数，并将结果分配给组的每个行成员。我理解，但不能同时为这两个条件创建一个pandas.Grouper。因此：如何在多列上使用pandas.Grouper？

浏览 6提问于2018-09-05得票数 16

回答已采纳

2回答

将多个列乘成一列

pandas、dask

我想将大约50,000列与另一列相乘在一个大型dataframe (6_500_000 x 50_002)中。使用for循环的解决方案可以工作，但速度慢得令人痛苦。下面，我尝试了另外两个失败的应用程序。如有任何建议，敬请见谅。 Pandas import pandas as pd df = pd.DataFrame({'a':[1,2,3], 'b':[4,5,6], 'c':[7,8,9]}) df[['a','b']].multiply(df['c'], axis="index"

浏览 20提问于2020-10-01得票数 1

回答已采纳

2回答

从pandas dataframe中的列中提取唯一的json键

json、pandas

我有一个pandas dataframe，下面的列是json格式的。我需要从下面的dataframe中的所有行中获取唯一的json键。我不确定pandas是否有内置的函数来做这件事。 Col3 {"a": 2000, "b": 1} {'c': 'Go bug go','d': 'go_line21','e': 'movie','duration': 2166}

浏览 22提问于2019-12-07得票数 1

1回答

将Python dataframe中的多个列转换为yyyy/mm/dd，同时包含excel数值和普通日期时间值

python、excel、pandas

我需要能够从dataframe中的Excel文件中选择几列，以应用标准日期时间格式(yyyy/mm/dd)。这些数据(不幸的是)混合了Excel数值(例如43799)和标准日期格式(例如2019年11/30)。我正在使用pandas中的read_excel方法，并且不希望使用其他打开文件的方法(例如，xldr的打开工作簿的东西)。下面是我导入数据时数据外观的示例： import xlrd import pandas as pd import numpy as np from datetime import datetime as dt data=[['test', 4379

浏览 5提问于2020-03-05得票数 1

1回答

Openpyxl Number_Format直到手动应用

python、openpyxl

代码： def write_pandas_dataframe_to_excel(df): book = openpyxl.load_workbook('~/Documents/test.xlsm', read_only=False, keep_vba=True) sheet = book['Database'] # Delete all rows after the header so that we can replace them with the contents of our pandas dataframe sheet.dele

浏览 5提问于2021-12-11得票数 0

1回答

如何为Pandas DataFrame指定输入数据类型

python、pandas

我希望将现有的Python转换为Pandas DataFrame对象。如何为每一列指定数据格式并定义索引列？下面是我的代码示例： import pandas as pd data = [[1444990457000286208, 0, 286], [1435233159000067840, 0, 68], [1431544002000055040, 1, 55]] df = pd.DataFrame(data, columns=['time', 'value1', 'value2']) 在上面的示例中，对于现有列，

浏览 2提问于2016-02-25得票数 5

回答已采纳

2回答

如何引用Pandas中查询字符串中的未命名列？

python、pandas、dataframe

使用DataFrame时，如何引用查询字符串中未命名的pandas.DataFrame.query列？我知道我可以在后面包围那些无效的Python变量名的列名。但是，这并不涉及未命名的列。例如，我想查询DataFrame中的所有行，其中未命名的列包含大于0.5的值。我的代码开始如下： import pandas as pd import numpy as np array=np.random.rand(10,3) df=pd.DataFrame(array) 到目前为止还不错，但是当我尝试使用pandas.DataFrame.query时，应该使用哪个查询字符串来查找第二列中值大于0.5的

浏览 3提问于2021-07-09得票数 2

5回答

我如何在熊猫DataFrame栏中的IPython笔记本中保留正确的文本？

pandas、ipython、ipython-notebook

我正在尝试在IPython笔记本中格式化输出。我尝试使用to_string函数，这使我完全可以消除索引列。但文本数据是正确的。在10年 import pandas as pd columns = ['Text', 'Value'] a = pd.DataFrame ({'Text': ['abcdef', 'x'], 'Value': [12.34, 4.2]}) print (a.to_string (index=False)) Text Value abcdef 12.34

浏览 5提问于2014-09-11得票数 23

回答已采纳

1回答

选择列- dataframes、pandas

python、pandas

如何在Pandas Dataframe中选择列，其中列名称取决于我们在另一个数据帧中找到的值？例如，如果1,2,3.是dataframe 1和1，2，3的列名。是dataframe 2中不同单元格的值。如何通过将列名称与dataframe 2中的单元格值匹配来选择dataframe 1中的列。

浏览 3提问于2017-07-23得票数 0

2回答

当我需要时，Dask drop()不会丢弃列

python、pandas、dask

我是新来的达斯克，列被删除的方式让我感到困惑。我已经把一个csv文件读到了Dask数据文件中。那么假设我有这个： print(len(columns_to_drop)) # There are 66 print(len(list(df.columns))) # The Dask columns before the drop df.drop(columns_to_drop, axis=1).compute(). # Drop the columns pd_df = df.compute() # Create a Pandas dataframe print(pd_df.shape[1

浏览 1提问于2021-12-14得票数 2

回答已采纳

1回答

导致问题的pd.read_sql unicode类型

python、python-2.7、pandas

我正在使用sqlalchemy、pyodbc和pandas read_sql对从数据库中提取的一些数据进行格式化，并将其作为dataframe df返回。我想使用以下命令逐行应用dataframe的每个“单元格”中的数据格式，并排除前两列： df.iloc[6, 2:] = (df.iloc[6, 2:]*100).map('{:,.2f}%'.format) 我对dataframe中的其他几行应用了类似的格式。过去，当我从csv文件中读取数据时，这种方法非常有效，但现在从数据库中读取数据时，该行上会出现一个ValueError，其内容如下： ValueError: Unk

浏览 6提问于2016-08-18得票数 0

2回答

使用Dict映射对Dataframe中的每一列应用格式设置

python、dictionary、pandas、formatting、dataframe

问题设置 import pandas as pd df = pd.DataFrame(data={'Currency': {0: 111.23, 1: 321.23}, 'Int': {0: 23, 1: 3}, 'Rate': {0: 0.03030, 1: 0.09840}} ) 生成以下DataFrame Currency Int Rate 0 111.23 23 0.0303 1 321.23 3 0

浏览 3提问于2015-09-23得票数 9

回答已采纳

1回答

如何在Pandas DataFrame的单独列中扣除离散值

python-3.x、pandas

我是Python的新手(4周)，刚刚开始使用Pandas和api get请求。我正在将api数据放入dataframe数据框中，并尝试对pandas数据框中不同列中的金融数据执行基本数学运算(即，打开、高、低、关闭、卷)。我已经写了以下代码(注意:参数和api请求url不是逐字的，它们返回由列分隔的正确的数据集)： import requests import json import pandas as pd payload = {"key": "value"} response = requests.get("URL", params=

浏览 23提问于2019-02-19得票数 1

1回答

如何对某些列执行df.groupby(cols).apply(my_func)，而不处理一些列？

python、pandas

假设我有一个Pandas dataframe df，它包含a、b、c、d…z列。我希望:列d-z为df.groupby('a').apply(my_func())，而列'b' & 'c'保持不变。如何做到这一点？我注意到Pandas可以通过传递一个dict将不同的函数应用到不同的列。但是我有一个很长的列列表，只是想要设置或提示参数，以便简单地告诉Pandas绕过一些列，并将my_func()应用于其余的列？(否则我必须建立一个很长的字典)

浏览 0提问于2012-10-28得票数 3

回答已采纳

2回答

从HDF5文件读取pandas.Dataframe列的子集

python、pandas、numpy、hdf5、h5py

我在HDF5文件中保存了一个pandas.DataFrame。DataFrame由多个列组成，大小非常大。HDF5文件中每个表的大小都大于2 2GB。对于分析，希望仅将表的列的子集加载到存储器中。使用SQLite3，这是一项微不足道的工作。只需使用"select column1，colum2，... from table1“查询即可。在Python中有没有一种简单的方法可以做到这一点？请注意，pandas.read_hdf不是一个好的解决方案。此函数将整个表加载到内存中，然后删除未使用“columns= ..”指定的列。论点。因此，在开始时不可避免地会有非常大的内存使用量。此外，

浏览 2提问于2019-08-07得票数 0

1回答

如何计算包含在DataFrame中的逐行表达式(如DataFrame()但动态表达式)？

python、pandas

假设您有一个包含表达式(引用其他列)的列的DataFrame，那么可以计算包含在该列中的表达式吗？我知道可以使用pd.eval()和df.eval()来应用按列排列的操作(如下面所示)。例子摘自：假设你有： import pandas as pd df = pd.DataFrame([[1, 2], [2, 3], [5, 6]], columns=['A', 'B']) 然后你可以写： df.eval('(A + B)') 您将得到一个3, 5, 11系列(预期)。现在，如果该表达式实际上随行而异，并且实际上存储为一列，又会如何呢？例如

浏览 0提问于2019-01-29得票数 3

回答已采纳

1回答

Python pandas将秒转换为时间(hh:mm)

python、pandas

是否可以将一个包含总秒数的pandas dataframe列转换为另一个包含时间的列，如hh:mm？在我的mysql查询中，我可以这样做 SELECT SEC_TO_TIME(xxxx); 但是在我的pandas Dataframe中输出转换是错误的，所以我想用pandas而不是sql来进行几秒钟的转换。我正在使用pd.to_timedelta函数： df['time'] = pd.Timedelta(Second(df['sec'])) 但它不起作用。 -编辑- 解决了！这不起作用： df['time'] = pd.to_datetime(d

浏览 0提问于2017-05-23得票数 4

1回答

如何在spark sql dataframe中映射一列以创建新列？

python、pandas、dataframe、apache-spark

在python和pandas中，我可以创建一个新的专栏，如下所示：使用pandas dataframe中的两列来创建字典。 dict1 = dict(zip(data["id"], data["duration"])) 然后，我可以应用这个字典在第二个dataframe中创建一个新列。 df['id_duration'] = df['id'].map(lambda x: dict1[x] if x in dict1.keys() else -1) 如果我有一个数据帧id_duration (有两列：id和duration)和

浏览 38提问于2021-01-22得票数 0

回答已采纳

3回答

根据特定列的值对3列数据帧进行分组，以创建字典列表

python、pandas、dataframe、pandas-groupby

我是Python Pandas的新手，有一个关于使用Pandas、Dataframe、groupby和filters的问题。以下是我的示例数据帧： data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5', 'A6'], 'B': ['B1', 'B2', 'B3', 'B3', 'B4', 'B5'], '

浏览 11提问于2020-12-07得票数 2

2回答

Python -将一个列拆分为多个列，没有分隔符( YYYYMM列可以是YYYY和MM)

python、dataframe

如何将YYYYMM列拆分为YYYY和MM列？ import pandas as pd sample_data=pd.DataFrame(['201801','201702','201803','201904']) sample_data.columns=['YYYYMM']

浏览 7提问于2020-08-20得票数 0

回答已采纳

1回答

从Pandas DataFrame创建嵌套字典

python、pandas、dictionary

我需要从一个Pandas DataFrame创建一个嵌套字典。以下是CSV格式的示例数据集： hostname,nic,vlan,status server1,eth0,100,enabled server1,eth2,200,enabled server2,eth0,100 server2,eth1,100,enabled server2,eth2,200 server1,eth1,100,disabled 将CSV导入为DataFrame后，我将拥有： >>> import pandas as pd >>> >>> df = pd.

浏览 140提问于2019-03-21得票数 0

回答已采纳

1回答

如何在python中用0填充错误日期值

python-3.x、pandas、dataframe

id date_original 1 20200305 2 2020305 3 2020035 4 202035 如何在pandas dataframe中将'date_original‘列转换为'date’列？ id date 1 20200305 2 20200305 3 20200305 4 20200305

浏览 16提问于2020-12-10得票数 1

回答已采纳

3回答

在Pandas中添加新DataFrame列不起作用

python、pandas、dataframe

所以我有一个熊猫DataFrame，里面有2001年亚利桑那州响尾蛇队的击球统计数据。我是Python/Pandas的新手，所以我尝试使用lambda函数添加一些列，如下所示 PA_lambda = lambda row: row.AB + row.BB + row.HBP + row.SH + row.SF OBP_lambda = lambda row: (row.H + row.BB + row.HBP) / (row.PA) if row.PA > 0 else 'NaN' AVG_lambda = lambda row: row.H / row.AB if r

浏览 52提问于2020-06-30得票数 1

1回答

如何真正过滤熊猫数据集而不离开各地的Nans

python、pandas、filter

假设我有一个巨大的DataFrame，它只包含少数几个与我执行的过滤匹配的单元格。如何才能在一个新的dataframe中只获得与其匹配的值(以及它们的索引和列)，而不使用整个其他的DataFrame，而后者变成了Nan。使用dropna删除Nans只会删除整个列或行，而filter用Nans替换非匹配项。这是我的密码： import numpy as np import pandas as pd df = pd.DataFrame(np.random.random((1000, 1000))) # this one is almost filled with Nans df[df<

浏览 2提问于2020-12-18得票数 1

回答已采纳

1回答

如何对pyspark dataframe列应用函数

python-3.x、dataframe、pyspark

我正在尝试将我的pandas代码转换为pyspark dataframe，并尝试在dataframe的一列上应用函数。我在pandas dataframe中做了一些如下的事情。在操作了几个列值之后，将新列添加到pandas数据帧中，如下所示。 from currency_converter import CurrencyConverter def convert_USD_INR(row): USD_amount = c.convert(row['Sales'], 'INR', 'USD', date=date(row['Ca

浏览 15提问于2020-01-03得票数 1

回答已采纳

1回答

如何在我的HTML文件中显示红色负片文件？

python、css

我有一个Python格式的pandas dataframe，我正在HTML中显示它。我有一个style.css文件，其中包含一些基本的数据帧格式化规则。现在，对于一列，我希望它在值为负值时以红色字体显示。我不确定我应该在我的Python代码中还是在我的style.css中完成。下面是我的style.css代码： body { font-family: "Verdana", "Tahoma", sans-serif;} a, h1, h2 { color: #377ba8; } h1, h2 { margin:

浏览 34提问于2018-07-23得票数 1

2回答

熊猫圈中的多重置换

python、regex、pandas、loops

我对regex还比较陌生，我正在尝试替换Pandas DataFrame中string列中的部分字符串。挑战是，我有多个字符串类型，希望在保留其余字符串的同时从列中删除这些类型。我的代码适用于1种类型的字符串，但是当我尝试使用for循环时，代码不起作用。我不知道如何在regex表达式中指定迭代器。下面是应用于1种类型的子字符串的代码： df = pd.DataFrame({'A': ['ba ca t', 'foo', 'bait'],'B': ['abc', 'bar', &#

浏览 5提问于2019-06-20得票数 0

回答已采纳

1回答

使用apply将系列存储到pandas DataFrame单元格中

python、python-3.x、pandas

我有一个返回序列的函数。我使用apply()将函数应用于dataframe，并希望将结果系列存储到数据帧的新列中。例如， | 1 | 2 ---+---+------------------------------------ 0 | 1 | <class 'pandas.core.series.Series'> 1 | 2 | <class 'pandas.core.series.Series'> 2 | 3 | <class 'pandas.core.series.Serie

浏览 2提问于2018-11-30得票数 0

1回答

无法使用pd.xlsxwriter解锁具有自定义值的单元格

python-3.x、pandas、xlsxwriter

我有一个数据帧，如下面的代码所示。我只想锁定标题(顶行)，并让用户更改其余的单元格。根据下面的代码，它确实锁定了标题，并使我能够更改除"Date“列之外的所有列的值。我无法更改日期列的值。它也应该允许我更改date列的值 import pandas as pd df = pd.DataFrame({'Data1': [10, 20, 30], 'Data2': [11, 21, 31], 'Date': ["",

浏览 10提问于2019-05-21得票数 1