Python Pandas在匹配关键字时对特定列求和_如何在条件为真时对pandas列的值求和(Python)_创建列的列表，并使用Pandas (Python)在新列中对它们求和 - 腾讯云开发者社区

、、、、

我在生成数据透视表时遇到了一些问题。我试着用Python做到这一点。现在我有了测试表：表1 ? 我想做的表看起来像这样：表2 ? 我写了代码，但仍然有两列，但没有总和。 import pandas as pd import numpy as np table = pd.read_excel('test.xlsx',0) print(table.head()) print(pd.pivot_table(table,values=["A","B","C","D","E",

浏览 23提问于2020-04-07得票数 1

回答已采纳

2回答

如何通过搜索列表中给出的关键字值在Python熊猫中添加新列？

、、

我想根据已识别的关键字在dataframe中添加新列：这是当前数据(Dataframe= df)： Topic Count 0 This is Python 39 1 This is SQL 6 2 This is Paython Pandas 98 3 import tkinter 81 4 Learning Python 94 5 SQL Working 85 6 Pandas and Work 67

浏览 6提问于2020-09-11得票数 2

回答已采纳

1回答

使用现有列中的特定单词向dataframe添加额外的列

、

我是Python的新手，正在和Pandas打交道。更具体地说，我在数据框中有一列(感觉分数)，它由多个单词组成，如下所示： *Treatment* *Sensory scores* A soft, short B soft, tender C short, tender 现在我想在数据框中添加额外的列“soft”、“short”和“tender”，这样就可以像这样提取和量化各个分数： *Treatment* *Sensory scores* *soft* *short* *tender* A

浏览 19提问于2021-02-09得票数 1

1回答

Pandas运行时错误/anaconda3/lib/python3.8/site-packages/pandas/init.py"，第13行missing_dependencies

我需要用熊猫做一些事情。在我的python文件中，我写道： sys.path.append("/home/user0/anaconda3/lib/python3.8/site-packages") import pandas as pd 当我运行这个程序时，我得到这样的结果： File "/home/user0/anaconda3/lib/python3.8/site-packages/pandas/__init__.py", line 13 missing_dependencies.append(f"{dependency}: {e}

浏览 0提问于2020-08-04得票数 0

1回答

Python错误：'numpy.bool_‘对象不可迭代

、、、、

def dailyTimeDistributionFeatures ( dailyCallDistribution_dictionary, missingValue = -999, lowSampleValue = -666, numberOfFeatures = 14, sampleSizeThreshold = 3 ): featureSelection = {} for date in dailyCallDistribution_dictionary: date_timestruct = datetime.datetime.fromtim

浏览 91提问于2013-07-05得票数 1

1回答

Pandas read_fwf难以解释类似日期的字符串

、、

Pandas read_fwf难以解释类似日期的字符串我正在将数百个固定宽度的文件读入postgresql数据库，并使用pandas read_fwf代码对其进行解析。我的绊脚石是试图从其中一行的最后十列中提取周期的结束日期。可以在NOAA网站的中找到一个示例文件：我的Python/pandas脚本中的关键代码片段： import os import time import requests import pandas as pd import time import datetime from dateutil.parser import * ## Load adapters im

浏览 0提问于2019-04-12得票数 1

1回答

熊猫数据串接

、、

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

如何在熊猫中搜索多个多词短语？

、

我有一些JSON数据转换成一个熊猫DataFrame。我希望找到其字符串内容匹配多词短语列表的所有列。我正在使用大量的Twitter JSON数据 (因此Twitter API的使用不适用)。这个JSON被转换成一个Pandas DataFrame。其中一个可用的列是text，它是tweet的主体。一个例子是 We’re kicking off the first portion of a citywide traffic calming project to make residential streets more safe & pedestrian-friendly, next

浏览 11提问于2019-07-29得票数 0

2回答

dask.dataframe.groupby.DataFrameGroupBy错误

、、、、

我在两个列上使用了groupby ( df有大约70列，除日期时间外，所有列都是浮动的)来获得dask数据文件： result_ddf = base_ddf.groupby(["firts_integer_column","second_integer_column"]) 我不能使用结果，因为它是以某种奇怪的格式： dask.dataframe.groupby.DataFrameGroupBy 如何将结果作为dataframe使用，因为当我尝试.head()或.compute()时，我会得到错误。代码1 result_ddf.get_partition(1)

浏览 3提问于2021-01-26得票数 1

回答已采纳

1回答

如何在CSV中查找引发错误的行："ValueError:未能将字符串转换为浮动“

、、

我使用以下命令将CSV导入到中： df=pandas.read_csv("import.csv", names=["Year", "Month", "Day", "Time", "ColA"], encoding='iso-8859-1') 但是，Pandas将ColA作为数据类型对象导入。我尝试使用它将该列转换为浮动： df['ColA'] = df['ColA'].astype(float) 但是，会引发此错误： ValueError: co

浏览 0提问于2018-02-19得票数 2

回答已采纳

1回答

比较熊猫系列元素后从列表中获取匹配字符串

、

我想检查Pandas DataFrame列包含列表对象中的关键字元素。如果列包含List对象中的关键字，那么我希望在DataFrame本身的新列中填充该List元素。 L = ['abc','pqr','xyz'] 如果DataFrame是 Col1 Col2 'abc xyz' 'pqr lmn' 我想将DF与L进行比较，当'abc xyz‘包含L的元素(即'abc')时，我想在Col2中填充'abc’。你能帮我做到这一点吗？提前感谢

浏览 0提问于2021-02-17得票数 0

1回答

Python client for elasticsearch存在regexp支持问题

、

使用regexp时，elasticsearch的python客户端不能像预期的那样工作。在附带的查询示例中，只有一个单词"platform“，它工作得很好。一旦我添加另一个像"java platform“这样的单词，它就会返回0次命中。大写字母的单词也是如此。不知道python客户端是否正确支持regexp？可能的问题是什么？我在字符串之前和之后尝试了.*，以检查封装是否有问题，但都没有用。我需要更复杂的正则表达式，但是我不能成功地让这个简单的例子正常工作。 es = Elasticsearch([{'host': 'localhost',

浏览 18提问于2019-05-19得票数 2

回答已采纳

2回答

为什么我用pandas.concat得到一个'FutureWarning‘？

、、、、

当你使用Tiingo+pandas_datareader时，有没有人遇到这个FutureWarning？警告如下： python3.8/site-packages/pandas_datareader/tiingo.py:234: FutureWarning: In a future version of pandas all arguments of concat except for the argument 'objs' will be keyword-only return pd.concat(dfs, self._concat_axis) 我认为这个警告不会

浏览 2962提问于2021-08-25得票数 1

回答已采纳

3回答

将字符串/对象更改为持续时间和总和

、

我是Pandas和python的新手，我有一个CSV文件，其中包含一个持续时间列(时间)，当我读取该文件时，它作为一个字符串是只读的，我无法对其求和： agents['Avg Handle Time'][1:10] Out[12]: 1 - 2 0:05:07 3 - 4 - 5 - 6 0:05:03 7 - 8 - 9 - Name: Avg Handle Time, dtype: object

浏览 11提问于2019-11-28得票数 1

1回答

Pandas中HDF文件帧中列的附加

、、、

我正在处理一个CSV格式的大型数据集。我正在尝试一列一列地处理数据，然后将数据附加到HDF文件中的框架中。所有这些都是用Pandas来完成的。我的动机是，虽然整个数据集比物理内存大得多，但列大小是可管理的。在稍后阶段，我将一个一个地将列加载回内存并对它们进行操作，从而执行按特性进行的逻辑回归。我能够创建一个新的HDF文件，并使用第一列创建一个新的框架： hdf_file = pandas.HDFStore('train_data.hdf') feature_column = pandas.read_csv('data.csv', usecols=[0]) hd

浏览 3提问于2013-12-06得票数 10

回答已采纳

1回答

如何将dataframe列值传递给我的自定义函数以存储总金额？

、、

我有一个python脚本，组织有关NHL球员的网站数据。这些值被放入一个数据帧中。我还建立了一个函数，它接受球员的名字和球队名称，以获得球员的总工资排成一列。我希望将球员的名字(F1，F2，F3)从数据帧传递给函数( names )，并将结果存储在我的excel工作表(totalSalary)中。我尝试过将iloc函数传递给函数，但我感到困惑。 from bs4 import BeautifulSoup import requests import pandas as pd import colorama import crayons import datetime import xlsx

浏览 10提问于2019-02-03得票数 0

1回答

在Pandas/IPython中选择行，类似于SQL

、、、

我是Pandas的新手，我被困在了一个点上。请帮我继续。我有一个表，其中一列如下所示： categories ------------- [Bakeries, Food] [Restaurants] [Bakeries, Food] 我需要从dataframe中选择包含餐厅或类似餐厅的值(类似于SQL where value LIKE '%restaurant%')的所有行。我查看了各种论坛，但我找不到一个解决方案。我该怎么做呢？最新更新： resmdt[resmdt['categories'].str.contains('restaurant&#

浏览 7提问于2014-09-22得票数 0

2回答

在Mac OSX上安装pandas和numpy时出现问题

、、、

在得到O‘’Reilly这本书之前，我正在玩Python的pandas包。在成功安装xcode和EPDFree之后，当我尝试安装pandas时，使用easy_install的pandas安装出现了许多警告，当我测试pandas是否正常工作时，很明显不是。我曾多次尝试删除和重新安装pandas和Numpy，但都没有成功。我是个新手，所以我肯定做错了什么。这是我运行Python并尝试导入pandas和Numpy时得到的结果： $ python Python 2.7.2 (default, Oct 11 2012, 20:14:37) [GCC 4.2.1 Compatible Apple Cl

浏览 1提问于2013-08-28得票数 2

1回答

Python Pandas识别错误数据

、、

我有一个用逗号分隔的csv文件，每行有215列。文件非常大，我使用pandas dataframe pd.read_csv()和块来读取数据。文件中的一行有214列，而不是215列，但dataframe读取数据时将NaN应用于最后一列。有没有办法在pandas dataframe中标识此行，因为我更喜欢dataframe而不是csv_reader。注意:最后一列也可以为null，因此按等于null的最后一列过滤数据帧将不起作用

浏览 19提问于2020-09-30得票数 0

1回答

如何将这三个MySQL数据查询组合成一个具有多列的查询？

、

我有这三个问题，我需要合并成一个。 $sql = "SELECT SUM(datamb) AS value_sum FROM maindata GROUP BY phonenumber"; $sql1 = "select dataplan as currentplan from maindata GROUP BY phonenumber"; $sql2 = "SELECT DISTINCT phonenumber AS value_sum1 FROM maindata"; 所以我可以用如下三列显示它们： while ($row = m

浏览 0提问于2013-10-08得票数 0

回答已采纳

1回答

熊猫数据的逐个元素划分与"/"？

、

如果能理解这是怎么回事就好了。也许Python/Pandas中有些东西我不太明白。我有一个数据(价格数据)，并希望计算的回报。行是股票，列是日期。为了简单起见，我用一些随机数建立了价格。 import pandas as pd import numpy as np df_price = pd.DataFrame(np.random.rand(10,10)) df_ret = df_price.iloc[:,1:]/df_price.iloc[:,:-1]-1 这里有两件事是很奇怪的：我的分子和分母都是10 x 9。为什么输出是10 x 10，第一列是nans。为什么结果都是0，除了第

浏览 2提问于2020-08-20得票数 0

回答已采纳

3回答

用Pandas导入数据点差值与时间值换算的子图

、、、、

我对Python比较陌生(在自学过程中)，所以这是一个相当不错的学习曲线，但我很高兴能掌握它。我在excel中有一组来自实验的数据点，其中一列是时间(格式为00:00:00:000)，第二列是测量参数。我使用pandas读取excel文档，以便从它生成沿x轴的时间和沿y轴的测量变量的图形。但是，当我绘制数据时，时间列变成了数据点编号(例如00:00:00:000 - 00:05:40:454变成了0- 2000)，我不知道为什么。有没有人能建议一下如何纠正这个问题？其次，我想制作一个子图，显示y值之间的差异作为时间的函数，基本上是一个梯度来显示变化。有没有一种方法可以很容易地计算出来，并用

浏览 2提问于2018-06-29得票数 0

2回答

将年龄归入另一列年龄组

、、、

我有这个数据集 age 24 32 29 23 23 31 25 26 34 我想使用python对结果进行分类，并将结果保存到一个新列" agegroup“中，这样就可以在agegroup列中从23到26返回1，在agegroup列中返回值2，在agegroup列中返回31-34。

浏览 24提问于2020-06-18得票数 1

1回答

Python/SodaPY API返回不可哈希的类型: dict

、、、

我使用SodaPY客户端从纽约市开放政府倡议组织下载了JSON数据。SodaPY提供了使用其客户端的代码和以下注释： # First 2000 results, returned as JSON from API / converted to Python list of # dictionaries by sodapy. results = client.get("qiz3-axqb", limit=2000) # Convert to pandas DataFrame df = pd.DataFrame.from_records(results) 当我使用方法describ

浏览 3提问于2018-10-26得票数 0

2回答

使用pandas在Python中有条件地对DataFrame进行分组

、、

我想根据特定列中的值有条件地对我的DataFrame进行分组。以下是我正在使用的数据帧的示例： date id height dd/mm/yyyy 1A 6 dd/mm/yyyy 2A 4 dd/mm/yyyy 1B 5 dd/mm/yyyy 2B 1 我希望能够根据id列值中是否包含"A“或"B”对我的所有观察结果进行分组。我尝试过使用.filter()方法，如下所示： sides = df.groupby("id").filter(lambda group: "A"

浏览 37提问于2019-06-07得票数 0

回答已采纳

1回答

pandas后如何跨列求和？

、、

我正在对一个pandas数据帧使用groupby()操作。然后，我尝试对每一行的列求和。但是，在调用sum()时，我一直收到错误消息。我附上了我的代码如下： bike_use = bike_use.groupby(['road_name', 'count_point_id'])['pedal_cycles', 'two_wheeled_motor_vehicles'].sum(axis = 1) 我得到的错误是： TypeError: sum() got an unexpected keyword argument '

浏览 12提问于2020-12-04得票数 0

1回答

用Python读取和绘制CSV的日期

、、、

我有一个CSV，其中第一列是一天和一个时间，其余的列是在这些时间采取的测量。日期在一列中以"MM/DD/YYYY :mm:ss“的形式显示。Python将其读取为字符串。如何将此转换为日期和时间？Python不知道'09/14/2016 :00:00‘就在'09/15/2016’0:00之前在MatLab中，我可以使用 time = datenum(filename{:,1}) datetick('x','mmm-dd HH:MM:SS') 但我不知道在Python中使用什么。这种语言中有类似的命令吗？我试过使用约会时间，但运气不太好

浏览 3提问于2020-06-09得票数 0

回答已采纳

1回答

如何从承载HTML之外的表数据的网站中刮表？

、、、、

我正在尝试从这个表URL：中抓取表数据在之前的测试中，我使用了以下Python包:从bs4导入BeautifulSoup导入请求导入mysql.connector作为pd从sqlalchemy导入create_engine 但是这个url的HTML不包含表数据，而是从外部数据库中提取数据。有人能告诉我用这种HTML设置使用python脚本来抓取表数据的正确方向吗？我试着用我以前刮过的方法做一次盲刮。 from bs4 import BeautifulSoup import requests import mysql.connector import pandas as pd

浏览 3提问于2022-04-02得票数 -1

回答已采纳

1回答

Python:如果列具有键值对格式的数据，如何读取csv数据

、、

我是python的新手。我需要读取csv文件，它有不同的列。在csv文件中，一列包含像键和值对这样的数据。使用pandas如何从csv中提取该列的键和值。例如:列名：fruit 该列中的数据： { ""apple": "1,2,3,4", "orange":"5,6,7,8"} 如何从csv文件中获取水果列的键及其值？有什么建议吗？

浏览 3提问于2018-06-01得票数 0

2回答

函数定义和函数调用中参数和参数的顺序

最后，在研究python中的参数和参数时，我得出了以下结论：函数定义中参数的顺序 def foo ( non-optional parameters , optional parameters , *args , **kwargs): 函数调用中参数的顺序 foo( non-keyword arguments , keyword arguments ) 我只想知道在蟒蛇世界里是否有例外.此外，如果有任何其他类型的参数/参数，请注意. 谢谢!

浏览 3提问于2014-03-07得票数 1

回答已采纳

3回答

为什么python找不到我安装的库？

、

我使用python3.9，它不再能够找到我已经安装的库，即使它们已经安装。例如，当我导入熊猫时，我会收到这样的消息， >>> import pandas Traceback (most recent call last): File "<pyshell#0>", line 1, in <module> import pandas ModuleNotFoundError: No module named 'pandas' 当我使用pip安装库时，它告诉我它已经安装了。 C:\Users\malth>pi

浏览 0提问于2021-04-16得票数 0

1回答

对Python Pandas中的行(日期)进行分组并汇总几列(每个日期的多个测量值

、、、

我使用Python Pandas并从Postgres加载一个类似下面这样的表： date v00 v01 v02 v03 2001-01-01 00:00:00 30 40 50 100 2001-01-01 00:00:00 80 120 20 60 2001-02-01 00:00:00 20 70 50 20 我想使用Pandas对日期行进行分组，并汇总这些值。结果应该如下所示 2001-01-01 00:00:00 500 2001-02-01 00:00:00 160 我可以将日期分组并

浏览 17提问于2019-07-28得票数 2

回答已采纳

1回答

试图从熊猫的数据中获得小计

、、

我正在数据中的两列之间做交叉列表。下面是列中的一个示例： column_1 column_2 A -8 B 95 A -93 D 11 C -62 D -14 A -55 C 66 B 76 D -49 我正在寻找一个代码，它返回A、B、C和D的小计。例如，对于A，小计将是-156 (-8-93-55 = -156)。我试着用panda

浏览 1提问于2021-11-29得票数 0

回答已采纳

1回答

SQLAlchemy /熊猫-SQLAlchemy阅读栏作为潘达斯to_sql的CLOB

、、

我已经把数据集写到了一个数据框架中。 inv.info() <class 'pandas.core.frame.DataFrame'> Int64Index: 43839 entries, 0 to 43838 Data columns (total 16 columns): MST_CO 43839 non-null object LOAD_DATE 43839 non-null object WHSE_CODE 43839 non-null object ITEM_NO

浏览 4提问于2015-03-30得票数 4

回答已采纳

1回答

在Python中计算信号幅值面积

、、、

我需要计算来自传感器的时间数据的信号幅度区域。我有一个来自CSV的多维Pandas表，显示加速度计数据。还有一个Time列和一个Index列，它们表示一个赫兹频率(每秒从0到24，每25 hz递增1的"Time“列) 它看起来像这样： Time | Index | Accel. X | Accel. Y | Accel. Z 52500.0 | 24.0 | 0.468764 | -0.781274 | 0.687521 52501.0 | 0.0 | 0.375011 | -0.531266 | 0.812525 我需要计算这些数据的信号幅度面积。我知

浏览 84提问于2021-07-13得票数 0

4回答

查找二维列表中特定列的长度

、、、、

在Python 3中，如果我有一个二维列表，其中最后一行没有完整填写(如下例所示)，如何获得特定列的长度？ [[1, 2, 3,], [4, 5, 6,], [7, 8,]] 例如，第0列和第1列的长度为3，而第2列的长度为2。有没有办法在不使用pandas模块的情况下做到这一点？

浏览 59提问于2018-08-11得票数 2

回答已采纳

2回答

熊猫没有正确安装在venv中

、、、、

在ubuntu16.4.4上使用Python，我试图在2.7.12中安装pandas和其他一些带有pip的软件包。安装过程中没有出现任何错误。然而，当我试图进口熊猫时，我会发现以下错误： RuntimeError: module compiled against API version 0xc but this version of numpy is 0xa Traceback (most recent call last): ... import pandas as pd File "/usr/local/lib/python2.7/dist-packages/panda

浏览 0提问于2018-05-15得票数 0

回答已采纳

1回答

在`pandas.read_csv`中，‘`str`’和‘`object`’数据类型有什么区别？

、、

根据，pandas.read_csv允许我为CSV文件中的列指定一个dtype。 d类型：列->类型的类型名称或dict，对于数据或列默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (引擎=‘python’不支持)。使用str或object来保存而不是解释dtype。若要将每一列视为文本数据，我可以使用 df = pandas.read_csv(... , dtype=str) 或 df = pandas.read_csv(..., dtype=object) 据我所知，这两种方法的行为总是完全相同的。这两种方法是否有不同行为的情况？如果是的话，

浏览 2提问于2016-05-17得票数 6

回答已采纳

1回答

UnicodeEncodeError:在用utf-16将系列对象转换为unicode时，'ascii‘编解码器不能编码字符u’\u201c

、、、

我有一个utf-16 csv文件，我试图加载到潘达。默认情况下，数据作为对象数据类型出现。我计划对标题列进行一些建模，因此我想将列df‘the’从一个对象转换为一个unicode字符串。目前，我遇到了以下错误：'UnicodeEncodeError：'ascii‘编解码器无法在位置6中编码字符u’\u201c:在执行df‘’caption‘=df’‘caption’..astype(Unicode)时，序号不在范围(128)‘。我试图通过在df“标题”列中的单个值上使用编码和解码函数来解决这个问题，但是我无法让它工作。我对熊猫和unicode非常陌生，所以我想知道我做错了什

浏览 0提问于2014-04-16得票数 2

回答已采纳

1回答

如何使不同的列在holoviews / hvplot中呈现为不同的颜色？

、

我有一个包含两列时间序列数据的pandas数据帧。在我的实际数据中，这些列足够大，如果没有数据着色器，渲染就会很笨拙。我正在尝试比较这两个时间序列中的事件。但是，我需要能够分辨出哪个数据点来自哪个列。下面是一个简单的函数示例。如何让A列和B列使用不同的颜色映射？ import numpy as np import hvplot.pandas import pandas as pd A = np.random.randint(10, size=10000) B = np.random.randint(30, size=10000) d = {'A':A,'B'

浏览 19提问于2019-01-12得票数 0

回答已采纳

3回答

Pandas Dataframe按多列分组，然后求和

、、、

假设每个Python代码都有以下内容： import pandas as pd import numpy as np 在Pandas中，如果我有一个2列的数据帧，其中一列是数字数组，我可以将数组的值相加得到一个数组。 df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'], 'numbers' : [np.array([1, 2, 3, 4]),np.array([2, 4, 2, 4]),np.array([2, 3, 4, 5]),np.arra

浏览 8提问于2015-09-03得票数 2

2回答

python熊猫申请不接受numpy.float64 args

、、、、

我遇到了将numpy.float64变量作为参数传递给pandas.Series.apply()的问题。有没有办法强制使用.mean()和.std()函数的熊猫版本来满足熊猫的需求？代码 def normalization(val_to_norm, col_mean, col_sd): return (val_to_norm - col_mean) / col_sd voting_df['pop_estimate'].info() pop_mean, pop_sd = voting_df['pop_estimate'].mean(), voting

浏览 24提问于2022-09-29得票数 1

回答已采纳

1回答

python的pandas插件在树冠环境中不排序吗？

、、

我已经在这上面工作了几个小时了，现在我放弃了。我有一个科学工具，它稍微出了点故障，并且创建了一个.csv数据库，其中的数据点顺序混乱。 Test_ID Data_Point Test_Time Step_Time etc... 1 1439 1441.044976 1328.572329 1 1440 1442.046983 1329.574335 1 1121 1122.423305 1009.950658 1 1122 1123.424295 1010.951648 注意数据是如何从1440跳回到1121的。如果在.csv文件中回溯跟踪，您会

浏览 0提问于2016-06-10得票数 1

1回答

Pandas对整个数据集进行单行过滤-它是如何实现的？

、、

我现在正在研究这个奇妙的库，我对过滤，甚至列操作是如何完成的感到非常困惑，并试图理解这是pandas还是python本身的一个特性。更准确地说： import pandas df = pandas.read_csv('data.csv') # Doing df['Column'] # would display all values from Column for dataframe # Even moreso, doing df.loc[df['Column'] > 10] # would display all values fr

浏览 12提问于2020-07-01得票数 1

回答已采纳

1回答

Pandas遍历各行，并使用sum创建一个新列

、

我是Pandas的newby，也许我的问题很简单。我有一个形状为n*3的数据框，我想创建一个新列(第四列)，我将在其中添加其他列的值(column1 + column2 + column3)。我试过了，尽管我打印了具有正确汇总值的总和，但无法将其保存到新列中。 for index, row in answers.iterrows(): mydf[index, 3] = mydf.iloc[index, 0] + mydf.iloc[index, 1] + mydf.iloc[index, 2]

浏览 3提问于2019-03-07得票数 0

1回答

尝试从python中的列.csv文件中打印特定值

、

我试图从与特定输入匹配的列中获取和打印所有值(整数)。输入的长度必须在3到15之间，如下所示： import pandas as pd file = pd.read_csv('filename.csv', encoding="ISO-8859-1", engine='python', sep=';') def codechoice(): codeNum = int(input("What's the code: ")) if (len(str(codeNum))) > 3 and (len(s

浏览 5提问于2022-05-30得票数 0

2回答

在MySQL中理解和(空)

、、

通常，当NULL涉及到任何方程时，整个结果将分解为NULL (例如，SELECT 2 + NULL + 5返回NULL)。下列情况也是如此： SELECT SUM(NULL)返回NULL。Proposition #1 当SUM用于聚合列并且列也可以包含NULL值时，会发生什么情况？基于proposition #1，为什么输出不会导致NULL。 CREATE TABLE t (age INT NULL); INSERT INTO t (age) VALUES (15),(20), (NULL), (30), (35); SELECT SUM(age) FROM t; 输出： 100

浏览 2提问于2016-09-08得票数 18

回答已采纳

2回答

如何在Python中查找dataframe中的行中出现的错误？

、、、、

df["Dt_Customer"] = pd.to_datetime(df["Dt_Customer"],format='%d-%m-%y') 我已经尝试转换日期列，数据集包含100多万行...我必须找到没有转换的日期行。 TypeError: Unrecognized value type: <class 'str'> During handling of the above exception, another exception occurred: ValueError

浏览 58提问于2021-09-30得票数 0

回答已采纳

2回答

在python中具有函数的r

、

在R中，我可以使用with(obj, a + b + c + d)而不是obj$a + obj$b + obj$c + obj$d，其中obj可以是list或data.frame。对于python中的dict、pandas.Series、pandas.DataFrame有类似的功能吗？

浏览 2提问于2016-05-11得票数 3

回答已采纳

1回答

将pandas数据框保存到csv文件时的附加列

、、、、

这里是处理和保存csv文件的代码，以及原始输入csv文件和输出csv文件的代码，在Python2.7上使用pandas并想知道为什么在保存文件时在开头有一个额外的列？谢谢。 c_a,c_b,c_c,c_d hello,python,pandas,0.0 hi,java,pandas,1.0 ho,c++,numpy,0.0 sample = pd.read_csv('123.csv', header=None, skiprows=1, dtype={0:str, 1:str, 2:str, 3:float}) sample.columns = pd.Index(dat

浏览 3提问于2016-08-28得票数 5

回答已采纳