pandas:一列是另一列的子字符串_Pandas中的子字符串列基于另一列_Pandas:确定一列中的字符串是否是另一列中字符串的子字符串 - 腾讯云开发者社区

python、pandas

我希望使用字符串列表查找pandas列，但即使列包含字符串的一部分，我也希望查找列。现在，如果列名是'TVD‘，并且我的列表中有'tv’，我希望找到它。原因是我想删除这些列，并将它们带回第一列。这是我当前的代码，但我只能找到确切的列名。假设列名是'TVD (英尺)‘，那么我就会有一个问题。 df = sts.read_df(dataset) depth_names_lower = ['tvd', 'tvdss', 'md'] depth_names_upper = [depth.upper() for depth in d

浏览 0提问于2021-02-04得票数 0

1回答

我想删除包含一些文本的所有行

python、pandas

我想删除所有包含TOTAL的行： ? data=pandas.read_excel(r'C:\Users\lenovo\Desktop\tax reports\sales_expense_regionwiseGST.xlsx') data2[data2.iloc[:,0].str.contains("Total".index)] 下面的代码导入，然后使用iloc或使用数据选择第一列[‘州/联合地区’) iloc也会导致选择第一列“类型”，而data['column_NAME_HERE']则以错误告终。我想获取这些行并将其

浏览 10提问于2020-01-03得票数 0

回答已采纳

3回答

Pandas从另一列的字符串片创建新列

python、pandas

我想在Pandas中创建一个新列，使用为dataframe中的另一列分割的字符串。例如。 Sample Value New_sample AAB 23 A BAB 25 B 其中，New_sample是由Sample的简单[:1]切片形成的新列我尝试了许多方法，但都无济于事--我觉得我错过了一些简单的东西。做这件事最有效的方法是什么？

浏览 10提问于2014-09-11得票数 56

回答已采纳

1回答

根据一列的值从另一列复制值

python、python-2.7、pandas

我尝试根据第四列中的值填充另两列中的一列中的值。我有一个包含四列的pandas数据帧: A、B、C、D df_copy = df.copy() for i, row in df.iterrows(): if 'Test' in row.D: df_copy.loc[i, 'A'] = row.B elif 'Other' in row.D: df_copy.loc[i, 'A'] = row.C 这是可行的，但速度非常慢。有没有更有效的方法？

浏览 2提问于2015-05-02得票数 2

回答已采纳

1回答

Pandas DataFrame -如何处理可以更改拼写/名称的列名？

python、pandas、dataframe

我正在构建一个进程来摄取一个文件，该文件有时会对同一列使用不同的名称。例如： zipcode, zip, zipcodes, property_zipcode 可以放心地假设，至少zip需要始终出现在名称中。如果没有，脚本可以退出，这是可以接受的。其思想是使用pandas数据帧执行任何数据转换，特别是通过名为zipcode之类的列对数据进行分组。下面是代码示例。df_reported可以是具有地址/邮政编码组合的任何df。但就目前而言，它基本上是一个excel文件，通过read_excel转换为df。 def add_adressid_to_df(df_reported): "&

浏览 14提问于2021-09-09得票数 0

3回答

根据另一个列值替换Pandas中的列中的文本

python、pandas、dataframe

我正在尝试获取pandas中一列中的值，并从另一列中删除该值。然而，replace的行为并不像我预期的那样工作。在本例中，我试图使col2中的值等于'something‘ import pandas as pd #Build the dataframe col1 = ['ABC', 'DEF'] col2 = ['something - ABC', 'something - DEF'] df1 = pd.DataFrame(['ABC', 'DEF'], columns = [

浏览 0提问于2017-10-17得票数 0

2回答

将一列的一部分复制到同一表中的另一列

sql、ms-access、ms-access-2010

我需要将一列的一部分复制到另一列中。分隔符是"-“。我不想把这部分从第一栏中删除。示例： ItemDesc Part# Glowear_black-1234 所以它应该是这样的： ItemDesc Part# Glowear_black-1234 1234 我能找到的唯一的SQL查询是从ItemDesc列中删除信息，并将其粘贴到Part#中。我还需要第一栏中的"1234“。而且，并不是所有的ItemDesc都有"-“(这很好)。

浏览 4提问于2013-10-17得票数 1

回答已采纳

1回答

熊猫数据串接

python、pandas、dataframe

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

对包含特定字符串的条目计数的度量值

powerbi、dax

我正在做一份报告，其中我必须显示不同项目的采购率。每个项目都由三个字母的字符串组成，并且所有项目都作为一个大字符串汇集在同一列中，并由空格分隔。我现在正在尝试创建一个度量，以便搜索此列中的特定项，并计算找到该字符串的条目数量。我现在可以通过创建一个计算列来查找包含该项目的条目，然后对该列求和，但是，如果这在度量中是可实现的，那就更好了。例如，一列可以包含 7AX 4U6 4U7 5AZ 6AT 4U6 609 606 543 然后我希望能够通过测量来计算有多少条目包含4U6… 提前感谢您的帮助

浏览 0提问于2018-01-12得票数 8

回答已采纳

1回答

Pandas正在将带有方括号的列作为字符串而不是列表导入

python、pandas、list、dataframe

我正在使用pd.read_csv导入数据帧。其中一列包含字符串列表。例如： >>> df['topic'].head(5) 0 ['ECONOMIC PERFORMANCE', 'ECONOMICS', 'EQUITY ... 1 ['CAPACITY/FACILITIES', 'CORPORATE/INDUSTRIAL'] 2 ['PERFORMANCE', 'ACCOUNTS/EARNINGS', 'CORPORAT... 3

浏览 28提问于2021-04-28得票数 3

回答已采纳

1回答

检查字符串以在中创建新列。

python、regex、apache-spark、pyspark、apache-spark-sql

我有一个带有交易对的Spark dataframe列，我需要使用它来创建一个新列，其中包含硬币的名称。第一列" bot“包含"Polkadot/USD"，我需要一个名为”硬币“的新列，它只包含bot列的子字符串"Polkadot”。其他行也一样。基本上，新列需要删除子字符串"/USD“。代码是如何完成这一任务的。我是一个密码交易者，而不是一个编码器，所以答案中的编码细节越多越好。谢谢。注意:笔记本是Python笔记本

浏览 2提问于2021-07-26得票数 1

回答已采纳

2回答

从数据库中读取数据时，如何避免pandas dataframe列值中的尾随零？

python、pandas、dataframe

我正在将数据从postgresql DB读取到pandas dataframe中。在其中一列中，所有值都是整数，而有些值丢失了。在读取时，Dataframe会将尾随零附加到列中的所有值。例如原始数据 SUBJID 1031456 1031457 1031458 我在Dataframe列中得到的是 df['SUBJID'].head() 1031456.0 1031457.0 1031458.0 我知道我可以删除它，但是有多个列&我永远不知道哪一列会有这个问题。因此，在读取自身时，我希望确保所有内容都是以字符串形式读取的&没有那些尾随的零。我已经用df = p

浏览 3提问于2020-08-13得票数 2

4回答

读取Pandas中由空格分隔的字符串数据

python、pandas

我在文本文件中有两列数据，如以下所示。 Balkrishna Industries Ltd. Auto Ancillaries 3.54 Aurobindo Pharma Ltd. Pharmaceuticals 3.36 NIIT Technologies Ltd. Software 3.31 Sonata Software Ltd. Software 3.21 当我试图在Pandas中阅读这篇文章时，会发现一个错误，因为空格是一个分隔符，公司名称不限于单个列。如何修改代码，将数据分成两列，一列表示名称，另一列表示数字？ import numpy as np import pandas as

浏览 1提问于2019-06-04得票数 3

回答已采纳

1回答

用Python读取和绘制CSV的日期

date、datetime、time、python-datetime

我有一个CSV，其中第一列是一天和一个时间，其余的列是在这些时间采取的测量。日期在一列中以"MM/DD/YYYY :mm:ss“的形式显示。Python将其读取为字符串。如何将此转换为日期和时间？Python不知道'09/14/2016 :00:00‘就在'09/15/2016’0:00之前在MatLab中，我可以使用 time = datenum(filename{:,1}) datetick('x','mmm-dd HH:MM:SS') 但我不知道在Python中使用什么。这种语言中有类似的命令吗？我试过使用约会时间，但运气不太好

浏览 3提问于2020-06-09得票数 0

回答已采纳

3回答

如何根据两个字符串列的差异在pandas中创建新列？

python、regex、pandas

我如何在pandas中创建一个新列，它是由字符串组成的另外两个列的差异的结果？我有一个标题为"Good_Address“的专栏，它有像"123 Fake Street apt101”这样的条目，还有一个标题为"Bad_Address“的专栏，它有像"123 Fake Street”这样的条目。我希望"Address_Difference“列中的输出是”Apt101“。我试过这样做： import pandas as pd data = pd.read_csv("AddressFile.csv") data['Address D

浏览 0提问于2018-11-14得票数 2

2回答

pandas.DataFrame.round输出不同数量的小数位数

python、pandas、dataframe

不出所料，在下面的DataFrame上调用round(2)会得到一列有两个小数位，但另一列只有一个小数位。 import pandas as pd df = pd.DataFrame([ [0.829, 0.801], [0.997, 0.997] ]) df.round(2) 当在笔记本中运行此命令时，它会输出： 0 1 0 0.83 0.8 1 1.00 1.0 我认为这是因为0.801舍入为0.8，因此只需要一个小数位，另一行转到1.0而不是1.00。但是我想将这个DataFrame输出到一个LaTeX表中，所以我希望两列的小数位数相同。有

浏览 29提问于2019-08-14得票数 2

回答已采纳

1回答

减去2列数据，并得到结果，没有奇怪的四舍五入(浮点算法)

python、pandas

我有两个Pandas数据格式，有数千个值。我用Pandas的read_csv函数从csv文件中加载它们。我需要从第一列中减去第二列的一列(“打开”)，我这样做： subtraction = shiftedDataset.open - dataset.open 我得到了一系列的结果。问题在于浮点算法产生的奇怪舍入结果。(例如，应该是-2.999999999997449e-05) 0.00003的值是我怎样才能得到正确的结果？我可以在减法前或减法后操作数据，我不在乎，但我需要获得最好的性能。

浏览 6提问于2019-10-03得票数 1

回答已采纳

1回答

如何在pandas列的列表中进行搜索？

python、pandas、list

我得到了一组格式不佳的数据来清理，有几列数据包含多条信息，每条信息都需要分成多列。一个例子是一个名为DaysOfWeek的列，它包含一个人可以工作的天数，以及一个自由文本字段。我想创建8列，一列表示一周中的每一天，另一列表示不是一周中某一天的任何内容(可能包含一周中某一天的名称，如下面的示例所示)。我已经将数据导入到Pandas中，并尝试使用"in“列表功能来扫描一周中的几天，但我得到的所有信息都是错误的。下面是重现我的问题的代码： import pandas as pd # First example - Testing it in regular code: x = 'M

浏览 9提问于2020-03-01得票数 1

回答已采纳

2回答

使用另一列值的len()添加一个DataFrame列

python、string、pandas、dataframe、string-length

我在试图在另一列中获取字符串值的字符计数列时遇到了问题，并且还没有想出如何有效地做到这一点。 for index in range(len(df)): df['char_length'][index] = len(df['string'][index])) 这显然包括首先创建一列空，然后重写它，这需要花费很长时间在我的数据集上。那么最有效的方法是什么 'string' 'char_length' abcd 4 abcde 5 我已经查过很多次了，但我还没能弄清楚。

浏览 1提问于2015-04-25得票数 12

回答已采纳

1回答

自联接可将两个日期列与两个日期的groupby count列合并

sql、sqlite、date、select、count

我有请求日期和提货日期列。它们是相似的，但不是相同的。我目前使用两个独立的查询和pandas来连接这两个数据帧。我使用SQLAlchemy在Flask中运行，因此WHERE中的所有内容都将传递给变量。在DB浏览器中测试过原始SQL之后，我使用text()方法来运行它。我尝试着单独使用sql来获得我想要的输出，但是没有取得任何进展。 SELECT r.PUDate, COUNT(r.PUDate) as trips FROM requests r WHERE PULoc IN ("list of location ID's") AND r.'TO' IN

浏览 9提问于2020-06-20得票数 0

1回答

SSIS在同一列中重新排列全名

sql-server、ssis、expression

我有一个excel文件要加载到我的数据库中，我想将name字段重新排列到下面 FIRSTNAME M LASTNAME 而不是现在的格式，即 LASTNAME, FIRSTNAME M. 为了保持它与以前的负载一致，我已经加载到我的数据库中。是否有可能以某种方式做到这一点并将其放入同一列中？我搜索过，只发现人们一直想把它们分割成多个列。提前谢谢。

浏览 2提问于2017-08-16得票数 3

回答已采纳

4回答

如何在Pandas Dataframe中将数据类型为object的列转换为string

python、pandas

当我将csv文件读取到pandas dataframe时，每一列都被转换为它自己的数据类型。我有一个被转换为对象的列。我想对该列执行字符串操作，比如拆分值和创建列表。但是这样的操作是不可能的，因为它的数据类型是object。有没有人可以告诉我如何将一列中的所有项转换为字符串而不是对象？我尝试了几种方法，但都不起作用。我使用了astype、str()、to_string等。 a=lambda x: str(x).split(',') df['column'].apply(a) 或 df['column'].astype(str)

浏览 17提问于2015-11-27得票数 122

1回答

选择任何列在Pandas dataframe中包含字符串的行的最简洁的方法？

python、pandas

选择任何列在Pandas dataframe中包含字符串的所有行的最简洁的方法是什么？例如，给定以下数据，选择列中值包含b的行的最佳方法是什么 df = pd.DataFrame({ 'x': ['foo', 'foo', 'bar'], 'y': ['foo', 'foo', 'foo'], 'z': ['foo', 'baz', 'foo'] }) 我对Pandas缺乏经验，

浏览 4提问于2016-08-16得票数 30

2回答

将空字符串替换为列的模式

python、pandas

我有以下pandas数据帧： df = pd.DataFrame([["hitesh","","HAIK"],["hitesh","red","ll"],["haikent","red","tt"],["","","HAIK"]]) 我正在尝试将数据帧的空字符串替换为每列的相应模式。我在努力 df= df.replace("" , df.mode()[0]) 但这只是用第一列模式替换了数

浏览 9提问于2017-03-10得票数 2

回答已采纳

3回答

如何将这2个日期/时间列转换为1？

python、pandas、date、datetime、posix

我花了几个小时阅读和尝试Python和Pandas文档中的东西，但我没有得到我需要的东西…… 我有两列--一列叫做DATE_GMT，一列叫做TIME_GMT。date列是不言自明的。TIME列显示从"0“到"24”的时间... 如何转换日期和时间列，然后将它们合并以使它们支持时间？

浏览 30提问于2018-06-26得票数 1

2回答

为什么我在尝试向添加列时获得np.NaN值？

python、pandas

我有一个熊猫的数据存储日期信息作为字符串。我想直接从每个日期提取月份，所以我尝试了如下： import pandas as pd df = pd.DataFrame([['2015-04-16', 5], ['2014-05-01', 6]],columns = ['date','units']) df['month'] = df['month'].str[5,7] print(df) 这提供了以下输出 date units month 0 2015-04-16 5

浏览 3提问于2015-05-10得票数 2

回答已采纳

1回答

在`pandas.read_csv`中，‘`str`’和‘`object`’数据类型有什么区别？

python、python-3.x、pandas

根据，pandas.read_csv允许我为CSV文件中的列指定一个dtype。 d类型：列->类型的类型名称或dict，对于数据或列默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (引擎=‘python’不支持)。使用str或object来保存而不是解释dtype。若要将每一列视为文本数据，我可以使用 df = pandas.read_csv(... , dtype=str) 或 df = pandas.read_csv(..., dtype=object) 据我所知，这两种方法的行为总是完全相同的。这两种方法是否有不同行为的情况？如果是的话，

浏览 2提问于2016-05-17得票数 6

回答已采纳

1回答

在pandas dataframe列中，如果是2017，请删除最后4位数字

string、pandas、text、replace、strip

在pandas数据帧中，有一列X，数字如12342017、23456782017、WC456123、ER2017124。如果是'2017‘，我想去掉最后四位。因此，我想要的输出应该是1234,2345677，WC45612，ER2017124

浏览 40提问于2020-03-20得票数 0

回答已采纳

1回答

具有数组和密钥对的数据帧

python、arrays、json、pandas、dataframe

我有一个JSON结构，我需要它转换成数据帧。我已经通过pandas库进行了转换，但我在两列中遇到了问题，一列是数组，另一列是键对值。 Pito Value {"pito-key": "Number"} [{"WRITESTAMP": "2018-06-28T16:30:36Z", "S":"41bbc22","VALUE":"2"}] 如何将列分解为数据帧。

浏览 7提问于2020-01-28得票数 0

16回答

根据子串标准过滤pandas DataFrame

python、string、pandas、dataframe

我有一个包含一列字符串值的pandas DataFrame。我需要根据部分字符串匹配来选择行。像这样的成语 re.search(pattern, cell_in_question) 返回一个布尔值。我熟悉df[df['A'] == "hello world"]的语法，但似乎找不到一种方法来对部分字符串匹配(比如'hello' )做同样的事情。

浏览 8提问于2012-07-06得票数 686

4回答

更改日期列中的年份

python、pandas、date、dataframe

我有第一列日期的数据。 import pandas as pd df = pd.DataFrame({'Date': ['8/4/2014','8/5/2014','8/14/2014','8/21/2014','8/23/2015','8/24/2015']}) 我想把2014年至2015年和2015年改为2016年。我在看pandas.datetime，但它似乎没有这样的功能。请帮帮我。非常感谢。

浏览 0提问于2018-11-04得票数 5

回答已采纳

2回答

熊猫-在另一列的值之间有一列的和值

python、pandas

我希望根据Pandas中另一列中的值，对一列中的值进行求和。见下图。在一栏(A)中是1或0的值，在B栏中是值。每次第一列中的值=1时，我都需要在两个1之间的第二列中添加(Sum)值。换句话说，在两个事件之间(由一个事件指示)，我需要添加发生的其他事情的总数(列b)。

浏览 5提问于2017-11-06得票数 2

回答已采纳

3回答

如何从列B的字符串中删除列A中的字符串

python、pandas、substring、concatenation

想知道如果你有两列(A = 'Name'，B= 'Name_Age')，有没有一种快速的方法从'Name_Age‘中删除'Name’，这样你就可以快速获得'Age'，就像反向连接一样？？我考虑过“字符串拆分”，但在某些情况下(当没有字符串拆分因子时)，我真的需要一种方法来从另一列的字符串中删除一列的字符串。 #example data below: import pandas as pd data = {'Name':['Mark','Matt','Michael&#

浏览 14提问于2019-08-13得票数 1

2回答

所有熊猫细胞的Lemmatization

python、pandas

我有一个熊猫数据帧。有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。如何使用nltk库有效地计算所有这些单词的引理？ import nltk nltk.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。我的数据看起来类似于： import pandas as pd data = [[['walked','am','stressed',

浏览 1提问于2017-11-30得票数 11

回答已采纳

1回答

将值的一部分切片到一行的一列中

python、pandas、indexing、slice

我希望为一列的每一行选择数字5:8的10位字符串数字。我尝试过用循环索引，但这似乎很乏味。有没有更简单的方法？数据的一个小例子： import pandas as pd data = [[1, 2, '12345678910'], [1, 2, '10987654321'], [1, 2, '11029384756']] df = pd.DataFrame(data, columns = ['Var1', 'Var2', 'Var3]) 应该对Var3进行操作，结果应该是长度较短的字符串： data =

浏览 7提问于2021-08-12得票数 0

回答已采纳

1回答

Pandas -如何在返回行时排除空白单元格

python、pandas、search、null、xlsx

我刚刚开始使用python和pandas，我想搜索一个数据帧，并根据药物名称返回一行，返回所有非空的列单元格。我有这个： import pandas as pd safety = pd.read_excel("safety.xlsx") searchterm = input("Enter drug name...") print (safety.loc[safety['Drug_name'] == searchterm]) 这将返回药物和所有列，甚至是空白列。例如，每一行是一种药物，每一列是一个标准，每种药物可以有一些标准的信息，但不是所有

浏览 24提问于2021-04-24得票数 0

回答已采纳

2回答

Python使用空格sep从csv读取数据，第一列除外

python、pandas、dataframe

嗨，我想知道是否有一种方法可以使用pandas read_csv从csv文件中读取数据，除了第一列之外，每个条目都用空格分隔： Alabama 400 300 200 New York 400 200 100 Missouri 400 200 50 District of Columbia 450 100 250 因此将有4列，第一列是state。

浏览 28提问于2019-01-18得票数 1

回答已采纳

1回答

转换器参数依赖于另一个列值

python、pandas

在我的脚本中，我想读取一些csv文件，同时转换输入值。但是一列的值取决于另一列的值(此列不会被转换)。有没有办法在read_csv中实现这一点，或者我必须在读取csv后对其进行更改？ file.csv date total percentage 03/25/2017 100 1% 04/15/2016 200 6% 预期输出 date total success 03/25/2017 100 1 04/15/2016 200 12 def convert_s

浏览 24提问于2019-01-30得票数 1

回答已采纳

2回答

熊猫:计算分类栏的最大行数

pandas、max、categorical-data、rowwise

我有一个DataFrame，包含2列有序的分类数据(属于同一类别)。我想要构造另一列，其中包含前2列的分类最大值。我设置了以下内容。 import pandas as pd from pandas.api.types import CategoricalDtype import numpy as np cats = CategoricalDtype(categories=['small', 'normal', 'large'], ordered=True) data = { 'A': ['normal',

浏览 1提问于2020-03-18得票数 0

1回答

按另一列查询mysql中的REGEX_REPLACE

mysql、regex

我有一个T表，它有两列C1和C2。我想写一个查询如下： UPDATE TABLE T SET C2 = REGEX_REPLACE( "(REG_SUB_PART1)(REG_SUB_PART2)(REG_SUB_PART3)", C1, REG_SUB_PART1 ) WHERE C2="ABC"; 实际上，我想使用另一列C1，假设URL "“并将C2设置为其中的一部分，让我们使用regex "(http://)?(www\.)?([a-zA-Z0-9]*)"的$3 (第三部分)来表示"goog

浏览 3提问于2013-11-20得票数 0

回答已采纳

3回答

使用pandas.io.sql.read_frame，可以像在read_csv中一样使用parse_dates吗？

python、sql、datetime、pandas

我正在使用pandas.io.sql.read_frame直接从数据库读取data_frame cnx = pandas.io.sql.connect(host='srv',user='me',password='pw',database='db') df = pandas.io.sql.read_frame('sql_query',cnx) 它可以很好地检索数据。但我想将其中一列解析为datetime64，类似于从CSV文件读取时可以执行的操作，例如： df2 = pandas.io.read_csv(csv_f

浏览 2提问于2013-03-06得票数 7

1回答

在dataframe中向新行添加值

python

我有以下数据。我现在想要做的是增加一列与字数。 import pandas as pd df = pd.DataFrame([['These are two words', 1], ['Two words', 2]], columns=('body', 'ticketID')) 因此，我这样做： data['Count'] = '' for index, i in data.iterrows(): y = len(i['Content']) i['Count

浏览 3提问于2017-02-03得票数 0

回答已采纳

1回答

Pandas用布尔值写excel问题

python、excel、pandas

我有一个数据帧，其中一列有字符串值“真”或“假”，然而使用pd.to_excel打开的文件与excel这一列是不同的常规exce“真”(逻辑)从熊猫“真”与excel“真”返回假。当我导出到CSV时，问题就解决了，但是所有其他格式都消失了。有谁知道如何解决这个问题吗？ import pandas as pd d = {'col1': [1, 2], 'col2': [3, 4], 'col3': ['True','False']} df = pd.DataFrame(data=d) writer = pd.Exc

浏览 6提问于2018-11-27得票数 0

2回答

使用json.dump()后，整数类型键转成字符串类型

python、json、pandas

我有一个CSV文件，其中有两列，一列用于法语单词，一列用于英文单词： French,English partie,part histoire,history chercher,search seulement,only police,police 我试图将CSV数据更改为JSON，但遇到了一个错误。我的索引，我想成为一个整数，似乎是一个字符串。也尝试使用int()，但是看起来它不会修复这个问题。如何将JSON文件中的索引值更改为整数？ import json import pandas data = pandas.read_csv("data/french_words.csv"

浏览 10提问于2022-08-20得票数 1

1回答

python-极将字符串转换为数字

pandas、python-polars

在应用pandas.to_numeric时，Pandas返回的dtype是float64或int64，这取决于所提供的数据. 在极地上这样做是公平的吗？我已经看到了这个，但是我不想单独地投出每一列。有几个字符串列我想要变成数字。这可以是int值或浮点值。 #code to show casting in pandas.to_numeric import pandas as pd df = pd.DataFrame({"col1":["1","2"], "col2":["3.5", "4.6"]})

浏览 9提问于2022-09-14得票数 1

回答已采纳

1回答

具有多个键的熊猫grouby

python、pandas

提前道歉。我是Python / Pandas的新手，所以这个问题可能提得不好。我有一个大约有400万行和大约10列的数据帧。我想要计算由其他每一列的不同值(例如B、C、D、E、F、G、H、I、J)定义的每一组的第一列(例如A)的平均值。这定义了大约200,000个组。我试过groupby，例如 mytest = df.groupby(['B','C','D', 'E', 'F', 'G', 'H', 'I', 'J']) mytest.mean(

浏览 0提问于2016-05-07得票数 1

3回答

合并来自两个Pandas数据帧的列，并显示每行的源

python、pandas、dataframe

我有两个Pandas数据帧： import pandas as pd a = pd.DataFrame( {'key' : [123, 234, 345, 456] } ) b = pd.DataFrame( {'key' : [ 234, 345, 456, 567 ] } ) 我想做的是将它们合并到一个包含两列的数据帧中:一列是两列的并集；另一列是source，列出了两个原始数据帧中哪一个包含该键。对于上面的输入，我需要这样： +---+-----+--------+ | | key | source | +---+-----+--------

浏览 1提问于2014-12-11得票数 0

4回答

Pandas直方图df.hist()分组依据

pandas、matplotlib、histogram

如何使用group by绘制带有pandas DataFrame.hist()的直方图？我有一个包含5列的数据框："A“、"B”、"C“、"D”和"Group“ 有两个分组类："yes“和"no” 使用： df.hist() 我得到了4列中每一列的历史记录。现在我想得到相同的4个图形，但带有蓝色条(group=“是”)和红色条(group =“否”)。我尝试了一下，但没有成功： df.hist(by = "group")

浏览 0提问于2017-08-25得票数 18

回答已采纳

1回答

子报表上的SQL Server Reporting Services 2005列自动换行

reportingservices-2005

有没有人知道如何设置子报表的高度和宽度，以便强制子报表分成几列？分界:我必须在表格报表上方的页眉中有限的空间中显示图例，并且我希望限制图例的高度，以便根据需要将其包装到多列中。例如，子报表可能是从包含8个项的数据集中提取的:1-红色、2-蓝色、3-紫色、4-绿色、5-黄色、6-橙色、7-棕色、8-黑色。我希望将子报表格式化为3列/3行，在第一列中显示前3列，在第二列中显示下一列，在最后一列中显示最后2行。目前，子报表设置为有3列，并且主报表内的子报表区域的大小设置为与子报表本身完全相同的大小。但是，当我运行这两个报表中的任何一个时，我只能得到1列，并且子报表的高度正在扩展，以将所有内容都放

浏览 4提问于2009-06-12得票数 0

回答已采纳

1回答

保留在data.frame中只有两个字母不同的双列

我在R中有一个数据框架，它由大约100列组成。大多数列是双倍的，但有两个字母不同。我想保留这些列，并删除那些不加倍的列。下面是一个示例： 234-rgz SK 234-rgz PV 556-gft SK 456-hjk SK 456-hjk PV 产出应是： 234-rgz SK 234-rgz PV 456-hjk SK 456-hjk PV 所有列都有相同的命名约定。从2开始到150，然后在这4个或5个字母之后的"-“，然后是空格，然后是"SK”或"PV“。我曾想过使用正则表达式，但后来我没有解决如何摆脱那些单一列的问

浏览 0提问于2015-07-14得票数 1

回答已采纳