Pandas在特定列中搜索字符串

Pandas是一个基于Python的数据分析库，它提供了丰富的数据结构和数据分析工具，可以方便地进行数据处理和分析。在Pandas中，可以使用特定的方法来在列中搜索字符串。

要在特定列中搜索字符串，可以使用Pandas的str.contains()方法。该方法可以接受一个字符串作为参数，然后在指定的列中搜索包含该字符串的值，并返回一个布尔值的Series，表示每个值是否包含该字符串。

下面是使用Pandas的str.contains()方法在特定列中搜索字符串的示例代码：

import pandas as pd

# 创建一个包含字符串的DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 在Name列中搜索包含字符串"li"的值
result = df['Name'].str.contains('li')

# 打印搜索结果
print(result)

运行以上代码，将会输出以下结果：

0     True
1    False
2     True
3    False
Name: Name, dtype: bool

上述结果表示在Name列中，第一行和第三行的值包含字符串"li"，而第二行和第四行的值不包含。

对于Pandas的str.contains()方法，可以通过设置参数来进行更灵活的搜索，例如忽略大小写、使用正则表达式等。具体的用法可以参考Pandas官方文档中的相关说明：Pandas官方文档 - 字符串方法。

在腾讯云的产品中，与数据分析和处理相关的产品有腾讯云数据万象（COS）、腾讯云数据湖（DLake）等。这些产品可以帮助用户在云端存储和处理大规模的数据，提供了丰富的数据处理和分析功能。具体的产品介绍和使用方法可以参考腾讯云官方文档中的相关内容。

存储多对多关系的最佳方式，以便将来快速查询

、、

我有一个数据框，我在其中对一个字段执行多个regex子字符串搜索，以确定此字符串属于哪个“家族”。这是一个相当昂贵的搜索，所以我想将结果保存在一个Pandas列中，以便更快地检索。Pandas有一个很好的isin()方法，用于确定单个检索到的项是否在给定的查询集中，但我不确定如何进行反向操作。下面是一个简单的单行示例： >>> from pandas import DataFrame >>> example = DataFrame({"text": "the quick brown fox jumps over the lazy d

浏览 0提问于2015-08-10得票数 0

5回答

在python pandas中搜索整行Dataframe的多个字符串值

、、、

在pandas数据帧中，我想逐行搜索多个字符串值。如果行包含字符串值，则该函数将添加/打印该行，并将其打印到df 1或0末尾的空列中。已经有多个教程介绍了如何选择与(部分)字符串匹配的Pandas DataFrame行。例如： import pandas as pd #create sample data data = {'model': ['Lisa', 'Lisa 2', 'Macintosh 128K', 'Macintosh 512K'], 'launched': [1

浏览 315提问于2018-06-14得票数 2

回答已采纳

1回答

在`pandas.read_csv`中，‘`str`’和‘`object`’数据类型有什么区别？

、、

根据，pandas.read_csv允许我为CSV文件中的列指定一个dtype。 d类型：列->类型的类型名称或dict，对于数据或列默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (引擎=‘python’不支持)。使用str或object来保存而不是解释dtype。若要将每一列视为文本数据，我可以使用 df = pandas.read_csv(... , dtype=str) 或 df = pandas.read_csv(..., dtype=object) 据我所知，这两种方法的行为总是完全相同的。这两种方法是否有不同行为的情况？如果是的话，

浏览 2提问于2016-05-17得票数 6

回答已采纳

1回答

pandas多个独立索引(非多个索引)

、

我在python中有几个大型的pandas data frames，我想通过添加index来提高join操作的速度。在向database table添加索引的类似代码行中。当搜索时，我看到的只是multi-index选项。它看起来就像数据库中的composite index/multi column index。我需要的是几个列上的独立索引(独立，因为这些列是不相关的)，这样联接就有希望更快地工作。在pandas中定义几个列作为独立索引是可能的吗？

浏览 17提问于2020-12-02得票数 1

3回答

在python pandas dataframe中将列数据从“姓氏，名字”改为“名字姓氏”

、、、、

我有python pandas dataframe，它由用于执行python脚本的power bi数据源转换支持，其中一列由lastname, firstname组成，我需要它由firstname lastname组成。我尝试了以下拆分、反转、连接方法，该方法适用于独立的字符串参数，但当我尝试对pandas数据帧中的列数据使用该方法时，会生成AttributeError: 'Series' object has no attribute 'split'。 name = 'LastName, FirstName' ' '.joi

浏览 62提问于2020-06-17得票数 2

回答已采纳

1回答

如何在数据帧中定位没有标题的行

、、

我注意到，在pandas数据帧中使用.loc时，它不仅找到我正在查找的数据行，还包括我正在搜索的数据帧的标题列名称。因此，当我尝试添加数据的.loc行时，它包含数据+列标题-我不想要任何列标题！ ##1st dataframe df_futures.head(1) date max min 19990101 2000 1900 ##2nd dataframe df_cash.head(1) date$ max$ min$ 1999101 50 40 ##if date is found in dataframe 2, I will collect the

浏览 0提问于2016-12-06得票数 0

1回答

用于' and‘和'or’子句的Pandas数据帧过滤器

、、、

我有一个pandas dataframe列，我需要根据需要执行' and‘搜索或' or’搜索。搜索条件元素在数组中可用，并且此搜索数组的长度在运行时期间可能不同。请参考下面的代码： import pandas as pd data = [['Adam Smith', 10], ['Dam Joshua', 15], ['Josh Willism', 14], ['Tim Robins', 14]] df = pd.DataFrame(data, columns = ['Name', &

浏览 6提问于2020-09-06得票数 1

回答已采纳

1回答

在列中解析字典时，字符串索引必须是整数。

、、

当我试图用充满字典类型的类型列拆分电影数据集(csv文件)时遇到了一些问题，例如{"id"：28，"name"："Action"}，{"id"：12，"name"："Adventure"}，.我想得到所有的“名字”值。我也搜索过这个，但不知道如何正确地修复它。有没有人有办法解决这个问题。 import pandas import numpy import json import matplotlib.pyplot data = pandas.read_csv('Downloads/tmdb

浏览 0提问于2018-09-24得票数 0

回答已采纳

1回答

如何在打开pandas数据帧中的文件内容时维护二进制值

、、

我有一个文本文件，它只是一个保存为csv的熊猫数据帧。以下是该文件的内容： combination_output,total_true,frequency,priori-probability 000,0,275,0.0 001,0,25,0.0 010,16,16,1.0 011,14,14,1.0 100,0,0,0 101,0,44,0.0 110,0,0,0 111,247,247,1.0 我的问题很简单:给定包含0或1的三个数字的组合输出，我在上面的文件中搜索这个组合，并返回先验概率(该文件的最后一列)。下面是我如何做的，给出了我应该在该文件中搜索的一个大的组合矩阵： #open t

浏览 9提问于2020-05-18得票数 0

回答已采纳

1回答

Python:如何获得大于n个字符的二维数组的字符串值？

、

s = (["id" "title" "name"] ["1" "show" "anna"] ["2" "hide" "joh"] ) 我需要得到长度超过2个字符的字符串值。预期产出： s = (["id" "title" "name"] [ "" "show" "anna"] [ ""

浏览 1提问于2022-06-19得票数 0

回答已采纳

2回答

熊猫，跳过xslx中的空列

、、

我试图查找一个.xlsx文件是否包含一个@。我使用过熊猫，它们工作得很好，除非excel表中的第一列为空，那么它就失败了。有什么想法吗?如何重写代码来处理/跳过空列？守则： df = pandas.read_excel(open(path,'rb'), sheetname=0) out = 'False' for col in df.columns: if df[col].str.contains('@').any(): out = 'True' break 这是我正在犯的错误：

浏览 7提问于2018-01-10得票数 2

回答已采纳

1回答

导致浮点数出现的Pandas.to_csv

、、

我已经创建了一个程序，它接收Excel表格，用Pandas修改它们，并将它们保存到CSV中。当我检查输出CSV时，这些列被看作是ints，但是当我将这些列上传到Oracle时，这些列就会浮动。输入excel中的某些列是诸如"3“"4”"1“之类的东西，但其他列包含货币值的实际浮动值。因此，我不能将数据转换为as_type(int)。 excel工作表的编号为数百张，每个月都有不同的列名。因此，as_type(int)的列式应用程序将无法工作。代码示例： import pandas as pd output_location = save_location + &#

浏览 2提问于2020-03-04得票数 0

回答已采纳

1回答

Pandas dataframe通过查找子串替换多列中的字符串

、

我有一个非常大的pandas数据框，包含字符串列和整数列。我想在整个数据框中搜索特定的子字符串，如果找到，则用其他字符串替换完整的字符串。我发现一些可以通过指定要搜索的列来做到这一点，如下所示： df = pd.DataFrame([[1,'A'], [2,'(B,D,E)'], [3,'C']],columns=['Question','Answer']) df.loc[df['Answer'].str.contains(','), 'Answer'] =

浏览 1提问于2017-10-08得票数 3

回答已采纳

1回答

Pandas -如何在返回行时排除空白单元格

、、、、

我刚刚开始使用python和pandas，我想搜索一个数据帧，并根据药物名称返回一行，返回所有非空的列单元格。我有这个： import pandas as pd safety = pd.read_excel("safety.xlsx") searchterm = input("Enter drug name...") print (safety.loc[safety['Drug_name'] == searchterm]) 这将返回药物和所有列，甚至是空白列。例如，每一行是一种药物，每一列是一个标准，每种药物可以有一些标准的信息，但不是所有

浏览 24提问于2021-04-24得票数 0

回答已采纳

1回答

pandas -在DataFrame中搜索字符

、

我有一个需要搜索分号的pandas DataFrame (df)。我第一次尝试使用 semicolon_check = df.to_string().__contains__(';')，但它非常慢，而且在DataFrames很大的情况下，我遇到了内存错误。然后，我尝试使用.str循环遍历列，但并非所有列都是字符串，因此每当我到达数值列时，都会收到一个错误 AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas 所以我最终得到了这段代码

浏览 7提问于2017-01-16得票数 3

回答已采纳

2回答

如何在excel文档中搜索特定的单词，并使用搜索结果生成新列？

、、、

所以我是python的新手，我正在尝试用python在excel工作表中搜索每一行中的"ICD“，并创建一个包含结果的新列，因此，如果一行包含单词"ICD”，则在新列中将出现单词"yes“，如果没有，则将出现单词"no”。到目前为止，我已经尝试了很多不同的方法，但我还是坚持了下来，因为我还是个新手。这是我到目前为止所拥有的。我甚至花了一段时间才找到一种导入excel文档本身的方法，现在我必须找到一种方法来添加新列，并搜索每一行并将结果放入。我知道我需要一个循环，我知道我需要一个if/else语句，但是我不知道把它们放在哪里或者放什么。我正在使用python 3

浏览 0提问于2019-07-05得票数 1

1回答

使用python在不刷新页面的情况下将HTML表导出到excel

、、、、

我有一个网页，用户可以在其中生成一个表，其中包含、no、和、no和输入列。现在我想使用将这个HTML 导出到一个excel文件中。在进行了一些googling搜索之后，我了解了to_excel片段，如下所示。 import pandas as pd # The webpage URL whose table we want to extract url = "https://www.geeksforgeeks.org/extended-operators-in-relational-algebra/" # Assign the table data to a Pand

浏览 4提问于2020-02-24得票数 0

1回答

熊猫栏浮成一串巨蟒

、、

例如，我创建了一个名为“order_num”的新列 import pandas import numpy as np import os df=pandas.read_excel(os.getcwd() + r"/excel.xlsx", sheet=0, skiprows=0,) df['order_num']=np.nan 我想把一些价值放在新创建的列上 df.set_value(index, 'order_num', 'somestr') 出现了错误信息 ValueError:无法将字符串转换为浮动：“somestr”

浏览 1提问于2017-11-07得票数 1

回答已采纳

3回答

在pandas.read_csv中，dtype和转换器有什么区别？

、、、、

熊猫函数read_csv()读取一个.csv文件。它的文档是根据文件，我们知道：类型:列->类型的类型名称或数据块，数据或列的默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (不支持引擎=‘python’) 和转换器: dict，默认不对某些列中的值进行转换的函数。键可以是整数或列标签。在使用此函数时，我可以调用pandas.read_csv('file',dtype=object)或pandas.read_csv('file',converters=object)。显然，转换器的名称可以表示数据类型

浏览 3提问于2015-12-07得票数 37

回答已采纳

1回答

如何使用字符串列表来使用Python 3搜索熊猫数据

、、、、

我试图用Python 3中的列表搜索Pandas数据，为了清晰起见，我在Windows机器上使用python3.8。我有一个excel文件，我正在寻找一个便笺列中的某些关键字，然后我希望程序返回另一个列，其中包含一个id号。目前，我的代码通过将excel数据放入熊猫数据中，然后使用str.contains检查一个字符串变量来实现这一点，但是我有多个关键字要搜索，我不知道该如何进行搜索。到目前为止，我的代码如下： import pandas as pd searchWord1 = 'Honda' searchWord2 = 'honda' searchWor

浏览 4提问于2021-06-22得票数 3

回答已采纳

1回答

re.search()可以跳过整数对象吗？

、、

问题是不言自明的。我在pandas数据帧中有一列，其中包含int和str对象。当我尝试用re.search()搜索它时，它不能运行，因为(我相信)有些列包含整数，它不知道该怎么做。有什么方法可以解决这个问题吗？我没有看到一个忽略错误的参数。

浏览 10提问于2019-02-22得票数 0

回答已采纳

1回答

Pandas:根据搜索多个行值返回多个列值

、、

假设我在Pandas中有一个数据帧： import pandas as pd import numpy as np df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(), 'B': 'one one two three two two one three'.split(), 'C': '0 1 2 3 4 5 6 7'.split(),

浏览 1提问于2021-05-12得票数 0

1回答

潘达斯如何存储时区信息？

、

时间戳列存储在UTC内部，无论它们是否有时区。这在docs：https://pandas.pydata.org/docs/user_指南/Timeeries.html#与时区一起工作中有说明。那么时区信息是如何在内部存储的呢？必须有某种“标记”，使该列包含带有tz=“America/New”或任何时区的tz=条目。上下文:我以一种不特定于Python的方式将数据写入磁盘，例如，我不使用pickle。当我检索数据时，我希望时区信息保持不变。

浏览 0提问于2022-05-25得票数 0

1回答

如何在pandas中连接多个列名？

我想在pandas中用逗号分隔所有列。但是，正如您所看到的，这是非常费力的任务，因为我手动键入了所有列索引。 de = data[3]+","+data[4]+","+data[5]+....+","+data[1511] 你有什么想法在python3中避免pandas中的上述过程吗？

浏览 32提问于2020-01-09得票数 0

2回答

为什么dropna在本专栏中似乎不起作用？

、、

我尝试删除一个列Filmname中的所有NA值，但是这些值没有被删除。为什么？(我的结果截图) 下面是我的代码： import pandas as pd df = read.csv.... df.dropna(subset=['Filmname'], inplace=True) df.head()

浏览 9提问于2018-06-15得票数 1

1回答

访问熊猫数据的正确方法

、、

我试图从pvlib访问的CEC数据库中访问/创建一个模块名称列表： import pandas as pd import pvlib as pv cecmod = pv.pvsystem.retrieve_sam('CECMod') 我想搜索模块名称的列表： matching = [s for s in dir(cecmod) if "Trina" in s] dir(cecmod)的角色困扰着我。我无意中发现了一种获取数据列标题(键？)列表的方法。但我觉得dir不应该被这样使用。为什么dir(pandas.DataFrame)返回这个列标题列表而不是一个列标

浏览 1提问于2018-01-20得票数 1

回答已采纳

2回答

如何替换pandas框架中的字符串值

在一个有4列的pandas框架中，我需要删除包含它们的Country列名称末尾的数字： Country Energy 56 Central African Republic 23 57 Chad 77 58 Chile 1613

浏览 17提问于2021-10-11得票数 0

1回答

如何通过Python在pandas DataFrame中使用正则表达式

、、、

我尝试在pandas列中只替换字符串的一个字符。具体地说，我想换掉。by -在"Date“列中下面是我的脚本： import pandas as pd number = {"date": [2002.04, 2002.05], "team": ["a", "b"]} number_pandas = pd.DataFrame(number) number_pandas number_pandas.date.replace(".", "-") 下面是输出： 0 2002.04 1

浏览 75提问于2021-02-05得票数 2

回答已采纳

3回答

将一行中的字符数计算为新列

、

我有一个pandas数据帧，它大约有100列，我想计算一行每列中的字符数。在Excel中，我会做类似(Len(Concat(A2:CA2))的事情 df['newcolumn'] = ? in Pandas Python

浏览 9提问于2019-07-10得票数 2

回答已采纳

2回答

当dtype为dtype('O')时，熊猫()失败

、、

我认为最近版本的更改会导致对idxmax()的调用失败--在这种情况下，它以前曾经工作过。我并不是说这是一种倒退，我只是想了解原因和发出的正确呼吁。 type(sss) <class 'pandas.core.series.Series'> sss.dtype dtype('O') type(sss.index) <class 'pandas.core.indexes.base.Index'> sss.index=Index([...strings.., dtype'object', length=112)

浏览 2提问于2018-04-10得票数 2

回答已采纳

1回答

是否有关于Pandas对象/类的完整文档的在线源代码(除了阅读其代码)？

今天，我在页面上寻找了很长一段时间，试图找到一些非常简单的东西:从DataFrame检索索引的属性或方法。它没有显示任何内容。我对页面进行了多次扫描，并对其进行了文本搜索。然后，当然，我来到了stackoverflow，并几乎立即得到了答案: DataFrame.index是属性。显然，在未来，我希望能够信任文档，而不是像今天一样浪费时间。所以我的问题是:有没有关于Pandas对象/类的完整文档的在线源代码(除了阅读它的代码之外)，并且没有省略任何属性/方法/等等？谢谢。

浏览 1提问于2015-10-22得票数 0

1回答

如何使用Pandas为基于多个列的搜索建立索引

、、、

我在索引用户输入以搜索多列时遇到了问题。以下是我的代码 Searched_Multicast_Row_Location = excel_data_df_Sheet_1[excel_data_df_Sheet_1['Zixi Multicast'] == Group.get()].index print(Searched_Multicast_Row_Location) 这很有效，但问题是，用户可能会输入不同列中的值，我也想对其进行索引。我尝试了以下几种方法 Searched_Multicast_Row_Location = excel_data_df_Sheet_1[excel

浏览 35提问于2020-08-22得票数 1

回答已采纳

1回答

Python数据帧匹配列表中的字符串

、、

我需要在dataframe列中搜索列表中的匹配字符串，并将匹配返回到dataframe中的新列中。下面的代码可以工作，但它的效率非常低，而且我的数据帧中有数百万行。 import pandas as pd Cars = {'MakeModel': ['HondaCivic','Toyota_Corolla','FordFocus','Audi--A4']} df = pd.DataFrame(data=Cars) mlist = ['Honda','Toyota','

浏览 6提问于2019-07-05得票数 1

回答已采纳

1回答

熊猫max()和min()工作，但mean()给出了“无数字类型”错误

、

我对以下Pandas代码有一些困难： groupby_obj = features.groupby('Feature') print groupby_obj["Value"].max() # This works print groupby_obj["Value"].min() # This works print groupby_obj["Value"].mean() #This doesn't work 第三行出现以下错误： DataError: No numeric types to aggregate 这看起来与的

浏览 2提问于2014-06-02得票数 1

回答已采纳

1回答

如何解决Pandas代码中的日期时间错误？

、

我有一个csv文件，其中有7列['Date', 'Time', 'Open', 'High', 'Low', 'Close', 'Volume']，问题是我试图设置一个datetime索引，但它可能不起作用，因为日期和时间是两个单独的列。以下是代码： import pandas as pd column_names = ['Date', 'Time', 'Open', 'High', 'Low',&#

浏览 2提问于2017-12-02得票数 0

回答已采纳

1回答

Pandas DataFrame:使用变量进行查询

、、

我正在使用两个变量处理一个DataFrame查询。第一个变量是列标签，第二个变量是值列表。我想要做的是选择该列包含在该列表中的值的所有行。奇怪的是，如果我将列标签写为字符串，则没有错误，而引用包含列标签的变量会产生以下错误： Traceback (most recent call last): File "C:\Python\Python36\lib\site-packages\pandas\indexes\base.py", line 2134, in get_loc return self._engine.get_loc(key) File "pan

浏览 10提问于2017-08-29得票数 0

回答已采纳

1回答

用read_excel转换dtype=str使用熊猫、蟒蛇的错误

、、

我正在使用python中的熊猫读取一个excel文件，它对一些文件有效，而对于另一些文件，它引发以下错误“无法将列描述转换为类型”，其中DESCRIPTION是excel的许多列之一。我看不出它对那些不起作用的强项有什么区别。当我在没有dtype=str的情况下阅读它时，它工作得很好，但我需要将它作为字符串读取。 df = pandas.read_excel(fileFullPath, dtype=str) 解决此错误的任何帮助都是有帮助的。

浏览 2提问于2019-05-14得票数 0

1回答

熊猫数据串接

、、

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

dataTables搜索栏返回不正确的结果

当使用搜索栏搜索产品时，我还会得到不包含输入字符串的结果。例如，输入" 70“显示以下结果: HeatMaster 120、HeatMaster 70、HeatMaster 85。这是因为包含这些数据的行有另一列数字，它也包含"70“(例如: 170)；在搜索时，我是否可以强迫这个插件只考虑一个指定的列？或者是这个插件？

浏览 1提问于2013-09-16得票数 0

1回答

使用regex匹配DF中的关键字

、

早上好，我正在和regex做一点斗争：场景:我已将excel文件加载到Pandas as DF中，以使我能够跨多个列搜索关键字。数据:列包括标题、范围、描述和审阅。有6个关键字我需要搜索。当前方法:在numpy包含str的情况下，我已经找到了匹配项，但这些都是其他字符串中的部分匹配。我只需要找到完整的单词。下面的工作，但正如我说过，也将识别字符串中的匹配，如“预订”或“培训”。我需要找到一种只找到“书”或“火车”的方法。 keywords = ['book','train','job'] df["NewValue"] = n

浏览 6提问于2022-07-26得票数 0

1回答

如何更改数据帧中整数的数字格式？

、

我已经将数据从CSV文件导入到dataframe中。其中一列是参考号，应该有六位数字。一些参考数字只有3、4或5位。在Excel中有没有类似的函数，比如this: =TEXT(A1,"000000") 我试着在互联网上搜索一些关于如何在pandas中使用格式和显示函数的文档，但我找不到我想要的答案。该问题的示例如下所示： Actual: 10158 Desired: 010158 Actual: 101 Desired: 010100

浏览 4提问于2019-06-11得票数 0

4回答

pandas:合并(连接)多列上的两个数据框

、、、

我正在尝试使用两个列连接两个pandas数据帧： new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') 但得到以下错误： pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)()

浏览 2提问于2017-01-24得票数 265

回答已采纳

1回答

属性错误:在Python中将hh:mm:ss转换为十进制

、、

解决方案更新:来自上面提供的链接的，下面是我得出的结果： import pandas as pd import numpy as np df = pd.read_csv('Book1.csv') df = df.set_index(pd.DatetimeIndex(df['Duration'])) idx = pd.DatetimeIndex(df['Duration']) df['Duration_Decimal'] = idx.hour + idx.minute / 60 文件的启动 import pandas as pd

浏览 0提问于2018-10-02得票数 0

1回答

在Excel中突出显示特定列中特定单词的代码

、、、、

我正在搜索excel代码，该代码在特定列中搜索特定关键字，并将其突出显示为黄色；并且能够对多个列执行此操作，每个列都有自己独特的关键字。示例：搜索列A以查找关键字"river“ 搜索B栏中的关键字“Search” 搜索列C以查找关键字"sea“ 每次，unique关键字仅在特定列中高亮显示，即使它也可能出现在其他列中。该守则将包括100列，从“A栏”到“简历栏”，并允许为每一栏插入一个独特的关键字。这个是可能的吗？在论坛中搜索时，我发现一些代码可以突出显示excel中的特定单词，但没有一个代码可以将搜索范围缩小到列，并将关键字排除在其他列之外。为

浏览 6提问于2017-04-14得票数 2

1回答

使用Pandas，我是否可以创建一个新列，根据一个值是否存在于多个列中来返回一个二进制变量？

、

目前，我有一个包含4列的dataframe，其中3列是二进制true/false，第一列是唯一标识符。有没有办法，使用pandas，我可以在这个数据框中添加一个额外的列，根据3个二进制列中的1个以上是否存在true (即1)值来返回true或false？我对学习CS、Python和pandas非常陌生，所以任何答案都会很有洞察力。谢谢!

浏览 15提问于2019-07-04得票数 0

1回答

使用Pandas搜索整个excel工作表中的单词

、、

我正在尝试用Pandas复制Python中的Find函数(control-f)。我想搜索整个工作表(所有行和列)，查看工作表上的任何单元格是否包含单词，然后打印出找到该单词的行。我也想在多张纸上做这件事。我已经导入了工作表： pdTestDataframe = pd.read_excel(TestFile, sheet_name="Sheet Name", keep_default_na= False, na_values=[""]) 并尝试创建一个列列表，我可以将其索引到所有单元格的值中，但它仍然排除了工作表中的许多单元格。尝试的代码如下所示。 colum

浏览 7提问于2018-08-02得票数 3

3回答

如何删除整个python dataframe列中的多余空白

、、

在一个dateframe(所有列)中删除所有多余的空白空间的pythonic方法是什么？我知道.str.strip()方法可以用于单列或每列。dataframe作为这样的许多列，我想将该方法应用于整个dataframe。空格发生在不同的点，文本的开头，中间和结尾。附件是在移除空格之前和之后的dataframe外观。下面的数据是预期的结果。我已经搜索过了，我遇到的大部分相关问题都是为了一个专栏。样本数据 import pandas as pd data = [[' James Brown ', '10', 'USA'], [

浏览 13提问于2022-01-19得票数 0

回答已采纳

1回答

如何使用pandas换行整个列的文本？

、、、

我想用pandas来包装一整列。我已经设置了列的宽度，现在我只需要将整个列换行，因为它们都在一行中。我搜索了不同的答案，但没有切中要害。我不需要编辑列的宽度，我只想在单元格中换行文本，这与我在单击"Wrap Text“时突出显示一列所做的事情相同。但是我想使用Python脚本来实现，因此我想使用pandas来实现。所以基本上和但我想通过pandas完成此操作，而不是手动单击wrap。我想要将换行应用到整个列，而不仅仅是那一个单元格。

浏览 0提问于2017-08-31得票数 7

回答已采纳

4回答

SQLite哪里-条款的每一栏？

、

SQLite提供了一种搜索索引键的方法吗？ SELECT * FROM table WHERE id LIKE ... 选择在列...中找到id的所有行。但是，如果找到了搜索字符串，而不是只在列id中搜索，我希望在每一列中搜索。我相信这是行不通的： SELECT * FROM table WHERE * LIKE ... 这有可能吗？或者下一个简单的方法是什么？我使用Python3查询SQLite数据库。在执行查询和返回数据之后，我是否应该选择搜索字典的路线？

浏览 7提问于2015-06-09得票数 2

回答已采纳

2回答

和两只熊猫一起工作，一对多的关系？

、、

我有两个DFs和一对多的映射，像这样.(目标是搜索所有含有X成分的药物) import pandas as pd medications = pd.DataFrame({ 'med_id': [1, 2], 'med_name': ['multivitamin', 'aspirin'], }) ingredients = pd.DataFrame({ 'med_

浏览 3提问于2022-04-09得票数 0