从pandas df中的列中提取某些单词_如何从pandas df中的x列中提取值，其中y列在df ==列表中(I)_提取Pandas DF中特定年份的行 - 腾讯云开发者社区

python、python-3.x、pandas、dataframe

我有一个pandas df，其中一列是消息，有一个字符串，数据如下： df‘’message‘ 2020-09-23T22:38:34-04:00 mpp-xyz-010101-10-103.vvv0x.netua=funny-SDK-4.11.2.34441.fdc6567fW jc=10 no-rtp=0 cid=2164444 relog=0 vxdi=0 vxdo=0 vxdr=0\n 因此，我希望从数据中提取我正在用下面的代码做这件事，并认为它在拆分后的位置7

浏览 13提问于2020-09-24得票数 0

回答已采纳

2回答

从单词列表中提取所有匹配的关键字，并创建一个新的数据熊猫

python、regex、pandas、dataframe

我想从意见列中提取所有匹配的关键字，如果它们与关键字列表中的单词匹配，那么在新列中打印所有匹配的单词(包括重复单词)。当前代码只提取第一个匹配的单词，不包含重复的单词。import pandas as pd 'opi

浏览 8提问于2020-11-07得票数 1

回答已采纳

1回答

将单词(仅为字母)和包含数字的单词提取到单独的数据栏中。

python、pandas、dataframe

我试图将只包含字母的单词提取到新的列中，任何包含数字的单词都提取到不同的列中。我在这里看到了一些答案，但这并不完全是我所需要的。最小可重现性示例：import pandas as pd data = ["Nike

浏览 10提问于2022-11-18得票数 0

回答已采纳

1回答

如何通过设置操作从一个列中提取多个子字符串？

python、string、pandas、dataframe、set

我尝试使用set操作从列中提取子字符串。但我是，不能提取多个单词(多个字符串)。我只能提取一个单词。请检查我的获得的输出和预期的输出，并为此提供一个有效的解决方案。import pandas as pd df=pd.DataFrame({"Names":["This is Santhosh&q

浏览 3提问于2019-09-21得票数 1

回答已采纳

1回答

检查某个Excel列中的单词是否可以在另一个Excel列中找到

python、pandas、dataframe、jupyter-notebook

我有两个Excel列，我的目的是搜索ColumnNames中的每一行，以及ColumnWords中是否有匹配的单词。从ColumnNames中的适用行中删除文本，并将其余字符/单词返回到另一列中。所以我应该得到的结果是

浏览 0提问于2021-10-18得票数 0

2回答

如何找到匹配的单词，没有子字符串使用熊猫str.extractall？

python、pandas、dataframe、join、text

我正在使用dataframe中的一列字符串，并试图提取与给定单词列表中的任何单词匹配的所有单词。它提取了所有匹配的单词和子字符串，我怎么能只得到单词？非常感谢！我的代码： cl =['dust', 'yes inr', '

浏览 3提问于2022-02-17得票数 1

回答已采纳

1回答

具有给定术语的文档的PySpark HashingTF计数

dataframe、pyspark、tf-idf

我有一个spark数据框，其中的" text“列有一些文本。我想要计算出现各种单词的行数-本质上是出现“术语”的“文档”的数量-以及相关的计数，如最频繁的单词，具有最频繁单词的行(或称为文档)。我正在使用来自pyspark.ml.feature的HashingTF。但是似乎找不到一种有效的方法来从输出中提取这些信息。# As an ex

浏览 25提问于2021-08-31得票数 0

回答已采纳

2回答

基于关键字的CSV文本读/写新文件

python、python-3.x、pandas

我试图提取某些单词，我定义为关键字，方法是在一个文件中读取一个列，并使用这些单词创建一个新列(如果存在).到目前为止，我已经： df = pd.read_csv我找到了这个线程()

浏览 0提问于2018-06-28得票数 1

2回答

删除基于pandas数据帧行的条件

python-2.7、pandas、dataframe

我的pandas dataframe有一个列，其中每一行都是一个对应于一个文件名的字符串。我从JSON文件中读取数据并提取列，如下所示：df2 = df.set_index("subject") for key,

浏览 11提问于2017-08-23得票数 2

回答已采纳

1回答

某些列的pandas DataFrame中值

python、pandas、median

试图弄清楚如何计算pandas DataFrame中某些列的中位数。例如，假设我有一个7列200行的DataFrame，我想提取索引1-3 (包括)的列中包含的数字，并计算所有行的总和的中位数；对于3行，它将是(x+y+z) + (x+y+z) + (x+y+z)的中位数我试过了： df["media

浏览 22提问于2020-07-06得票数 1

2回答

从dataframe的列中获取特定文本

python、pandas、dataframe、merge

我有一个数据集，我有一个数据“标题”列与汽车品牌和配件的信息。我想要两个新的列dataframe‘品牌’和dataframe‘模型’，在那里，我想得到品牌名称的车辆和车型。想要品牌-->通用的和型号的--> NaN --如果记录是第二项--> Blaupunkt科伦坡130 BT。我试过的：-for i in vehicle_make: for j in range(len(df</

浏览 5提问于2022-08-30得票数 1

回答已采纳

2回答

从数据框架中的列表中移除句子中的停止词和衬垫语句

python、pandas、dataframe

是否有一种简单的方法可以从dataframe列的列表中的句子中删除某些(停止)单词，如果它们的长度小于最大长度，则(右)删除它们吗？示例：df = pd.DataFrame(data={'sentence&#

浏览 25提问于2022-02-10得票数 0

回答已采纳

1回答

在Python中从csv中提取关键字

python、pandas、csv、extract、keyword

我有一个逗号分隔的csv文件，它有三列：我正在尝试提取列URL中包含特定关键字的特定行，例如单词charger。import pandas as pd df = pd.read_csv("original_file.csv", sep=&

浏览 2提问于2018-02-13得票数 0

回答已采纳

3回答

如何通过字符串过滤pandas数据帧？

python、regex、pandas、filter

我有一个pandas数据框架，我想按列中的特定单词(test)进行过滤。我试过了：但是它返回一个空的dataframe，其中只包含列名。对于输出，我正在寻找一个数据帧，它将包含所有包含单词“test”的行。我能做什么?编辑(添加样本)：数据有5个cols，包括牙科

浏览 2提问于2017-12-29得票数 5

回答已采纳

1回答

当与Python中的Pandas系列完全匹配时，从dataframe获取行的id

python、pandas、dataframe

我有一个和一个单独的Pandas系列(实际上保留了一个行的值)，它们与该dataframe中的一个行匹配。我已经看到很多人在某些列值匹配时找到行I，例如但是，我需要在行的所有列</em

浏览 3提问于2021-04-29得票数 0

回答已采纳

1回答

熊猫-在同一栏中用于不同物体的兰博达

python、object、lambda、isnull

对于这个数据文件：df=pd.DataFrame([[2],['do-g'],['ra-t'],['ca-t'],[5]], columns=['A'])对于列中的值，'A‘被视为'int’值。如何添加一个新列(从'A‘列派生)，从单词<

浏览 4提问于2020-11-15得票数 0

回答已采纳

1回答

使用.isna().all()时出现不明确的值错误

python、pandas

我已经编写了一些代码来从pandas数据帧中提取空列的列表。该代码从一个目录中提取所有的excel文件，并遍历每个文件，并为每个文件创建一个单独的空列列表。但是，对于某些表，我得到的结果是： ValueError:序列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()。我无论如何也弄不明白为什么只在某些桌子上会发生这种情况。没有重复

浏览 0提问于2021-02-26得票数 0

1回答

从a中提取x坐标，将其放入新列？

python、pandas、extraction、geopandas

我有这个列，我想在一个新列中提取x坐标。问题是它包含单词point。 POINT (270606.3947049045 4277995.041739198)如下所示：df

浏览 2提问于2018-06-13得票数 0

1回答

如何读取csv文件，其中一些值包含逗号的熊猫？

python、csv、pandas

我已经搜索了一些方法，如何读取值包含逗号的csv文件，但我从未见过只有熊猫才能成功读取它的方法。我已经尝试过了：但它会返回 CParserError: Error tokeni

浏览 5提问于2016-05-03得票数 1

3回答

基于字符串创建新列

python、string、pandas、numpy、substring

我有一个数据框，想要基于column1_sport中的字符串创建一个列。import pandas as pd baseballtennisgolf 我希望查找某些字符串("ball“

浏览 23提问于2019-01-11得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云