从pandas系列中提取pos_tag_sents

文章/答案/技术大牛

发布

1回答

python、pandas、nltk、part-of-speech

按照线程How to apply pos_tag_sents() to pandas dataframe efficiently的建议，我运行代码来为我的一个变量中的文本识别不同的位置。现在我已经成功地创建了感兴趣的列-sub‘’POS‘-我如何提取相关信息-所有NN -并为每个NN创建一列？

浏览 11提问于2019-09-18得票数 0

回答已采纳

2回答

Pandas系列:提取括号之间的文本，包括它们

python、series、text-extraction

当我从pandas系列中提取文本时，如何包含括号？ my_series.str.extract('\((.*)\)')

浏览 61提问于2020-12-18得票数 0

回答已采纳

1回答

加入熊猫数据中心中的元组列表

python、pandas、join、dataframe、lambda

我已经用join和lambda在dataframe中尝试了几种方法来实现这一点。import pandas as pd data = pd.DataFrame(data) taggedComments

浏览 7提问于2017-09-22得票数 2

回答已采纳

1回答

使用pandas系列从pandas DataFrame中提取值

python、pandas、dataframe、indexing

我有一个包含键-值对的pandas Series，其中键是我的pandas DataFrame中列的名称，值是DataFrame中该列的索引。例如：然后在我的DataFrame中：因此，从我的DataFrame中，我希望从'A‘的DataFrame中提取索引12处的值，即435.81。我想将所有这些值放入另一个序列中，所以类似于{ 'A'：435.81，&#

浏览 30提问于2017-08-15得票数 0

1回答

为什么.str方法改变了熊猫序列的形状？

python、pandas、dataframe

数据的类型 <class 'pandas.core.frame.DataFrame'> Inebola_melt['type_country'] In [3]: print(type(ebola_melt['str_split'])) <class 'pandas.core.series

浏览 0提问于2017-07-25得票数 0

3回答

如何有效地将pos_tag_sents()应用于熊猫数据处理

python、python-3.x、pandas、nltk、pos-tagger

在您希望POS标记存储在熊猫中的一列文本的情况下，每行使用1句，所以大多数实现都要使用apply方法。这是否适用于此示例，如果适用，代码是否会像将pso_tag更改为pos_tag_sents一样简单，还是意味着段落的文本源？正如评论中提到的那样，pos_tag_sents()的目标是减少每次使用时对分配器的负载，但问题是如何做到这一点，并且仍然在熊猫的dataframe?中生成一个列。

浏览 6提问于2017-01-16得票数 15

回答已采纳

1回答

如何从pandas系列中提取值

python、pandas

假设我有一个pandas序列对象，其中每个值都是一个列表。如何将此系列更改为具有[a,b,c,d,e,f]列的DataFrame0 [0.7142, 0.833334, 1.0, 1.0, 1.0, 1.0] 1 [0.7142, 0.273924

浏览 0提问于2020-05-11得票数 0

3回答

从Pandas DataFrame中提取系列对象

python、pandas、dataframe、time-series

我想把每个零件编号转换成单变量系列，以‘日历年/月’作为指数，或者‘销售’或‘库存’作为价值。我如何使用熊猫内置的函数来完成这个任务，而不是手动地遍历数据呢？

浏览 2提问于2016-09-29得票数 0

回答已采纳

2回答

pandas系列提取误差

python、pandas

我有一个熊猫系列(名为df)，格式如下： a GEOS 13100 g PHSC 12600 must be taken before PHSC 12620 我想从col1中提取所有课程

浏览 191提问于2017-03-09得票数 1

3回答

从Pandas系列中提取“url”值

python、pandas

我有一个Pandas DataFrame，其中有一个名为“image_versions2.candidates”的列：3 [{'width': 750, 'height': 498, 'url': 'https:/ZZZ'}] 我正在尝试将url<

浏览 4提问于2019-04-25得票数 0

回答已采纳

1回答

在pandas列中存储列表的最有效方法是什么？

pandas、dataframe、twitter

我已经从数据中提取了URL，目前已将其作为列表存储在pandas列中：其中的URL列是具有动态大小的pandas系列，以便我可以轻松处理？否则，在应用pandas操作和速度的同时，存储urls的最好方法是什么？

浏览 0提问于2019-03-05得票数 1

1回答

使用float64数据类型从Pandas系列中提取某些值

python、python-3.x、pandas

我有一个带有float64数据类型的Pandas系列，我想从该系列中提取某些值。示例，x=pd.Series([1.0, 1.4, 1.8, 2.0, 2.6, 3.0],copy=False) 我只想从上面的系列中提取"1.0、2.0和3.0“，如何实现？

浏览 4提问于2022-08-30得票数 0

回答已采纳

1回答

如何使用Pandas DataFrame替换lambda和分组以提高性能

python、pandas、performance、datetime、dataframe

也许我的问题看起来很复杂，但本质上很简单。我是Python的新手，现在我面临着代码太慢的问题。下面是代码的优化版本。我将非常感谢一个小的代码审查和关于如何加速它的建议。我认为最慢的操作是.apply(lambda和grouping，但我不知道如何替代它们。for raw_file in raw_files: for chunk in reader: for name, data in

浏览 2提问于2018-10-28得票数 0

1回答

如何在python中从超过40000的字典数据中绘制直方图？

python、matplotlib、histogram

我试着用字典中的数据绘制直方图。

浏览 0提问于2019-11-17得票数 0

1回答

Python从数组中删除括号

python、arrays、list、pandas、numpy

1.72158862]]), array([[3.28004542]]),将其放入dataframe中：

浏览 529提问于2018-07-04得票数 2

1回答

当与Python中的Pandas系列完全匹配时，从dataframe获取行的id

python、pandas、dataframe

我有一个和一个单独的Pandas系列(实际上保留了一个行的值)，它们与该dataframe中的一个行匹配。我想要找到的数据序列的形状是(700,60)，而我想要找到完全匹配的Pandas系列的形状是(60,0)，在从另一个数据帧中提取它之后，无法将其转换为(0,60)。那么，当一行的值与Pandas系列的值相同时，是否有另一种方法来编写条件，从dataframe获取行的id？

浏览 3提问于2021-04-29得票数 0

回答已采纳

2回答

如何从Pandas系列行中提取元素

python-3.x、pandas、loops、series

我试图循环并从序列/列的每一行中提取最后两个元素(字母，例如QC或ON)。我认为每一行的内容都是一个字符串，而不是浮点数。不管怎样，我做错了什么？

浏览 7提问于2021-03-07得票数 0

1回答

Pandas系列中值的返回指数

python、pandas

我正在尝试转换单位内的潘达斯系列。 1 5'2"该代码适用于5'7"，但不适用于5'10" 我如何从x[2:]转换成在'之前提取所有内容的东西？在过去，我使用过像index(

浏览 1提问于2019-09-30得票数 0

回答已采纳

1回答

用两个字段对Dask数据进行排序

python、python-3.x、pandas、dask

在本例中，我试图使用从balance字段提取的balance和year两列对dataframe进行排序。我试图将余额作为字符串连接到一个新字段中，而将年份作为字符串连接到一个新字段中，但是得到了一个错误： 'id': [1, 1, 1, 2, 2],2021,2,7), datetime(2021,7,1),}) ddf =

浏览 2提问于2021-06-24得票数 0

回答已采纳

1回答

如何将对象的类型从"pandas.core.groupby.generic.SeriesGroupBy“转换为"pandas.core.series.Series"？

python-3.x、pandas、dataframe、pandas-groupby、series

我有一个"pandas.core.groupby.generic.SeriesGroupBy“类型的变量，它是通过对pandas数据帧的各个字段进行分组而获得的。但是，我想把这个变量转换成一个pandas序列，它是有效的，但有很多错误。我得到一个熊猫系列，如下所示： ? 但是，我期待的是类似这样的东西： ? 是否有其他方法可以将DataFrame的以下列分组并将其存储在pandas Series中： ?

浏览 155提问于2020-04-17得票数 1

回答已采纳

点击加载更多