Pandas NLTK -标记列中的所有行以进行自然语言处理_使用随机字符串值更新列中的所有行以进行测试_如何将行值与不同列中的所有行进行比较，并使用Pandas分隔匹配的所有行 - 腾讯云开发者社区

、、、

==Using Juypter Notebooks== 我让NLTK处理单个文本字符串。 Text= 'Hey.，因为我希望在数据框中的许多行上自动执行此操作。基本上，在维护索引键的同时对单词进行标记化，这样我就可以在新字段中重新组合我想要的标记。例如，我正在查找人名，特别是包含超过1,000行的excel列。当我在数据帧上尝试时，这就是我遇到

浏览 10提问于2020-05-02得票数 0

1回答

用空间NLTK标记词

、、

在自然语言处理中，用单词而不是句子来标记行的代码是什么？text=" Hi how are you, how is live, what are you doing " from nltk.tokenize import sent_tokenize

浏览 0提问于2019-12-09得票数 1

回答已采纳

2回答

为什么我要用nltk标记问题，好处是什么？

、

我最近刚刚开始使用NLTK；我发现了标签功能，但我在网上查找，没有找到解决这个问题的答案。为什么我要标记一个字符串？好处是什么？标记到底有什么作用呢？

浏览 2提问于2018-09-13得票数 0

2回答

nltk :根据POS用其他词替换令牌

、

我的工作是自然语言处理和需要预处理的一些数据.我的数据在文本文件中，我必须读取数据并将所有名称更改为男性或女性。在读取数据并对其进行标记之后，我应用pos标记并使用有名称列表的文件进行检查，并将名称更改为“男性”或“女性”。： text = open('collegegirl.txt').read()

浏览 1提问于2018-06-12得票数 0

回答已采纳

1回答

在Python上使用NLTK创建自己的命名实体

、、、

我正在使用一本名为“用Python Cookbook进行自然语言处理”的书来学习NLTK。以下是代码，但根本没有任何解释。grammar = r"NAMED-ENTITY: {<NNP>+}" "Microsoft(s) # ch

浏览 19提问于2020-08-08得票数 1

1回答

将文本拆分成句子

、、、

我还需要处理缩写。然而，我的计划是在更早的阶段替换它们。谢谢，巴里编辑:首先，我很乐意满足上面包含的四个测试。这将帮助我更好地理解正则表达式是如何工作的。现在，我可以按照测试中的定义将句子定义为X.等。

浏览 1提问于2011-08-25得票数 5

回答已采纳

3回答

一个像Matlab这样的NLP工具？

、

Matlab是数学实验、神经网络、图像处理的重要工具。我想知道是否有这样一个全面和强大的工具来处理数据和NLP任务？例如标记化，词性标注，解析，培训，测试.

浏览 0提问于2014-09-26得票数 2

1回答

无法对整列进行定位

、、

我想从CSV文件中标记数据。我正在使用这段代码，我无法标记整个列。我只能标记列中的第一行。这一栏被称为“推特”。import pandas as pdfrom nltk import word_tokenize data=pd.read_csv('/Users/yoshithKotla/Desktop/dingdang&#

浏览 4提问于2021-04-12得票数 1

回答已采纳

2回答

Python -不带标点符号的字符串到列表中

、

我有一个包含句子的文件，我需要创建一个函数，将句子拆分成一个列表，将单词作为元素，但删除所有标点符号。这就是我所拥有的：它很接近工作，但有一个连字符的单词，它只是被放在一起作为一个单词，我需要它拆分。还有，像1,2这样的十进制数字会像这样被分割成"1"，"2“，我不想这样。有没有更好的方法来解决这个问题？也许是一个更简单的解决方案？

浏览 39提问于2021-03-13得票数 1

1回答

用斯坦福解析器在python中用nltk解析句子

、、、、

我正在使用python中的一个项目，在该项目中，我需要解析句子以进行比较，并找到句子之间的相似性。我看过如何用java中的斯坦福解析器来解析句子，在python中也是一样，我已经下载了python的nltk，我对python和自然语言处理都很陌生。提前谢谢。

浏览 3提问于2014-07-02得票数 0

回答已采纳

4回答

PunktSentenceTokenizer在NLTK中的应用

、、

我正在学习自然语言处理使用NLTK。我偶然发现了使用PunktSentenceTokenizer的代码，它的实际使用在给定的代码中无法理解。该守则是：from nltk.corpus import state_union tagged = nltk.pos

浏览 7提问于2016-02-08得票数 43

回答已采纳

1回答

在Pandas中，有没有比这段代码更快的删除停用词和标点符号的方法呢？

、、

我使用的代码似乎太慢了，也许还有其他选择。import pandas as pdimport stringnltk.dow

浏览 1提问于2019-04-13得票数 2

1回答

目前，我正在对csv文件中的一个单词进行词素化处理，之后，我以小写字母传递所有单词，删除所有标点符号，并拆分列。我只使用两个CSV列：analyze.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 4637 entries, 0 to 4636.\SA_working\venv\lib\site-packages\nltk</em

浏览 2提问于2020-10-21得票数 0

回答已采纳

1回答

将句子中的每个单词替换为同义词的Python程序

基本上，我想要做的是创建一个程序，它接受一个句子/段落作为用户输入，查找每个单词的同义词，并将该单词替换为该同义词。到目前为止，我为此创建的程序运行得很好，但也有一些问题/人为错误/逻辑错误。基本上，我把它归结为4个基本问题：2)输入了错误的词义，或者返回了在用户输入上下文中没有意义的词义；4)当输入一个名词时，返回该单词的动词，反之亦然(即“

浏览 2提问于2016-07-18得票数 0

2回答

文本中单词分类的可用选项？

、

我正在研究如何在文本中对单词进行分类，我想知道有哪些选择，哪些最适合这项工作。我最感兴趣的是关键字，这些关键字通常是名词。接下来，我试着建立一个黑名单来匹配所有的东西，除了已知的停止词，动词等等。然而，要建立一个足够大的清单来处理已知的</em

浏览 0提问于2012-02-13得票数 3

回答已采纳

1回答

俄语自然语言处理

、

我正在寻找能处理自然俄语的图书馆(Es)或服务(S)：识别和提取单词的组合：“=>”Онистроилижелезнуюдорогу

浏览 0提问于2018-09-01得票数 1

1回答

如何在python中将文本块标记为一个令牌？

、、、

在以前关于自然语言处理的工作中，我使用了来自nltk的sent_tokenize和word_tokenize来标记句子和单词。但是当我在基因组数据集上使用这些功能时，它不能正确地标记基因组。，每一行文本(例如tattattatacacaatcccggggcgttctatatagttatgtataatgtat )都会成为一个不正确的标记。一个序列块应该被看作是一个标记。这里的

浏览 10提问于2022-11-30得票数 3

回答已采纳

1回答

Python中的可视化和聚类

、、

我想基于自然语言处理算法(tf-idf)对评论进行分类。我设法对这些集群进行了分类，但我想以图形的方式将它们可视化(直方图、散点图……)from nltk import word_tokenizefrom pprint import pprintimport p

浏览 23提问于2019-08-19得票数 1

回答已采纳

2回答

天文文本处理(NLP)从何处开始

、、

我是Devnagaric NLP的新手，有没有任何小组或资源可以帮助我开始使用Devnagaric语言(主要是尼泊尔语或类似的印地语)的NLP。我希望能够为天成字开发字体，也可以做一些字体处理应用程序。如果任何人(在这个领域工作)，可以给我一些建议，然后将非常感谢。提前感谢

浏览 4提问于2017-02-15得票数 1

1回答

XMLCorpusReader没有创建一个语料库

、、

我正在用python的nltk学习自然语言处理。我想从我目录中的XML文件创建一个语料库。所以我使用了下面的代码。>> from nltk.corpus import XMLCorpusReader>> wiki = XMLCorpusReader(corpus_root ,'o

浏览 2提问于2013-07-29得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云