腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
python
中
的
word
tokenize
函数
删除
列表
中
的
编号
?
我
正在
获得
输出
,
但我
需要
不带
数字
的
输出
python
、
pandas
、
csv
、
nltk
我
不
需要
列表
编号
(即) 0,1等。
我
需要
打印没有
编号
的
元素 import pandas as pd import csv #mystr=str(
浏览 24
提问于2020-05-01
得票数 0
回答已采纳
3
回答
用NLTK标记阿拉伯语单词
python
、
tokenize
、
nltk
我
正在
使用
NLTK
word
_tokenizer将一个句子拆分成单词。
我
想标记这句话:
我
写
的
代码是كل شي لما تحتاجه يضيع ...ادور على شاحن فجأة يختفي ..لدرجة اني اسوي نفسي ادور شيء" wordsArr
浏览 13
提问于2012-10-23
得票数 23
回答已采纳
1
回答
为什么
我
在句子中
使用
NLTK引词器时会得到TypeError:不可理解
的
类型?
python
、
nltk
、
lemmatization
我
目前
正在
处理一个句子
的
柠檬化,同时也应用pos_tags。到目前为止,这就是
我
所拥有的from nltk.
tokenize
import
word
_
tokenize
from_morphy(
word
, pos) File "/Library/Frameworks/
Python
.framework
浏览 3
提问于2020-02-19
得票数 0
回答已采纳
4
回答
如何
按字母从
列表
中
删除
多个字符串?
python
、
python-3.x
我
正在
尝试从
不带
字母"a“
的
列表
中
删除
多个字符串。
我
尝试
使用
一个
函数
来
删除
列表
中
不带
字母"a“
的
每个单词 myList = ['advertisement', 'start', 'clever', 'billowy', '
浏览 37
提问于2019-04-07
得票数 1
回答已采纳
3
回答
打印带有移除形容词
的
pos标记(NLTK)
python
、
nltk
、
pos-tagger
genexpr> at 0x000000000E000D00> 如果
使用
[]圆形打印,我会得到“无效语法”
浏览 0
提问于2018-02-19
得票数 0
回答已采纳
2
回答
如何
从
Python
的
bi /tri
输出
中
删除
特殊字符(“()”、"'“、”")
python
、
nltk
、
special-characters
我
编写了一个代码,它
使用
NLTK从文本输入计算bigram / trigram频率。这里
我
面临
的
问题是,由于
输出
是以
Python
列表
的
形式
获得
的
,所以
输出
包含特定于
列表
的
字符,即(“()”、"'“、”")。
我
计划将其导出到csv文件
中
,因此
我
希望在代码级别上
删除<
浏览 0
提问于2018-08-30
得票数 3
回答已采纳
1
回答
使用
计数器对
列表
元素进行计数
python
、
nltk
、
counter
我
是
python
和编程
的
新手,
需要
你
的
帮助。
我
正在
尝试
使用
nltk.
word
_
tokenize
和Counter计算文本中最常见
的
单词。当我
获得
所有文本元素
的
列表
并想要计算所有元素时,Counter只计算字母。代码如下: from nltk.
tokenize
import
word
_
tokenize</
浏览 15
提问于2019-09-30
得票数 1
回答已采纳
1
回答
将isalpha应用于
列表
python-3.x
、
function
、
text
、
nlp
我
是
python
的
新手。
我
有一个NLP项目,
需要
从
我
的
关键字
删除
频率。
我
在
列表
中
的
一行上成功地做到了这一点。因此输入: tokens= 'fibre','16',';','quoi','1',';','dangers','1'
浏览 15
提问于2020-04-10
得票数 0
1
回答
如何
用
Python
将句子
列表
写入文本文件
python
、
string
、
list
、
type-conversion
我
想问一下
如何
将一组句子打印到文本文件
中
。
我
尝试
使用
write()
函数
导出如下所示
的
输出
,但无法
获得
类似于
python
中
的
输出
。import osfrom nltk.
tokenize
import
word
_
tokenize
, sent_
tokenize
from n
浏览 3
提问于2016-12-15
得票数 2
回答已采纳
4
回答
如何
在
Python
3
中
获取
列表
中
列表
的
编号
?
python
、
python-3.x
、
list
我
正在
尝试获取包含特定
编号
的
嵌套
列表
的
编号
。这是
我
的
代码:for x in listo: print(len(x))
我
在这里尝试获取
的
是嵌套
列表
中
包含3
的
编号
。
我
的
代码返回3,因为
我</em
浏览 50
提问于2018-06-18
得票数 2
回答已采纳
1
回答
如何
在没有预先定义
的
多词
列表
的
句子
中
识别多词表达
python
、
nlp
我
正在
尝试识别一个句子
中
的
每个多词表达式,并对该句子进行标记化。例如,示例输入句子是“简而言之,此商品供不应求”。
我
希望
输出
可以如下所示: ['In short', ',', 'this', 'merchandise', 'is', 'in short supply', '.']
我
已经通过
使用
预定义
的</e
浏览 25
提问于2021-03-13
得票数 0
1
回答
为什么
输出
不打印
列表
?
python
、
python-3.x
、
nltk
我
正在
使用
Python
中
的
nltk库;
我
的
背景是Java。
我
不理解
我
编写
的
代码
的
控制台
输出
。为什么
Python
会返回一个奇怪
的
表单,尽管我将变量tokens初始化为list。from nltk.
tokenize
import
word
_
tokenize
from nltk.c
浏览 2
提问于2017-05-04
得票数 0
回答已采纳
11
回答
如何
使用
NLTK标记器消除标点符号?
python
、
nlp
、
tokenize
、
nltk
我
刚刚开始
使用
NLTK,
我
不太明白
如何
从文本
中
获取单词
列表
。如果
我
使用
nltk.
word
_
tokenize
(),我会得到一个单词和标点符号
的
列表
。相反,
我
只
需要
文字。
我
怎样才能摆脱标点符号?此外,
word
_
tokenize
不能处理多个句子:在最后一个单词上添加圆点。
浏览 0
提问于2013-03-21
得票数 138
1
回答
R-通过网格解析
Python
树
python
、
r
、
parsing
、
nltk
、
reticulate
我
正在
尝试
使用
Python
的
NLTK包,在R中
使用
Retic所得包。在很大程度上,
我
是成功
的
。 现在,
我
希望执行命名实体识别(即确定哪些令牌表示命名实体以及它们代表
的
命名实体
的
类型)。
使用
NLTK
的
ne_chunk()
函数
。
我
的
问题是,
函数
返回类nltk.tree.Tree
的
浏览 1
提问于2018-01-31
得票数 2
回答已采纳
1
回答
在
列表
中
连接由标记分隔
的
单词
python
、
list
、
loops
、
set
、
concatenation
我
想在单词
列表
中
连接一个用星号分隔
的
单词。
我
尝试
的
代码是:from nltk.
tokenize
import
word
_
tokenize
with open ('
浏览 0
提问于2019-03-17
得票数 0
2
回答
我
怎样才能拿几段文字,看看是否有一个代词,并选择所有这些句子,以形成一个新
的
段落?
python
、
nltk
我
应该
使用
NLTK或正则表达式来拆分它吗? 这是一个更大项目的一部分,
我
是
Python
新手。你能告诉
我
有什么有用
的
代码吗?
浏览 5
提问于2013-03-17
得票数 0
回答已采纳
1
回答
使用
spaCy从
列表
数据
中
删除
停止词
python
、
nlp
、
spacy
我
想在令牌化之后
使用
spaCy
删除
停止词。但是,给我一个错误,错误是AttributeError: 'str' object has no attribute 'is_stop',
我
想要做
的
数据是在标记过程之后
的
数据,这个列名为“令牌化”--
如何
修复它]df['text'] = df['text'].s
浏览 12
提问于2021-11-28
得票数 2
回答已采纳
3
回答
访问元组
列表
中元组
的
第一个元素
的
范围。
python
、
tuples
这里有点像
python
/编程新手。from nltk.
tokenize
import
word
_
tokenize
浏览 3
提问于2014-01-29
得票数 0
回答已采纳
1
回答
如何
使用
line_
tokenize
或
word
_
tokenize
使用
nltk来分隔新行?
python
、
python-3.x
、
nltk
尝试
使用
word
_
tokenize
和sent_
tokenize
标记带有新行
的
段落,但它无法识别新行。para="the new line \n new char"print(sen
浏览 12
提问于2018-02-05
得票数 1
回答已采纳
2
回答
Python
不从字符串
中
移除Char
python
Iv多次尝试从字符串
中
删除
额外
的
标点符号。= sentence.lower() self.tokenList.append(
word
)
浏览 1
提问于2015-01-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
实用Python文本预处理代码
Python文本预处理:步骤、使用工具及示例
自己动手实现scikit库中的fit和transform方法
自动文本摘要
Python NLP入门教程
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券