腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(762)
视频
沙龙
1
回答
在python中查找字符串中的类似文本
python
、
string
我有一个包含文本的txt文件 序言1将文本标记为句子8用正则表达式标记句子. 12 input = "Tokenzing sentence using expressions"那么,获得输出的最佳方法是什么?
浏览 4
提问于2017-05-28
得票数 1
回答已采纳
1
回答
如何使POS n-g更有效?
python
、
nlp
、
svm
我使用支持向量机进行文本分类,使用POS n-图作为特征.但我只花了两个小时就完成了POS。我有5000条短信,每一篇有300个字。这是我的代码: '''Calculate POS n-grams and return a dictionary''' text_tags = nltk.pos_tag(text) output = {} for item in text_tags
浏览 5
提问于2014-10-17
得票数 1
回答已采纳
1
回答
如何找出在Pandas中使用哪种编码
python
、
pandas
C error: Expected 1 fields in line 9, saw 4 error:
浏览 22
提问于2022-03-22
得票数 2
1
回答
使用spaCy从列表数据中删除停止词
python
、
nlp
、
spacy
pergi dari sini',df = pd.DataFrame({'text': data})df.head() return [token.text for token in nlp(word)] retu
浏览 12
提问于2021-11-28
得票数 2
回答已采纳
1
回答
如何从外部文件向JComboBox添加项?
java
、
file-io
、
io
、
text-processing
、
jcombobox
StringTokenizer st = new StringTokenizer(str_Data); //
Tokenizing
the line.
浏览 0
提问于2011-03-06
得票数 0
回答已采纳
1
回答
R中的主题建模:基于预先定义的术语列表构建主题
r
、
tm
、
topic-modeling
我花了几天时间研究R中的主题模型,我想知道我是否可以做以下工作:terms=read.delim("TermList.csv", header=F, stringsAsFactor=F) tdm=TermDocumentMatrix(data.corpus, control=list
浏览 1
提问于2015-02-04
得票数 4
回答已采纳
1
回答
如何跳过熊猫的几行
python
、
csv
、
pandas
我在看csv得到这个错误:所以我说:现在我要说: df = pd.read_csv('items_sch_1.csv',skiprows=[196,203]) Err
浏览 0
提问于2016-02-18
得票数 2
回答已采纳
1
回答
strtok_r在标记化后返回不正确的数据
c++
、
c
、
c-strings
、
strtok
[MAX_BUFFER]; LOG3(INF,"#ONLINEREQ Before
tokenizing
pRemainString);LOG3(INF,"#ONLINEREQ After
tokenizing
Margin|Fwd
浏览 1
提问于2020-05-19
得票数 0
回答已采纳
3
回答
解析C字符串
c
、
gps
我对C很不熟悉。一个逗号分隔的字符串出现了,我需要把它解开。一些比特对应于数值,其他比特对应于字等。char str_in; 输出float lat, lon, time; lat = 60+(1/60)*16.3245; //Conversion to decimal degrees所
浏览 1
提问于2011-04-08
得票数 0
回答已采纳
1
回答
在r中使用tm包查找关键短语
r
、
data-mining
、
text-mining
、
tm
, removeWords, stopwords(“english”))a<-tm_map(a, stripWhitespace)
tokenizing
.phrases
浏览 1
提问于2015-07-15
得票数 3
1
回答
为elasticsearch索引实现LSA
java
、
stanford-nlp
、
elasticsearch-plugin
、
elasticsearch-5
、
lsa
在过去的几天里,我一直在为elasticsearch中索引的文档实现潜在语义分析。第一步是构建term-document matrix.So,我想使用斯坦福nlp库,它将索引作为输入,意思是降低消减,删除停用词,可能是词干并生成矩阵,或者只是可以使用elasticsearch java api来构建它?
浏览 3
提问于2017-05-19
得票数 2
3
回答
如何从字符串中删除重复的单词,并只显示一次其单词计数
c++
、
c-strings
#include <conio.h>using namespace std; void xyz(char*);{ xyz(pa);}cin.getline(pa, 1000, '#'); } void
浏览 30
提问于2021-01-05
得票数 0
回答已采纳
1
回答
在pandas中读取csv文件时出现数据标记化错误时如何跳过文件
python-3.x
、
pandas
、
csv
当我尝试读取csv文件时,我得到一个错误pandas.errors.ParserError: Error
tokenizing
data.except pd.errors.EmptyDataError: continue 如果在读取csv文件时出现此错误(pandas.errors.ParserError: Error
tokenizing
浏览 29
提问于2019-01-29
得票数 0
3
回答
猪- MAX在分组后不工作
hadoop
、
group-by
、
apache-pig
我正在和Pig 0.12.1和Map-R一起工作。在对其他字段上的关系进行分组之后,我试图找到字段的max。在评论中,请参考下面的猪脚本和关系结构--- r1: {c1: biginteger,c2: biginteger}-- r2: {group: chararray,r1: {(c1: chararray,c2: biginteger)}} /* output - 1234|{(1234,9876
浏览 5
提问于2015-06-11
得票数 0
回答已采纳
2
回答
如何使用带有gzip压缩选项的pandas read_csv读取tar.gz文件?
python
、
csv
、
pandas
、
gzip
、
tar
import pandas as pd然而,我得到了一个错误:CParserError: Error
tokenizing
440, saw 2 pd.rea
浏览 1
提问于2016-09-01
得票数 40
回答已采纳
2
回答
C编程,我哪里做错了?Strtok
c
printf("Give me a word: "); while (printf( "L
浏览 2
提问于2018-12-03
得票数 0
2
回答
在R中使用短语而不是单个单词进行主题建模
r
、
text-mining
、
corpus
我正在尝试做一些主题建模,但希望使用存在的短语,而不是单个单词。library(tm)my.corpus = Corpus(VectorSource(my.docs))inspect(my.dtm) 当我检查我的dtm时,它会把所有的单词
浏览 1
提问于2015-02-02
得票数 5
3
回答
C++函数运行两次,但只调用一次
c++
、
shell
、
unix
last) << endl; *args = '\0';shell>> ls -l1: -l0: lsdone
tokenizing
... 我不知道它为什么会这么做。
浏览 6
提问于2016-08-29
得票数 1
回答已采纳
4
回答
检索java中嵌套json中的所有键。
java
、
json
= map.get("params.uid"); System.out.println("
Tokenizing
StringTokenizer simpleString = new StringTokenizer(testDat);key > params : value
浏览 1
提问于2013-01-31
得票数 4
2
回答
如何返回到文件java中的行
java
StringTokenizer st = new StringTokenizer(str_Data); //
Tokenizing
the line.
浏览 4
提问于2014-06-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
“欧洲硅谷”的区块链讲座
轻量级NLP工具开源,中文处理更精准,超越斯坦福Stanza
2018年最受关注10大Python函数包
你是一个成熟的AI了,应该自己学会补全Python代码了
终于有人把机器学习中的文本摘要解释清楚了!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券