腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
python
中所
选
单词
的
数据
帧
中
获取
单词
计数
python
我有一个
数据
框,里面有评论,我想知道每个评论中有多少个特定
的
单词
。例如,dataframe是这样
的
: ['good food', 'great staff', 'great food and great staff'] 如果我搜索
单词
'great‘,结果应该是一个添加
的
浏览 8
提问于2019-05-17
得票数 0
3
回答
在
python
中
获取
两个
数据
帧
之间包含子字符串
的
字符串行
计数
的
最快方法
python
、
python-3.x
、
pandas
、
nltk
我有两个
数据
框,一个有
单词
,另一个有文本。我想要
获取
第一个
数据
帧
中
包含该
单词
的
所有行
的
计数
。
单词
=------------2 | database4 | searchID| Text1 | Introduction to
python<
浏览 0
提问于2020-09-26
得票数 0
2
回答
python
替换
单词
而不是子字符串
python
、
string
、
dataframe
、
replace
、
re
我想在
数据
帧
的
列中用另一个
单词
替换另一个
单词
。下面是我
的
python
代码: import pandas as pddf=pd.DataFrame([x.split(';') for x in text.split('\n')]) df['text'] = df[0].str.replace(r"age","âge"
浏览 23
提问于2021-10-02
得票数 0
回答已采纳
2
回答
用
python
中
的
几个文件打开一个文件夹
python
、
files
、
directory
如何打开包含多个文件
的
文件夹?我测试了这些代码,但它返回了一个奇怪
的
答案。num_words += len (words)只是返回9,但它应该计算在7个文件,70个文本文件
中
的
字数
浏览 0
提问于2015-02-15
得票数 0
1
回答
如何计算每个令牌词
的
词距离并在一列
中
返回0距离
的
计数
python
、
python-3.x
、
string
、
nlp
、
levenshtein-distance
我得到了两个描述,一个在
数据
帧
中
,另一个是
单词
列表,我需要计算描述
中
每个
单词
相对于列表
中
每个
单词
的
levensthein距离,并返回等于0
的
levensthein距离
的
计数
计算字典
中
每个
单词
的
Lev距离
的
每一行
中所
有
单词
的
浏览 1
提问于2019-08-24
得票数 0
4
回答
如何计算Pandas dataframe单元格
中
的
单词
总数并将其添加到新列
中
?
python
、
pandas
、
dataframe
、
count
、
words
情感分析
中
的
一个常见任务是
获取
Pandas
数据
帧
单元格
中
的
单词
计数
,并在此基础上创建一个新列。我该怎么做?
浏览 4
提问于2017-09-26
得票数 7
回答已采纳
1
回答
NLTK语料库
中
不间断
单词
的
计数
python
、
nltk
、
corpus
、
stop-words
在使用NLTK
的
python
中
,如何在按类别筛选
的
文档中找到不停止字数
的
计数
?我可以想出如何使语料库
中
的
单词
被一个类别过滤,例如棕色语料库
中所
有用于“新闻”
的
单词
是:另外,我可以弄清楚如何
获取
特定文档
的
所有
单词
,例如,棕色语
浏览 2
提问于2016-03-05
得票数 0
回答已采纳
1
回答
在R- Text分析
中
合并
数据
框
r
、
merge
、
dataframe
我正在对20个新闻组
数据
集进行一些文本分析,其中一部分依赖于根据所述文章
中
的
单词
对不同文章进行分类。我目前所能做
的
就是解析一篇文章,然后编译关于它
的
统
计数据
。我可以在每篇文章
中
单独做这件事,但将文章组合在一起似乎是我
的
缺点。在R
中
,我希望能够做
的
事情如下:
获取
两个(理想情况下是任意数量)已解析和词干提取
的
单词
的
频率
数据
浏览 1
提问于2013-07-03
得票数 0
回答已采纳
2
回答
网页上
的
字数统计
python
、
nlp
、
web-crawler
、
beautifulsoup
我正在寻找一种方法来提取一个任意网站上
的
单词
的
基本统
计数据
(总
计数
,密度,链接
计数
,hrefs),理想情况下是基于
Python
的
解决方案。虽然使用BautifulSoup解析特定网站并确定大部分内容
的
位置很容易,但它要求您在处理之前定义内容在DOM树
中
的
位置。这对于hrefs或任何任意标记来说很容易,但在确定其余
数据
(没有包含在定义良好
的
标记
中
)
浏览 0
提问于2013-03-30
得票数 2
回答已采纳
1
回答
在字符串
中
显示前10个
单词
python
、
string
我正在编写一个程序,
从
互联网上抓取一个txt文件并读取它。然后,它将显示与该txt文件相关
的
一系列
数据
。现在,这一切都很好,直到我们走到最后。我最不想做
的
事情是显示txt文件中最常用
的
前10个
单词
。我现在
的
代码只显示了10次最频繁
的
单词
。有人能看看这个然后告诉我问题出在哪里吗?你要看
的
唯一部分是最后一部分。
浏览 4
提问于2014-11-19
得票数 0
回答已采纳
1
回答
解释情感分析(NRC词典)
r
、
sentiment-analysis
、
interpretation
不幸
的
是,与这个不同
的
是,我不能从文件(get_nrc_sentiment部分)
中
获得每行代表一个句子
的
结果
数据
帧
。 这与文本组织有关吗?
浏览 3
提问于2016-06-09
得票数 1
1
回答
无法在给定
的
数据
帧
上实现TF\IDF
pyspark
我正在尝试实现TF\IDF,但我似乎不能让我
的
代码工作。我清理了
数据
,目前
的
情况是: 我有一个包含两列
的
数据
帧
:标题、文本。每一行都被认为是一个文档,它
的
内容是文本列
中
相应列表
中
的
单词
。我正在尝试首先做TF部分,这意味着对于每个文档,
获取
每个
单词
的
计数
,并为每个
单词
应用日志(1+count)。对于IDF部分,我
浏览 14
提问于2020-08-09
得票数 0
4
回答
统计文件
中所
有
单词
的
词频
python
、
python-3.x
、
pandas
、
text
、
nltk
我有一个文本文件,我已经
从
其中删除了符号和停用词。我想创建一个.csv文件与频率
的
所有
单词
(长格式)在降序。
浏览 2
提问于2019-05-28
得票数 1
1
回答
如果找到任何值,则比较两个来自
数据
库和checkbox=checked
的
数组
php
、
mysql
、
arrays
、
checkbox
、
checked
我在
数据
库中有一个列(应用程序),它有一个用逗号分隔
的
单词
列表- AAA,BBB,CCC -我有另一列(AppsSelected),它将以相同
的
格式填充到用户使用复选框值检查
的
单词
。在一页
中
,我列出了应用程序
中
的
所有
单词
,旁边有复选框,在提交时,它会插入已签入appsSelected
的
单词
。在另一页
中
,它只列出了appsSelected列
中
<em
浏览 1
提问于2014-05-08
得票数 0
回答已采纳
2
回答
如何在
python
pandas中使用groupby连接字符串?
python
、
pandas
、
grouping
我目前在顶部有
数据
帧
。有没有办法使用groupby函数来
获取
另一个
数据
帧
来对
数据
进行分组,并将
单词
连接成下面使用
python
pandas
的
格式?[
浏览 0
提问于2016-06-30
得票数 8
回答已采纳
2
回答
将
计数
器转换为具有链接列表值
的
哈希表
python
、
python-3.x
、
data-structures
、
nltk
、
tokenize
我有三个
计数
器,总
计数
字频率在不同
的
字符串。,以获得所有
计数
器
中所
有
单词
的
总字数。Counter({u'childhood': 8, u'waiting': 4}) 但是,我需要接受每个
计数
器,并将它们插入到哈希表
中
,其中
单词
为key,链接列表为值,其中每个链接条目的每个
计数
器都有每个字符串
的
计数
中
实现这一
浏览 0
提问于2018-02-01
得票数 1
回答已采纳
1
回答
如何基于简单
的
约束在字典中找到一个
单词
?
regex
、
string
、
search
、
dictionary
我希望能够在字典(文本文件)
中
获得与一个非常简单
的
约束相匹配
的
所有
单词
。对于字符串"bccd",查找所有以"b“开头
的
单词
,其中至少包含两个"c”和至少一个"d“("bydcuc”和"bicdzcd“是有效
单词
)。字符串
中
的
第一个字母总是应该以
单词
开头
的
字母,下面的字母应该包含--至少--它们出现在字符串
中
<em
浏览 3
提问于2014-03-29
得票数 1
回答已采纳
2
回答
朴素贝叶斯分类器需要知道整个词汇表吗?
twitter
、
machine-learning
、
classification
、
vocabulary
、
text-classification
显然,
数据
集是动态
的
,即文档集合并不固定于一组N文档(即tweet):当用户在Twitter上爬行时,
数据
集一次又一次地膨胀。我可以
从
训练集开始计算模型(并说明词汇表V是由训练集中包含
的
术语组成
的
)。现在,人们可以收集一个新
的
、未分类
的
推文,其中包含V
中
未出现
的
术语(即,未
浏览 20
提问于2014-04-25
得票数 0
1
回答
寻找相当于此javascript代码
的
python
javascript
、
python
、
loops
、
for-loop
、
substring
我正在学习
python
,因为我
的
工作是能够操作统
计数据
。我已经了解C#和javascript,可以使用这些语言解决这个问题,但是我很难将解决方案转换为
python
。该问题计算.txt文件
中所
有唯一
的
四个字母
单词
。任何带有撇号
的
单词
都应该被忽略。忽略
单词
的
情况(即工具和工具只应算作一个
单词
)。打印出(以便用户可以看到)唯一
的
四个字母
单词
的<
浏览 0
提问于2019-11-21
得票数 0
回答已采纳
2
回答
变量选项
的
汇总计算
r
我有一个包含许多变量及其选项
的
大
数据
框架,所以我需要所有变量及其选项
的
计数
。例如,下面的
数据
帧
。此外,我有相同
的
另一个
数据
框架,如果我想合并这两个
数据
框架,检查列名是否相同,如果不是
获取
不同列名
的
名称。不包括c(唯一性,名称)列,目的是在
计数
的
帮助下找出我们是否有拼写错误
的
单词
,或者这些
单词
是否有重音。f&qu
浏览 1
提问于2020-09-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python分析36套四级真题获取词频最高5000个词汇
我拿 12年36 套四级真题做了什么?
如何使用 Scikit Learn 为机器学习准备文本数据
利用tkinter制作桌面翻译工具,结构不是很复杂不过有点糙
Python利用tkinter制作桌面翻译小工具
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券