腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
统计
pd
数据
帧
中
字符串
列表
中
的
词频
、
、
、
我有一个
数据
帧
,其中一列包含段落
的
词条。我希望
统计
整个
数据
帧
中
每个单词
的
频率,而不仅仅是记录
中
的
频率。有超过40,000条记录,所以计算必须很快,并且不能达到我
的
RAM
的
极限。:'complete':1 'health':2 'science':1 'test':1 这是我当前
的
代码:
浏览 11
提问于2020-07-21
得票数 1
3
回答
从
数据
帧
名称
列表
中
合并多个
数据
帧
、
、
我想使用
数据
帧
的
名称作为
列表
中
的
字符串
,将多个
数据
帧
连接到单个
数据
帧
中
。这类似于: df1 =
pd
.DataFrame({'x': [1, 2, 3], 'y': ['a', 'b', 'c']}) df2 =
pd
.DataFrame(
浏览 10
提问于2021-09-30
得票数 1
回答已采纳
3
回答
统计
pandas
数据
帧
中
的
单
词频
率
、
、
Society4 113438 MMV Oil Associates Ltd 我已经尝试了以下代码:import nltktop_N= 20 word_dist = nltk.FreqDist(data['Firm_Name
浏览 5
提问于2017-10-17
得票数 41
回答已采纳
2
回答
获取
列表
中
嵌套
数据
帧
的
汇总
统计
信息
、
、
我有一个
数据
帧
列表
,我希望将该
列表
中
每个
数据
帧
的
摘要
统计
信息返回到一个新
的
数据
帧
中
-能够选择每个初始
数据
帧
中
的
列(值)来返回摘要
统计
信息。输出
数据
帧
中
的
每一行对应于初始
列表
中</
浏览 8
提问于2019-09-14
得票数 0
回答已采纳
3
回答
使用else if逻辑
统计
标记化单词
中
的
词频
、
、
、
我正在尝试计算
词频
是
数据
帧
中
的
一个
列表
。'brown', 'fox'], ['the', 'weather', 'is'],['she', 'sells', 'sea']], 'marks':['a', 'b', 'c']} df =
pd<
浏览 7
提问于2019-04-09
得票数 2
回答已采纳
1
回答
如何从现有pandas
数据
帧
的
子集创建pandas
数据
帧
、
、
我有一个现有的NBA球员在2020-2021赛季
的
数据
框架。我还有一份今年入选NBA全明星赛
的
球员名单。我想迭代我
的
现有
数据
帧
,并创建一个新
的
数据
帧
,其中只包含那些在我
的
全明星球员名单
中
的
球员
的
统计
数据
。为了澄清,我希望我
的
新
数据
帧
看起来与我现有的
数据
<em
浏览 0
提问于2021-03-04
得票数 0
1
回答
如何获取一个
列表
中
附加
的
多个
数据
帧
的
均值、标准差和mad?
、
、
、
我有几百个
数据
帧
被附加到一个
列表
中
。所有
数据
帧
的
列数相同,但行数不同。列名也是相同
的
。所以我想取每一列
的
列值
的
均值、mad、std,我这样做:lst = [] df1 =
pd
.re
浏览 1
提问于2018-09-25
得票数 2
1
回答
聚合不正确
、
我这段代码
的
目标是创建一个循环,根据我创建
的
某个主向量聚合每个公司
的
词频
,并将其添加到
列表
中
。问题是,在我运行这个程序后,它只打印了我拥有的7个原则,而不是它们旁边
的
单
词频
率。字频是FREQBYPRINC.AG
数据
帧
的
某一列。单独运行这段代码,不使用循环,只测试某一列,没有问题。由于某些原因,循环不想为
列表
提供正确
的
数据
帧
。有什
浏览 2
提问于2017-07-29
得票数 0
1
回答
如何循环遍历
数据
帧
中
的
行,以记录在另一个df中有多少列大于行
中
的
值
、
、
、
、
我合并了一个dataframe,并获得了
数据
帧
的
每一列
的
最小值,1005列和一个min值。这现在是在单行
的
数据
帧
中
。我想循环一个
数据
,我已经为上个赛季
的
足球
统计
,保持一个
统计
有多少
统计
的
球队(排)是大于在最小
数据
帧
中
的
值。 df是每一行
的
最小值
的</
浏览 2
提问于2022-07-12
得票数 0
2
回答
如何使用非标准分隔符从词汇表创建DF?
、
、
、
我试着通过词汇量来
统计
词频
: vocabulary = {} if word in vocabulary: else: vocabulary[word] = 1 在此之后,我尝试通过以下方式将结果转换为DataFrame: df =
pd
.DataFrame.from_dict(vocabulary, orient='index', columns=['word', &
浏览 24
提问于2019-01-29
得票数 1
回答已采纳
1
回答
如何从PySpark中一个DataFrames
的
每一行生成大量
的
DataFrame集合,然后将其缩减?
、
、
、
不幸
的
是,我不能分享我
的
实际代码或
数据
,因为它是专有的,但如果问题对读者来说不是很清楚,我可以生成一个MWE。 我正在处理一个包含大约5000万行
的
数据
帧
,每行都包含一个大型XML文档。从每个XML文档
中
,我提取了一个与出现次数和标记之间
的
层次关系相关
的
统计
数据
列表
(没有什么比无文档记录
的
XML格式更让人愉快
的
了)。我可以在
数据
浏览 21
提问于2021-10-26
得票数 0
1
回答
搜索和删除
数据
帧
列表
中
的
项
、
、
假设我通过以下方式创建了一个
数据
帧
列表
: import pandas as
pd
lDfs.append(
pd
.read_csv('SomeTable.csv') 然后我有一个包含3个
数据
帧
的
列表
: lDfs[0]lDfs[2] 假设每个
数据
帧
具有以下结构: Date,Open,
浏览 18
提问于2020-04-16
得票数 0
3
回答
如何在pandas
数据
帧
中
反转.astype(str)?
、
、
、
我必须删除
数据
帧
中
包含
列表
值
的
重复行。所以我用了
pd
_data['douban_info_string'] =
pd
_data['douban_info'].astype(str) 其中'douban_info_string‘具有
列表
值。但现在我需要这个
列表
来与另一个
数据
帧
的
列表
进行比较。但是现在这个
列表
浏览 38
提问于2019-03-12
得票数 3
2
回答
如何在R中使用循环导入.cvs文件?
、
、
、
我有一系列名为Natalidad[i]
的
.cvs文件,其中[i]是1996到2020年
的
数据
年份。我想让I循环来加载它们
中
的
每一个。我已经尝试了下一段代码,但它正在工作。我
的
问题可能很基本。我不熟悉R
中
的
循环,所以我可能遗漏了一些重要
的
东西。
浏览 83
提问于2021-09-27
得票数 0
回答已采纳
3
回答
用汇总函数
统计
数据
帧
中
的
词频
、
我试着在SO上查找,但找不到任何简单
的
答案。我
的
问题非常简单。 看看ggplot2包
中
的
mpg
数据
集。我想先按model和manufacturer分组,然后计算"drv“列("f", "r", "4")
中
字符串
的
出现频率。
浏览 13
提问于2018-01-08
得票数 0
回答已采纳
2
回答
从下拉菜单
中
抓取每个表Python
、
、
、
我希望从以下NCAA
统计
页面
中
获取3级大学篮球
的
统计
数据
: 单击该链接后,左上角表格上方有一个下拉
列表
它被标记为“附加
统计
信息”。对于每个
统计
数据
都有一个表,你可以得到一个excel文件,但我想更有效率。我在想,可能有一种方法可以使用BeautifulSoup (或者甚至
pd
.read_html
浏览 0
提问于2020-04-12
得票数 1
1
回答
Python:单词
列表
的
NLTK概率
、
我一直在
统计
语料库
中
的
单词
列表
,并看到单词
列表
的
概率。提前谢谢你!
浏览 1
提问于2012-10-01
得票数 0
回答已采纳
5
回答
包含值和键
的
字典
的
python
词频
我是第一次学习python,我知道如何使用
词频
来计算
列表
中
每个唯一变量
的
个数,如下所示 else: 然而,我想知道通过使用double for循环,单
浏览 2
提问于2020-02-18
得票数 0
1
回答
用python 3抓取多个页面?
、
、
、
、
为了方便起见,我把它读到了一个熊猫
数据
框
中
。我稍后需要做一些
统计
工作-熊猫很方便。它看起来有点像这样:csv = [{"URLs" : "www.mercedes-benz.de", "electric" : 1}, {"URLs" : "www.audi.de", "electric" : 0}]
浏览 9
提问于2017-06-15
得票数 1
回答已采纳
2
回答
我需要从我
的
文本分析
中
获得
的
结果
中
消除标点符号
、
、
我正在尝试计算
数据
帧
列
中
单词
的
频率,标题为df‘’MESSAGETEXT‘,如下所示)。我正在使用
的
代码(来自Stackoverflow)如下: from collections import Counterimport nltk .str.cat(sep=' ') # generate DF out o
浏览 14
提问于2020-12-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python中把列表中的字符串转成整型的3种方法
一文详解Python编程中 字符串 元组 列表的区别
Java 11 统计字符串中各个字符出现的次数
tcp/ip模型中,帧是第几层的数据单元?
Python中的字符串和字符数据(下)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券