前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NLTK FreqDist

NLTK FreqDist

作者头像
全栈程序员站长
发布2022-11-15 17:31:25
2930
发布2022-11-15 17:31:25
举报
文章被收录于专栏:全栈程序员必看

FreqDisk

nltk FreqDisk函数能够统计数组当中单词出现的次数。

代码语言:javascript
复制
text = ['hadoop','spark','hive','hadoop','hadoop'
    ,'spark','lucene','hadoop','spark','hive'
    ,'hadoop','hadoop','spark','pig','zookeeper'
    ,'flume','stream','hadoop','hadoop','spark'
    ,'pig','zookeeper','flume','stream','hadoop'
    ,'hadoop','spark','pig','zookeeper','flume'
    ,'stream','hadoop','hadoop','spark','pig'
    ,'zookeeper','flume','stream','hadoop','hadoop'
    ,'spark','pig','zookeeper','flume','stream']
fdist = nltk.FreqDist(text)
for k in fdist:
    print(k+" "+str(fdist[k]))

Jetbrains全家桶1年46,售后保障稳定

代码语言:javascript
复制
hadoop 14
spark 8
hive 2
lucene 1
pig 5
zookeeper 5
flume 5
stream 5

FreqDisk::plot(n)

参数n,以折线图的方式展示频数最大的前n项数据。

代码语言:javascript
复制
fdist.plot(4)

FreqDisk::tabulate(n)

参数n,以表格的方式展示频数最大的前n项数据。

代码语言:javascript
复制
fdist.tabulate(5)

FreqDisk::most_common(n)

参数n,展示频数最大的前n项数据。

代码语言:javascript
复制
print(fdist.most_common(3))
代码语言:javascript
复制
[('hadoop', 14), ('spark', 8), ('pig', 5)]

FreqDisk::hapaxes()

展示频数最小的数据。

代码语言:javascript
复制
print(fdist.hapaxes())
代码语言:javascript
复制
['lucene']

FreqDisk::max()

展示频数最大的数据。

代码语言:javascript
复制
print(fdist.max())
代码语言:javascript
复制
hadoop

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/226787.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月30日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • FreqDisk
  • FreqDisk::plot(n)
  • FreqDisk::tabulate(n)
  • FreqDisk::most_common(n)
  • FreqDisk::hapaxes()
  • FreqDisk::max()
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档