首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >查找单词频率和绘图结果

查找单词频率和绘图结果
EN

Stack Overflow用户
提问于 2019-12-03 22:25:01
回答 1查看 119关注 0票数 1

我目前在一个文本文件中有一个单词列表,文档中的所有单词都在单独的一行上。我还将嵌套的json数据导入到pandas数据框中。

Json数据格式如下所示:

代码语言:javascript
复制
[  
   {  
      "year":"2019",
      "category":"chemistry",
      "laureates":[  
         {  
            "id":"976",
            "motivation":"\"for the development of lithium-ion batteries\"",
            "share":"3"
         },
         {  
            "id":"977",
            "motivation":"\"for the development of lithium-ion batteries\"",
            "share":"3"
         }
      ]
   },
   {  
      "year":"2019",
      "category":"economics",
      "laureates":[  
         {  
            "id":"982",
            "firstname":"Abhijit",
            "surname":"Banerjee",
            "motivation":"\"for their experimental approach to alleviating global poverty\"",
            "share":"3"
         },

我需要使用文本文件中的单词来找出json文件中每个类别的各种频率(例如:化学)。然后,我被要求使用Matplotlib为每个主题绘制多个频率(第一个最频繁的单词,第10,20,30,40,50)。

我很困惑,因为我不确定最好的方法。

EN

回答 1

Stack Overflow用户

发布于 2019-12-03 22:40:56

您可以使用python的moses - sacremoses端口进行标记化和规范化。这将为您提供单词列表。然后,您只需要计算每个单词的出现次数并创建曲线图。对于快速绘图,我推荐使用seabornWord cloud也会很整洁。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59159240

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档