首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

分享一个免费的政策分析工具

大家好,我是很帅的狐狸🦊

今天分享一个免费政策分析工具。

这个工具是我(和ChatGPT)做的,用来比较两段文本的词频。

如果你的工作涉及宏观政策分析,这个工具会很好用。

所有代码都是用ChatGPT写的(包括前端),花了大概1个多小时吧。

先说说底层的分析原理——

我在之前几期的 政策分析课 上有提到过,分析政策文件有一个做法是「词频分析法」,也就是通过词语出现频次判断重要性。

这个方法,可以用来对比同级别会议或报告。

比如说,对比过去几年的国家五年规划文件,我们可以发现制造业和服务业的地位有所扭转——

过往这个分析基本靠网上的词频分析工具,不过大多都是付费的。

所以我这次手搓了一个免费的。

用法也很简单:

把最新文件(比如「十四五」规划文件)和想要对比的文件(比如「十三五」规划文件)分别贴在两个文本框——

接着可以选择要统计的高频词的个数(最少10个),还有看看是不是要用相对词频(也就是把词频除以文件的总字数,这样算出来的是百分比)。

我们也可以根据需求,看看是不是要改改分词用的词典。

接着按「词频比较」按钮就可以了。

会生成类似下面的图表(黑色的是「十四五」,黄色的是「十三五」,可以看一眼哪些是新增哪些减少了,还挺好玩的):

服务器不会储存你贴的任何文本,请放心使用。

如果实在不放心,我也把代码都开源到了github(https://github.com/raphaelxiao/policy-text-insights)。

略懂python的话,也可以在自己电脑上部署。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OqixodROVivcPlAih6YlTo4A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券