首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

擅用数据挖掘,全国两会“热词”轻松掌握

全国两会上周在北京召开。两会集众智,聚群力,开新篇,谋新篇。全国两会作为每年定期召开的关系国计民生的政治性会议,是外国了解中国的重要窗口,也是与人民生活息息相关的风向标。

全国两会集中了全国各族人们的智慧,凝聚了人民的需求和意见。就业、婚恋等民生议题关系到人民的日常生活,宏观经济政策关系到企业的发展方向,企业需要根据政策改动调整战略目标才能提高自身的竞争力。

两会提及了这么多的内容,怎样才能快速地知晓两会“热词”及相关内容呢?Smartbi Mining来教你快速看“热词”。Smartbi Mining是一站式可视化的数据挖掘平台,是广州思迈特软件公司的明星产品。Smartbi Mining可以通过数据挖掘迅速生成两会“热词”,无需编程技术,新手小白也可以掌握,只要简单的鼠标操作便可完成数据挖掘。

下面来演示一下。

1.新建实验

打开默认界面,即‘实验管理’界面,该界面可以进行‘新建实验’:

新建方式1:在文件夹右键菜单‘新建’中单击‘实验’;

新建方式2:单击‘新建实验’。

2.选择数据源

根据原始数据存放的方式在选择数据源节点,将数据源节点拖拽至画布区域,并在参数面板上进行数据源信息的设置。

3.模型搭建

特征选择:将你关注的关键词,比如放假、假期、春假作为特征列,而‘是否提及’做为标签列;

拆分:将数据集进行拆分,一部分数据用来训练模型,另一部分用来验证经过训练的模型效果如何;

4.训练&预测

训练:训练节点的输入分为两部分,左边为算法节点,右边为训练数据集,模型通过对训练集数据中特征列的数据进行学习,并根据标签列的数据,确认具有何种特征的数据可能与“假期”有关,进而使模型获得能够识别关于“假期”的能力;

预测:预测节点的输入分为两部分,左边为训练好的模型,右边为测试数据集,模型运用识别流失客户的能力,对测试集中的特征列数据进行处理,并获得是否为放假的标记,这里的标记是模型给出的结论,并非测试集中标签列的数据。

5.结果评估

评估:通过对比模型预测结果与测试集数据之间的差异,可以评价模型的效果。

从下面最终输出评价结果可以看到这个模型的准确率高达95%。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220317A08PBE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券