首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    如何用Python做中文分词?

    需求 在《如何用Python做词云》一文中,我们介绍了英文文本的词云制作方法。大家玩儿得可还高兴? 文中提过,选择英文文本作为示例,是因为处理起来最简单。但是很快就有读者尝试用中文文本做词云了。...你的问题应该是:如何用电脑把中文文本正确拆分为一个个的单词呢? 这种工作,专业术语叫做分词。...在介绍分词工具及其安装之前,请确认你已经阅读过《如何用Python做词云》一文,并且按照其中的步骤做了相关的准备工作,然后再继续依照本文的介绍一步步实践。 分词 中文分词的工具有很多种。...有的在你的笔记本电脑里就能安装使用,有的却需要联网做云计算。 今天给大家介绍的,是如何利用Python,在你的笔记本电脑上,免费做中文分词。 我们采用的工具,名称很有特点,叫做“ 结巴分词 ”。...数据 在《如何用Python做词云》一文中,我们使用了英剧”Yes, minister“的维基百科介绍文本。这次我们又从维基百科上找到了这部英剧对应的中文页面。翻译名称叫做《是,大臣》。 ?

    1.4K30

    【从0做项目】Java音缘心动(6)——删除、查询音乐

    二:删除指定音乐模块 1:请求响应设计 2:Mapper层 这一层我们要做的工作主要是 ①通过拿到音乐的id,到数据库中去查询音乐 ②数据库中删除音乐 不多bb,直接上代码 (1)查询音乐 /*...思考:我们查询音乐有哪些常见场景 1:模糊查询 比如:我很喜欢听周杰伦的歌~,那么我搜索周杰伦,音乐列表就应该给我显示所有包含周杰伦的歌曲对吧——《晴天——周杰伦》《可爱女人——周杰伦》《兰亭序——周杰伦...那么这里我们后端的sql语句就应该要支持模糊查询 2:空查询 如果我们查询为空呢?.../** * 查询所有音乐 * @return */ List findAllMusic(); 4:Mybatis代码实现 介绍一下这里的模糊查询...concat关键字,是sql中字符串连接操作,通常用于实现模糊查询 不懂模糊查询的童鞋到看看阿华的这篇文章 【MySQL】数据库的创建和增删查改使用操作(超详细)_数据库操作-CSDN博客 <

    6110

    独家 | 如何用XGBoost做时间序列预测?

    作者:Jason Brownlee 翻译:wwl 校对:王雨桐 本文约3300字,建议阅读10分钟 本文介绍了如何用XGBoost做时间序列预测,包括将时间序列转化为有监督学习的预测问题,使用前向验证来做模型评估...它兼顾了速度和效率,且在很多预测模型任务中表现优异,在数据科学比赛中广受赢家偏爱,如Kaggle。 XGBoost也可以用于时间序列预测,尽管要先把时间序列数据集转换成适用于有监督学习的形式。...我们去掉了时间列,并且有几行数据不能用于训练,如第一行和最后一行。 这种表示称为滑动窗口,因为输入和期望输出的窗口随着时间向前移动,为有监督学习模型创建新的“样本”。...可以如下定义这个方法: 可以用XGBRegressor类来做一步预测。xgboost_forecast()方法实现的是,以训练集、测试集的输入作为函数的输入,拟合模型,然后做一步长预测。...接下来我们评估XGBoost模型在这个数据集上的表现,并对最后12个月的数据做一步长的预测。

    4.3K20
    领券