首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

何用Python中文分词?

需求 在《如何用Python词云》一文中,我们介绍了英文文本的词云制作方法。大家玩儿得可还高兴? 文中提过,选择英文文本作为示例,是因为处理起来最简单。但是很快就有读者尝试用中文文本词云了。...你的问题应该是:如何用电脑把中文文本正确拆分为一个个的单词呢? 这种工作,专业术语叫做分词。...在介绍分词工具及其安装之前,请确认你已经阅读过《如何用Python词云》一文,并且按照其中的步骤做了相关的准备工作,然后再继续依照本文的介绍一步步实践。 分词 中文分词的工具有很多种。...有的在你的笔记本电脑里就能安装使用,有的却需要联网云计算。 今天给大家介绍的,是如何利用Python,在你的笔记本电脑上,免费中文分词。 我们采用的工具,名称很有特点,叫做“ 结巴分词 ”。...数据 在《如何用Python词云》一文中,我们使用了英剧”Yes, minister“的维基百科介绍文本。这次我们又从维基百科上找到了这部英剧对应的中文页面。翻译名称叫做《是,大臣》。 ?

1.3K30

独家 | 如何用XGBoost时间序列预测?

作者:Jason Brownlee 翻译:wwl 校对:王雨桐 本文约3300字,建议阅读10分钟 本文介绍了如何用XGBoost时间序列预测,包括将时间序列转化为有监督学习的预测问题,使用前向验证来模型评估...它兼顾了速度和效率,且在很多预测模型任务中表现优异,在数据科学比赛中广受赢家偏爱,Kaggle。 XGBoost也可以用于时间序列预测,尽管要先把时间序列数据集转换成适用于有监督学习的形式。...我们去掉了时间列,并且有几行数据不能用于训练,第一行和最后一行。 这种表示称为滑动窗口,因为输入和期望输出的窗口随着时间向前移动,为有监督学习模型创建新的“样本”。...可以如下定义这个方法: 可以用XGBRegressor类来一步预测。xgboost_forecast()方法实现的是,以训练集、测试集的输入作为函数的输入,拟合模型,然后一步长预测。...接下来我们评估XGBoost模型在这个数据集上的表现,并对最后12个月的数据一步长的预测。

3.9K20
领券