胖兔子兔胖

LV0
发表了文章

使用 trie 树实现简单的中文分词

导语:工作中偶尔遇到需要对中文进行分词的情况,不要求非常高的精确度和语境符合度,仅是为了统计某些词出现的热度。本文提供了一种简单易行的中文分词方法。 工作中,偶...

胖兔子兔胖
中文分词
发表了文章

实战干货:从零快速搭建自己的爬虫系统

本文简要归纳了网页爬虫的基础知识,着重于利用现有组件,快速建立一套实际可用的网页爬取、分析系统。系统主要使用Python 作为开发语言,在 Linux 或 Ma...

胖兔子兔胖
爬虫ScrapyPython
创建了专栏

胖胖的专栏

2 文章4 关注者

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券