首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

实现文本自动分类的基础----Term频率计算方法

据说如今互联网上的文档每天以100万的数量增长,这么大的增长量使得Google可能需要1个月甚至更长的时间才能光顾你的网站一次。所以如果你今天对你的网页做了优化,那么1个月后在看Google的反应吧。这真是信息爆炸的年代。互联网刚诞生的时候,通过目录导航机制,我们就能找到所需要的信息,Yahoo抓住这个机会成功了;后来随着互联网的普及,信息爆炸的速度让目录导航失去了效应,Google抓住了这个机会,提出有特色搜索算法,让人们不理会目录机制也能找到信息,Google也成功了。可是正如我们不能有了互联网就把报纸丢弃一样,目录导航的机制仍然发挥着作用。观察一下Google的推出的个性搜索服务就可以发现,为了让用户搜索的内容更相关,Google正鼓励你使用预定搜索频道。     也就是说搜索的目录分类机制仍然存在,但是不直接面对最终用户,而是面对搜索引擎,即根据文档内容自动分类。

03
领券