首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    文本聚类平移算法的几点问题

    大概一个月前 10b lobster 也和我聊起过卢亮介绍过的平移算法,详细的介绍可以看这里:卢亮的blog。记得当时第二天就看到了carrot2的发布,carrot2 上使用了多种聚类的算法。 有些人对平移算法嗤之以鼻,比如这位。在我看来,一个算法有没有效果,要看这个算法的前提和假设,大炮打小鸟怎么瞄也不带劲儿。在文本处理领域中,比如,中文分词,特别是文本聚类的算法上从来没有一个算法可以解决所有问题,很多解决方案都是采用多个算法取长补短来达到综合效果的。 昨天写关于标签和书签的blog时想到,在改善新闻阅读器的文章分类也许平移算法用的上。周末便用了半天做了一个单向移动的平移算法。 平移算法,要考虑这个算法适用的范围,这个是前提。我实现的平移算法和卢亮的目的不同,类似于我的:未登录词识别 在算法的具体设计上,还需要考虑以下几个问题: 1、窗口大小,窗口借用了tcp发包的窗口的概念,就是确认有效匹配的长度; 2、平移的方向。我下面例子只实现了单向移动; 3、效率问题,平移算法涉及了大量的比较,找到一个最短的比较边界还挺重要; 下面是一份平移算法的原始结果,找出所有it公司的人名,感觉还可以。进一步处理后,就可以投入实际应用了:

    06

    俄罗斯著名商业CMS DataLife Engine v16.0

    DataLife Engine 是一个多功能的内容管理系统。得益于非常强大的新闻、文章和用户管理系统,DataLife Engine 主要设计用于在 Internet 上创建自己的大众媒体网站和博客。该引擎的各种基本功能(最初集成到其中)使 DataLife Engine 在网站创建方面进一步领先于其最接近的竞争对手。并且由于精确和复杂的核心结构可以最大限度地减少服务器资源的负载,DataLife Engine 能够轻松地处理具有大量出勤率的项目,从而将服务器负载保持在最低水平。定制设计的灵活性和易于定制和集成让您可以学习和了解模板的结构并尽快部署自己的网站,而无需任何额外的材料成本。先进的 AJAX 技术可以减少服务器上的流量和资源以及访问者的流量,更不用说访问者在网站上使用该技术的易用性了。由于对引擎的安全性、便利性和动态发展的日益关注,全球超过 90,000 个成功使用它的门户网站已经表示支持 DataLife Engine。对搜索引擎优化给予了极大的关注,它可以引导更多的访问者访问您的网站。

    02
    领券