首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

文本聚类平移算法的几点问题

大概一个月前 10b lobster 也和我聊起过卢亮介绍过的平移算法,详细的介绍可以看这里:卢亮的blog。记得当时第二天就看到了carrot2的发布,carrot2 上使用了多种聚类的算法。 有些人对平移算法嗤之以鼻,比如这位。在我看来,一个算法有没有效果,要看这个算法的前提和假设,大炮打小鸟怎么瞄也不带劲儿。在文本处理领域中,比如,中文分词,特别是文本聚类的算法上从来没有一个算法可以解决所有问题,很多解决方案都是采用多个算法取长补短来达到综合效果的。 昨天写关于标签和书签的blog时想到,在改善新闻阅读器的文章分类也许平移算法用的上。周末便用了半天做了一个单向移动的平移算法。 平移算法,要考虑这个算法适用的范围,这个是前提。我实现的平移算法和卢亮的目的不同,类似于我的:未登录词识别 在算法的具体设计上,还需要考虑以下几个问题: 1、窗口大小,窗口借用了tcp发包的窗口的概念,就是确认有效匹配的长度; 2、平移的方向。我下面例子只实现了单向移动; 3、效率问题,平移算法涉及了大量的比较,找到一个最短的比较边界还挺重要; 下面是一份平移算法的原始结果,找出所有it公司的人名,感觉还可以。进一步处理后,就可以投入实际应用了:

06

微软将于 6 月彻底淘汰 IE 浏览器

最近,Microsoft today 提醒 Windows 用户,他们将在今年 6 月从一些 Win10 版本中删除 Internet Explorer 浏览器,并用基于 Chrome 的 Microsoft Edge 浏览器取代它。然而,在取消 Internet Explorer 之后,微软仍将通过内置 Internet Explorer 模式(IE 模式)在微软 Edge 中支持基于 Internet Explorer 的旧网站和应用程序。对此,微软在公告中还表示,Internet Explorer 将在未来被微软 Edge 取代。对于某些版本的 Windows 10,Internet Explorer 11 桌面应用程序将于 2022 年 6 月 15 日禁用。停用后,Internet Explorer 桌面应用程序将被禁用且不再受支持,用户将在启动时自动重定向到 Microsoft Edge。同时,IE11 的停用仍将对 Internet Explorer 11 桌面应用程序产生重大影响(Eswink技术学习)。

03

20171223

最近工作中遇到一个问题是需要在线可以预览 word、excel 等文件,发现微软有一个 Office Web Apps Server 的产品,可以用来实现这个,需要有两个 Windows Server 服务器,因为一个用来做域控制器,一个用来装 Web Apps Server,而且官方文档指明了不能安装在与控制器的服务器上。除去自己搭建这个服务以外,通过网络发现了 明道 自己搭建了这么一个服务放在了外网,https://docview.mingdao.com/ ,如果是公开的文件不需要保密的或许可以直接使用,另外我看到百度文库有这种付费的 API,但是有一个要求就是必须把文件保存在百度的云盘里面好像是,其实对于 word 文档的还原还是微软提供的 Office Web Apps Server 翻译出来的排版还原程度最高,和使用 word 效果是一模一样的。还有一个种方法是使用其他第三方提供的在线预览,基本上也都是收费的,限制域名或者是文件大小,另外一个是使用 OpenOffice 自己来,我安装了一个 OpenOffice 打开让说依赖旧版本的 JRE6,需要安装 jre6,我直接就放弃了。

01
领券