首页
学习
活动
专区
工具
TVP
发布

字根中文校对软件

专栏作者
188
文章
186031
阅读量
44
订阅数
小叮咚机器人 ( 瞄瞄的版本 )
??? 和 瞄瞄?? 联系后,取得了这个小机器人的代码。正好我也有这个需求,所以准备继续瞄瞄这个版本继续开发,继续公开源代码。 ?? 现在的设想架构如下: 我也给用瞄瞄得代码 启动了机器人 服
田春峰-JCJC错别字检测
2019-02-14
5010
如何判断一个网页是不是一个Blog的首页?
      最近碰到一个问题,如何从一组链接中,判断链接是不是Blog的首页链接?     先从 Blog 存放的地点说起: 1、由BSP托管的Blog,一般采用开源或者BSP独立开发的Blog系统; 2、由个人空间存放的Blog,一般采用开源的Blog系统。而个人空间存放的Blog大都是 比较职业的 价值比较高的Blogger。     对于第一类,BSP的Blog链接地址都是固定的,加上成规模的BSP数量较少,其Blog的首页链接可以列举出来。     对于第二类,问题要复杂些,     有的 www 首页就是 blog 的主页,     有的是采用子域名的方式,     有的采用目录的方式; 但无论哪种链接方式,Blog 首页都有以下属性: 1、blog首页链接的长度短;可以在这个链接下面发现更多以此链接为开头层级更深的链接; 2、连接中一般包含blog字样; 3、blog的作者为方便他人订阅其Blog,都有类似:bloglines , rss feed 的链接。 不知道各位有没有更好的判断方法。 我现在正在以donews的 10 大金刚为起点,抓取其blogroll,收集blogge地址呢。  * 博客:飞雪残剑无间道http://www.donews.net/tycoo  *  * 博客:互联生活每一天http://www.donews.net/liuren  *  * 博客:对牛乱弹琴http://www.donews.net/keso  *  * 博客:胡一郎是谁http://blog.donews.com/fanggang/  *  * 博客:Xin观点http://blog.donews.com/panxin/  *  * 博客:温柔的人生http://www.donews.net/chinabright  *  * 博客:求缺草堂 伟大是熬出来的!http://blog.donews.com/zhongzhan/  *  * 博客:快马黑蹄SP踏乱,乐庭羌鼓IT迷离http://blog.donews.com/banly/  *  * 博客:努力谁不是历史怀胎的时代人物http://www.donews.net/chennian  *  * 博客:努力做一个最懂法律的IT人/最懂IT的律师http://blog.donews.com/yuguofu/ 最终的目的是,学习page rank算法,根据blogroll的链接做一个blog rank 的donews数据库。 希望这个可以作为keso的brand rank 的一个补充。 keso 现在的blog的回复量是:22063 ,可谓惊人。 keso的blog( include yesterday news )数量是:1986 , 平均每个blog  11个回复。
田春峰-JCJC错别字检测
2019-02-14
1.4K0
基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了
基于Java的开源 Carrot2 搜索结果聚合聚类引擎 2.0发布了. Carrot2 可以自动的把自然的搜索结果归类(聚合聚类)到相应的语义类别中,这个功能是通过Carrot2一个现成的组件完成的,除此之外Carrot2 还包括了很多其他的搜索结果聚合聚类算法 search results clustering algorithms 非常值得一看 . 今天10b lobster 和我聊起了新闻标题的平移算法, 如果这个算法被Carrot支持的话,应该是一个流行算法了。这个算法在卢亮的blog上曾经提到过。新闻阅读器也准备用这个算法进行新闻分类,提高新闻阅读速度。 Carrot2 2.0 的一个亮点是速度和易用性的提高。在易用性方面Carrot2提供了一个叫Aduna ClusterMap  的可视化组,这个组件被放到了可以单独运行的GUI程序中了,详见:standalone GUI application 。除此之外核心api也得到了简化,这里有 更多信息.  Carrot2 的流行还衍生了一家叫 Carrot Search 的公司,类似jboss ,mysql 相关的运营公司, 他们发布了发布了 Lingo3G ,可以想想出来了,Lingo3G ( 这个名字真酷 lingo  and 3g 呵呵 )-- 提供高性能的文档聚合引擎 ,这个引擎功能十分强进,他提供基于层级的,同义的 , 标签过滤的等功能。相比较 autonomy 还是有些差:
田春峰-JCJC错别字检测
2019-02-14
9010
Eclipse 升级管理器 TUM 发布了
Tikal ,是一家开源的开发工具提供商。最近发布了  Tikal Update Manager (TUM). TUM 是一个Eclipse 及其插件,工具的安装、升级管理器。
田春峰-JCJC错别字检测
2019-02-14
4570
神经网络翻译(nmt)框架 Marian : MarianNMT
出品方:the Adam Mickiewicz University in Poznań (AMU) and at the University of Edinburgh.
田春峰-JCJC错别字检测
2019-02-14
1.8K0
在线中文文字纠错错别字检测云服务
JCJC人工智能错别字检测系统( cuobiezi.net )上线已经15个月了。
田春峰-JCJC错别字检测
2019-02-14
8.3K0
Java 错别字检查接口 API
为了方便广大程序员朋友快速把错别字检查功能集成到自己的系统中,我们开发了一个支持HTTP协议的 Java 错别字检查接口 API,代码放在了 github 上 :
田春峰-JCJC错别字检测
2019-02-14
1.9K0
JCJC错别字检测新功能:检测日期格式
我们的网站: http://www.CuoBieZi.net ,希望大家能够喜欢。
田春峰-JCJC错别字检测
2019-07-09
7200
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档