首页
学习
活动
专区
工具
TVP
发布

字根中文校对软件

专栏成员
188
文章
193958
阅读量
44
订阅数
Lucene 1.9 改进特性列表
注:lucene2.0发布版本并不是100%的和 1.4.3 版兼容。也就是说在你用2.0版本的Lucene开发包替换原来的1.4.3版本时,应该让你的应用程序首先和1.9的兼容。
田春峰-JCJC错别字检测
2022-05-07
4000
JCJC错别字检测系统API接口使用文档-错别字检测接口说明
一、JCJC错别字检测支持:JSON POST 和 表单 FORM POST 两种方式
田春峰-JCJC错别字检测
2021-12-06
6700
AOP 面向方面编程的介绍----基本概念(2)
面向方面编程的介绍----基本概念(2) <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> AO
田春峰-JCJC错别字检测
2019-02-14
4080
J2SE1.5的新特点(之二)
J2SE1.5的新特点(之二)<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> <?xml:na
田春峰-JCJC错别字检测
2019-02-14
3190
J2SE1.5的新特点(之一)
J2SE1.5的新特点<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> <?xml:namesp
田春峰-JCJC错别字检测
2019-02-14
5130
使用反射在NET中实现动态工厂(第一部分)
使用反射在NET中实现动态工厂<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> 出处 http:
田春峰-JCJC错别字检测
2019-02-14
4600
规范子系统间数据调用的重要性
规范子系统间数据调用的重要性 ------从子系统间数据交换的角度看软件的效率和代码的可维护性及其他 <?xml:namespace prefix = o ns = "urn:schemas-micr
田春峰-JCJC错别字检测
2019-02-14
7530
一段让我吃惊的javascript代码。(就两句) 发送键盘命令生成get set脚本。
本文分2部分: 第一部分: ????在IE中拷贝文字到剪贴板,微软使用了2种剪贴板模式:字符模式和html模式。?如果我们从IE中选定一些内容拷贝到写字板,通常就丢掉了html的标签。如果你想得到ht
田春峰-JCJC错别字检测
2019-02-14
9570
java 线程阻塞的问题
中断线程最好的,最受推荐的方式是,使用共享变量(shared variable)发出信号,告诉线程必须停止正在运行的任务。线程必须周期性的核查这一变量(尤其在冗余操作期间),然后有秩序地中止任务。结合:使用Thread.interrupt()中断线程
田春峰-JCJC错别字检测
2019-02-14
9700
正则表达式和有穷机
     说起正则表达式,说起来开心,用起来头疼。比Perl的语法还要难受。     比如:             要匹配类似(a+(a+a)+(a))这样的表达式,             你觉得
田春峰-JCJC错别字检测
2019-02-14
3820
C++/CLI 简单介绍
托管的C++(MC++)饱受诟病的一个地方就是语法格式和普通的编程语言差别很大,很多人都评价为: ugly 和 twisted 语法。
田春峰-JCJC错别字检测
2019-02-14
1.1K0
如何判断一个图是稀疏的还是稠密的
    决定我们采用邻接矩阵还是采用邻接表来表示图,需要判断一个图是稀疏图还是稠密图。邻接矩阵和邻接表表示图所需的存贮空间和算法时间度相差非常大,所以判断一个图是稀疏的还是稠密的非常重要。
田春峰-JCJC错别字检测
2019-02-14
5.1K0
计算所汉语词法分析系统ICTCLAS 字典格式解析
这段时间小叮咚分词模块基本上没有什么大更新了,不是不想更新,而是感觉好像碰到了天花板,不知道该如何进一步拓展分词的功能了。当然分词不是目的,只是为了让小叮咚理解自然语言的一步必须的中间环节。我对小叮咚的定位是一个智能知识问答系统。这样让小叮咚理解用户输入的内容是最基础也最关键的一步。我们学习一门语言,首先要了解句子的构成,句子的成份,主、谓、宾、定、状、补等等。让机器理解人的语言,也应该采取大致的步骤。
田春峰-JCJC错别字检测
2019-02-14
8570
mysql++ 自带的一些精巧演示例子
最近在工作的时候需要使用 mysql++ 来访问 MySQL 数据库,下载源码后看了一下,发现一些代码 非常优雅。 所以贴出来,和大家分享一下。 简单介绍一下 mysql++ mysql++ API 是一组访问MySQL的C++ API封装。主要目的在于把各种Query的操作和STL容器更好的结合。 mysql++ 可以在这里下载: http://www.mysql.com/download_mysql++.html mysql++ 的邮件列表是: mysql-plusplus@lists.mysql.com mysql++ API 的几个典型例子:
田春峰-JCJC错别字检测
2019-02-14
1.4K0
基于最长词匹配算法变形的分词系统( 文舫工作室贡献 )
    这个分词程序是文舫工作室贡献出来的。     强烈推荐看看文舫工作室的开发日志,他们的激情可以鼓励很多人......         自从小叮咚分词程序发布后,很多软件行业的朋友们都来信索取,因为定位的问题,所以小叮咚的分词程序和 ICTCLAS的算法完全不同的。     小叮咚的分词程序的定位是为搜索引擎服务的。可以参考:一种面向搜索引擎的中文切分词方法     ICTCLAS和基于最长词匹配算法变形的分词系统 是面向语法,语义的。     不同的应用导致了不同的分词算法,但是正如车东所说的,我们现在应该跳过分词这个点,面向分词应用了。     我很赞同。     如果大家需要 基于最长词匹配算法变形的分词系统 的代码,可以到这个页面下载申请书,填写后我会给你     发送一份相关代码。      关于分词文德是专家,大家可以下载 Lucene使用者沙龙 中的录音,听听他对分词的一些经验。     这些申请书会在以后整理出来共享的。     相关连接: 文舫工作室的网址 Lucene使用者沙龙
田春峰-JCJC错别字检测
2019-02-14
5340
Boyer-moor 字符串搜索算法
    最近因为需要从大量的文本中检索字符串,于是想比较一下java jdk提供的 indexof 算法,和其他字符串搜索算法的效率。字符串搜索算法有多种,其中比较有名的是boyer-moore算法。在Moore 先生的主页上有关于 boyer-moore算法的详细介绍。     moore先生介绍的通俗易懂,相信大家都能看明白。
田春峰-JCJC错别字检测
2019-02-14
7460
中文分词和二元分词综合对比
    为了测试中文分词和二元分词的差异,现将初步的测试数据做了对比。关于二元分词可以参考车东先生的相关文章。
田春峰-JCJC错别字检测
2019-02-14
8380
C++ 初始化和赋值的不同
c++中初始化和赋值操作差别是很大的。 对于基本数据类型差别不大: 比如:
田春峰-JCJC错别字检测
2019-02-14
9220
MapReduce:Google的人间大炮
    对goole这样需要分析处理海量数据的公司来说,普通的编程方法已经不够用了。于是 google开发了MapReduce。简单来说,语法上MapReduce就像Lisp,使用MapReduce模型你可以指定一个Map方法来处理诸如key/value这样的数据,并生成中间形式的 key/value 对,然后再使用 Reduce方法合并所有相同key的中间 key/value 对生成最终结果。google的MapReduce是运行在数千台机器上的处理TB数据的编程工具。
田春峰-JCJC错别字检测
2019-02-14
3820
网页切片算法的若干问题
这是我研究网页切片算法的一个汇总想法。     之前我写过:一种面向搜索引擎的网页分块、切片的原理,实现和演示 ,随着工作的深入,逐渐碰到以下问题: 网页切片的粒度问题:            网页切片算法的目的不是精确找到所需要的内容,而是识别划分网页的各种功能区域,导航区,链接区,内容,页脚区和广告区等。   网页切片的网页对象:           互连网纱功能的网页大概有2种类型,目录型和内容型;随着搜索引擎的发展,网站结构逐渐向扁平化的方向发展,车东 对此也做出了数据验证,而且随着显示器分辨率的不断提高,内容和目录结合型的网页呈增加趋势,天极的网页涉及,可以说是其中的典范。    网页切片算法的对象应该是针对:内容型和内容目录混合型。对不同网页,应该有个识别算法,应该包括哪些标准?     网页内容区最大范围识别:            从切片的粒度可以看出,应该把内容区作为一个部分单独切出来。根据一般的网页设计规律,一般有2种容纳内容区的方式:1、包含型(如blog ) 2、并列型(如bbs帖子)。     如果处理分页的内容型网页:            现在大多数网站为了改善用户体验和增加页面展示次数的需要,对网页做了分页处理,这部分需要设别出来。     无意间看到了:VIPS:基于视觉的Web页面分页算法 ,从理论上证明了这种方法的可行性。可是实现起来有很多障碍,正如这位所说的:
田春峰-JCJC错别字检测
2019-02-14
6030
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档