首页
学习
活动
专区
工具
TVP
发布

字根中文校对软件

专栏作者
188
文章
186106
阅读量
44
订阅数
Compass Framework 0.8 + Lucene Jdbc Directory (翻译tss)
发布者:Shay Banon on January 10, 2006 @ 08:24 PM
田春峰-JCJC错别字检测
2022-05-07
2350
ASP.NET 2.0 缓存翻译草稿
ASP.NET 2.0 缓存翻译草稿 命名空间: System.Web.Caching ,这个空间是ASP.NET的基础结构中的重要部分,比如:session就是存储在cache中的。 Cache
田春峰-JCJC错别字检测
2022-05-07
1K0
SQL语句优化
使用声明的方式来潜入sql到java编程。的确是个好主意。 select返回记录的顺序 http://voruta.sourceforge.net/ 看来,在这个层次上的编程 QDox and CG
田春峰-JCJC错别字检测
2019-02-14
1.7K0
Oracle PT of StatSpack
Statspack 是 Oracle 提供的一个实例级的Tuning工具。很多DBA都喜欢用这个工具来进行数据库的优化调 整。不过在交流中发现很多朋友对这个工具的的运用还有一些 问题。下面就其中比较容易出问题的几个方面进 行一下简单的分析。
田春峰-JCJC错别字检测
2019-02-14
5630
开放源代码数据库
目前开放源代码数据库的竞争者包括: PostgresSQL Postgres可追溯至1986年的加州柏克莱大学。该大学在1994年以BSD 授权方式将源代码开放给开源码社区,社区则加入了SQL 支持,然后一直研发该软件至今。部分原始源代码与设计依然留存至今,不论在Postgres或Informix数据库都还看得到,后者一开始就采用Postgres 的源代码,现在则由IBM 所有。Postgres是公认最先进的开放源代码数据库,但文件品质则相当受到诟病。 MySQL 瑞典的MySQL AB公司于1995年开始同时以开放源代码模式与商业授权模式来推出这种产品,该公司表示这种“双轨授权”策略有助于站稳财务基础,有利于未来持续改善数据库产品。MySQL 以100 名员工可称得上是全球最大的开放源代码数据库组织,号称有400 万安装基础,也被赞美为最好用的开放源代码数据库。该公司还提供另一个原本由ERP 大厂SAP 所拥有的开放原码数据库MaxDB ,并加以认证用在R/3 套装软件中。 Firebird Borland 于2000年将Interbase 关连数据库第六版的测试源代码公诸大众,使得它成为全球最新的开放源代码数据库。Firebird现在进入 1.5 版,优点是体积小,且SQL 引擎非常稳定。 BerkeleyDB 属于内嵌数据库,包括Apache、Sendmail、Mozilla 浏览器,甚至是Google都采用BerkeleyDB.EMC在部分储存装置上也有使用,而Sun 的 LDAP服务器则仰赖这套源代码。思科与索尼都仅是用户。号称拥有2 亿个部署基础,且跟MySQL 一样,都采双轨授权策略。 其他开放源代码数据库包括“hsqldb”与“Mckoi ”,两者都是全Java SQL引擎。eXist 则是原生XML 数据库;Backplane 则提供了有别于甲骨文网格解决方案的开放源代码替代选择。
田春峰-JCJC错别字检测
2019-02-14
1.3K0
(16)Shark工作流的实现和WMFC&OMG规范的对比
Shark工作流的实现和WMFC&OMG规范的对比 -----第十一部分:obe 引擎的ServiceManager 关键字:Shark 工作流 WMFC OMG 规范 <?xml:namespa
田春峰-JCJC错别字检测
2019-02-14
4010
(15)Shark工作流的实现和WMFC&OMG规范的对比
Shark工作流的实现和WMFC&OMG规范的对比 -----第十一部分:obe数据库设计的实现 关键字:Shark 工作流 WMFC OMG 规范 Obe 中主要得 实体类 如下: <?xml:
田春峰-JCJC错别字检测
2019-02-14
3230
sql语句的多种写法
Oracle Union All Query 根据指定ID,返回包含该ID的所有父级记录 一个DETAIL 表, item ,empid, money 1       001    100 2       001     150 ...    ...     ...
田春峰-JCJC错别字检测
2019-02-14
7540
怎么会是lucene?
在好朋友lhelper的帮助下,开始学习全文搜索引擎lucene了。从网上搜索了一些全文搜索的资料后发现这方面的产品很多,光是在http://www.searchtools.com 上你可以查到100多个搜索的工具(包括源代码)。如果你在百度上以“全文搜索”为关键字 搜索的话,会发现除了理论上的介绍以外,大部分的实例都是来自lucene。为什么只有lucene这么广为接受呢?
田春峰-JCJC错别字检测
2019-02-14
3460
mysql++ 自带的一些精巧演示例子
最近在工作的时候需要使用 mysql++ 来访问 MySQL 数据库,下载源码后看了一下,发现一些代码 非常优雅。 所以贴出来,和大家分享一下。 简单介绍一下 mysql++ mysql++ API 是一组访问MySQL的C++ API封装。主要目的在于把各种Query的操作和STL容器更好的结合。 mysql++ 可以在这里下载: http://www.mysql.com/download_mysql++.html mysql++ 的邮件列表是: mysql-plusplus@lists.mysql.com mysql++ API 的几个典型例子:
田春峰-JCJC错别字检测
2019-02-14
1.4K0
Hadoop Hbase适合存储哪类数据?
        最适合使用Hbase存储的数据是非常稀疏的数据(非结构化或者半结构化的数据)。Hbase之所以擅长存储这类数据,是因为Hbase是column-oriented列导向的存储机制,而我们熟知的RDBMS都是row- oriented行导向的存储机制(郁闷的是我看过N本关于关系数据库的介绍从来没有提到过row- oriented行导向存储这个概念)。在列导向的存储机制下对于Null值得存储是不占用任何空间的。比如,如果某个表 UserTable有10列,但在存储时只有一列有数据,那么其他空值的9列是不占用存储空间的(普通的数据库MySql是如何占用存储空间的呢?)。         Hbase适合存储非结构化的稀疏数据的另一原因是他对列集合 column families 处理机制。 打个比方,ruby和python这样的动态语言和c++、java类的编译语言有什么不同? 对于我来说,最显然的不同就是你不需要为变量预先指定一个类型。Ok ,现在Hbase为未来的DBA也带来了这个激动人心的特性,你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。         Hbase还有很多特性,比如不支持join查询,但你存储时可以用:parent-child tuple 的方式来变相解决。         由于它是Google BigTable的 Java 实现,你可以参考一下:google bigtable 。         下面3副图是Hbase的架构、数据模型和一个表格例子,你也可以从:Hadoop summit 上 获取更多的信息。
田春峰-JCJC错别字检测
2019-02-14
1.7K0
协同推荐系统简介
最近几年搜索引擎理念可谓渗入人心,对于互联网产品设计人员来说,张口必言搜索。同事基于搜索技术的各种产品也在Web2.0的浪潮下如雨后春笋,刷刷往 外冒。在这些林林总总的产品里面,几乎都能见到“ tag , 相关新闻, 相似产品 ” 类推荐链接的踪影。稍加留意这些产品的实现就可以发现,大多还是基于关键词的搜索机制实现的。很显然基于关键词技术的相关推荐是最直观的,似乎也是最有效 的一种实现方式,如同机枪中的AK-47,那他冲锋陷阵总是屡试不爽。 对于文字类产品的推荐,基于关键词的实现方式,目前还是主流;但在电子商务,智能阅读推荐,商务搜索方面单纯的关键字相关性实现机制还不那么让人满意,这也就有了协同推荐过滤系统。Collaborative filtering 。 所谓协同推荐,很显然弥补了单纯依赖关键词相关性的不足,把获取相关性数据的视角放大到数据从产生到消费的各个环节。 有2种最基础类型的协同推荐系统: 1 基于当前活跃用户 和 上一个用户的相似性 来进行分析(一般是计算用户购买或者感兴趣的商品来进行);侧重于用户 2 基于当前用户选择(或感兴趣)的商品 和 上一个用户感兴趣的商品的相似性来进行分析; 这也就是大家所熟知的user-based 和item-based协同推荐。 根据实现机制物理载体划分,以上两类协同推荐系统可以分为:内存型 和 模式型的协同推荐。一般内存型的都比较直观,适合于小型的数据集合,而模式型的一般都是利用 机器学习的方法,适用于大规模的数据分析,也可以称之为离线分析。模式型的是我比较关心的,因为做基于SEO的日志分析 ,比较适合。 我们在进行协同分析的时候,要考虑协同的意义。一般来说协同就是指多个用户或多个数据项的交叉作用。如果数据项较多的情况下,如何定义数据项的关系就是个重要问题了。 下面说一下协同系统的设计要素吧: 1 数据项 Item 2 项集合 ItemCollection 3 数据项的关系权重 DirectedEdge 4 数据项在数据集合中的存储方式 具体的算法实现过程,可以参考:Beyond Search 的推荐系统:关联规则(2)。我这里摘录如下:
田春峰-JCJC错别字检测
2019-02-14
6730
Scala 的数据库访问框架:Slick 3.0 移除了 session 相关的 API
Scala 的数据库访问框架:Slick 3.0 移除了 session 相关的 API Slick 3 对于 Slick 2 的改变相当于 Python 3 至于 Python 2 的改变。 Slick 3 的新特性集中在 :大量使用组合的设计模式,不需要显式声明session,非阻塞,stream支持的 reactive 等 。 不过我最喜欢这个方法: setFetchSize 。 具体来说: 在Scala slick 2.x 中: db.withSession{    implicit session
田春峰-JCJC错别字检测
2018-04-16
7320
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档