最近在学习elasticsearch,作为一个萌新,对es的理解还仅仅停留在它的数据库功能上,更同时摆脱不了关系数据库的影响。在翻阅了es的入门书,看些网上博客学习es的同时,还是无法对es的优势有一个直观的看法,只是想开始写一些小程序练手。
1.安装好了VMware,配置好了CentOS,搭建了基于VMware的Elasticsearch集群。
2.因为它的高耗内存,我不得不将陪伴了我大学三年的电脑加装了内存条。
3.思考写一个什么样的我感兴趣的内容能发挥es的优势呢?--我想到了藏头诗
我并不打算做一个完全符合诗文规范的藏头诗生成器,我也无法做出来,本次只是实验性质的做一个至少读的通顺的藏头诗软件。
elasticsearch的优势在于它提供多种多样且快速的检索功能,同时提供强大的分词器可以帮助词项的提取,而这些正是藏头诗所需要的。
1:配好并选取合适的分词器和环境
2:编写爬虫,爬取大量的古诗文数据
3:通过es的分词器对词项进行查询,随机选取分词器给出评分最高的前20%或者其他值,随机各种各样的意象和词项,连在一起,就可以编写成一个最简单的藏头诗生成器了。
总的来说,从这个突发奇想的想法中,我认识到了es的运用场景是很灵活的,自带强大的查询能力让我们不需要再纠结于关系数据库的模糊查询功能,而这种查询是快速而便利的。
es是分布式的,屏蔽了底层,让我们在运用的过程中可以很方便的操作和扩展,是标准的分布式组件
es是不断更新和维护的,es在不断的更新中推陈出新,type这一与关系型数据库相对应的属性也即将取消,为了兼容,在我编写的7.1.1版本以"_doc"取代就是一个很好的例子,同时,方法不断的封装和建议不再使用也让我一时手忙脚乱。我也说不好这是好事还是坏事。
目前我对es已经经过了几周的学习,写完了一个有趣的小程序,因而在此做一个学习的总结。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。