前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >在生成藏头诗的应用体会elaticsearch的运用场景

在生成藏头诗的应用体会elaticsearch的运用场景

原创
作者头像
逆回十六夜
修改2019-07-31 18:26:43
6170
修改2019-07-31 18:26:43
举报
文章被收录于专栏:逆回十六夜逆回十六夜

最近在学习elasticsearch,作为一个萌新,对es的理解还仅仅停留在它的数据库功能上,更同时摆脱不了关系数据库的影响。在翻阅了es的入门书,看些网上博客学习es的同时,还是无法对es的优势有一个直观的看法,只是想开始写一些小程序练手。

我经过了以下几个步骤:

1.安装好了VMware,配置好了CentOS,搭建了基于VMware的Elasticsearch集群。

2.因为它的高耗内存,我不得不将陪伴了我大学三年的电脑加装了内存条。

3.思考写一个什么样的我感兴趣的内容能发挥es的优势呢?--我想到了藏头诗

我并不打算做一个完全符合诗文规范的藏头诗生成器,我也无法做出来,本次只是实验性质的做一个至少读的通顺的藏头诗软件。

elasticsearch的优势在于它提供多种多样且快速的检索功能,同时提供强大的分词器可以帮助词项的提取,而这些正是藏头诗所需要的。

我将藏头诗的生成分为3步:

1:配好并选取合适的分词器和环境

2:编写爬虫,爬取大量的古诗文数据

3:通过es的分词器对词项进行查询,随机选取分词器给出评分最高的前20%或者其他值,随机各种各样的意象和词项,连在一起,就可以编写成一个最简单的藏头诗生成器了。

简而言之就是把各种各样的意象堆叠起来,这些意象很可能不相关联,让藏头诗显得很让人费解,而要想把这点处理好,就需要不错的语文基础和算法设计,我都没有。我的设计就是根据一个词项所处的句子中间随便选取另外一个汉字,查询生成新的词项,这样的话或许这个词项的意思会和前文有所关联。
简而言之就是把各种各样的意象堆叠起来,这些意象很可能不相关联,让藏头诗显得很让人费解,而要想把这点处理好,就需要不错的语文基础和算法设计,我都没有。我的设计就是根据一个词项所处的句子中间随便选取另外一个汉字,查询生成新的词项,这样的话或许这个词项的意思会和前文有所关联。
这是我实现以上3点后生成的藏头诗(虽然很差劲但也算“通顺”了)
这是我实现以上3点后生成的藏头诗(虽然很差劲但也算“通顺”了)

总的来说,从这个突发奇想的想法中,我认识到了es的运用场景是很灵活的,自带强大的查询能力让我们不需要再纠结于关系数据库的模糊查询功能,而这种查询是快速而便利的。

es是分布式的,屏蔽了底层,让我们在运用的过程中可以很方便的操作和扩展,是标准的分布式组件

es是不断更新和维护的,es在不断的更新中推陈出新,type这一与关系型数据库相对应的属性也即将取消,为了兼容,在我编写的7.1.1版本以"_doc"取代就是一个很好的例子,同时,方法不断的封装和建议不再使用也让我一时手忙脚乱。我也说不好这是好事还是坏事。

目前我对es已经经过了几周的学习,写完了一个有趣的小程序,因而在此做一个学习的总结。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 我经过了以下几个步骤:
  • 我将藏头诗的生成分为3步:
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档