温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
同学们大家好,我是上硅谷的海波老师,今天我们来一起学习一个分布式免费开源的搜索分析引擎,它的名字叫elastic search,从名字上来看,Elas的含义,它表示可伸缩、灵活的意思,那么search呢,表示查询的意思。所以咱们接下来学习的这个引擎的核心其实就是查询。在互联网当中,我们的查询的信息主要包括文章、视频、图片、网站信息等等。那么传统意义上,根据数据的格式,我们会将数据分为三个大类,第一个结构化数据,第二个非结构化数据,第三个半结构化数据。那么所谓的结构化数据呢?我们一般会用特定的结构来组织和管理数据,它一般表现为二维的表结构,大家看看。那比如我们用户数据啊,其中包含了我们用户的姓名啊,年龄啊,还有身份证号等信息,这些信息是有关系的,所以我们可以保存到关型数据库当中,比方说my circlelel Oracle当中,并可以通过circle语句来进行查询。为了提高效率,我们甚至可以采用一些索引的方式来优化查询,对不对?所以它的优点呢,就是方便管理,方便查询。但是它其实有些缺点,最起码我要扩展结构是很难的,当我们已经有现有的结构之后,我们再去扩展其实不方便,对不对?哎,是这个样子啊,这是我们的结构化数据。好,那么我们下面看到叫非结构化数据,所谓的非结构化数据呢,其实就是我们无法用二维表结构来表现数据的这种数据,那比方说我们的服务器日志啊,我们的通信记录,我们的工作文档,包括报表啊,还有一些我们视频,我们的一些图片,这样的一些数据呢,它的维度广,数据量大,所以数据存储和查询的成本其实是非常大的,往往需要专业的人员和大量的统计模型来清。
01:42
库里一般会将这样的数据保存到no circle数据库当中,比如mango DB red space,那么这样的数据库一般都是以KV结构来进行保存的,那么通过key来查询我们的数据相对来说比较快,对吧?这是我们的非结构化数据啊,那么我们的半结构化数据呢?就是说将数据的结构和内容混在一起,它没有明显的区分,那这种情况呢,比如我们的叉L,我们的HTML这样的文档其实就是我们的半结构化数据,这样的数据一般也都是保存到mango DB red space这样的数据库当中,它的缺点就在于我们查询它的内容其实不是很容易,那生活中很多场景下,我们搜索的对象并非都是关系型结构化的信息,我们无法像数据库模糊查询那样模糊匹配,更不可能便利所有的内容做匹配,毕竟查询的目的是为了快速找到你想要的信息,对吗?那所以呢,对如何查询结构化数据以及非结构化数据当中的内容,并且准确的查询是非常。
02:42
重要的啊,接下来我们所学习的ES软件就是为了解决这样的问题所产生的软件。随着5G时代的到来,海量数据充斥着我们生活的方方面面,实时数据的采集、分析、存储就是计算机数据处理技术未来发展的方向,而我们要学习的E设置在这些方面表现是非常抢眼的,所以我们要持续的关注下去,看看它能够给我们带来哪些惊喜。那接下来我们就一起来走入以来search的世界,感受它的魅力。
我来说两句