00:00
好,这是我们刚才所做的操作是吧,其中还有是并have,然后你要查看数据库啊,或者说使用数据库啊,查询表啊,然后创建一个表啊等等啊都可以,可以查询一个表啊,退出的话是。亏,或者说exist不是exist exist存在是吧,喜欢说说exist,好,接下来我们看这个案例,将本地那个文件导入汉,导入汉文,因为如果说你处理大数据,通过这个音色的音into这种方式来插入啊。那不太靠谱吧,对吧,太慢了,你这查到什么时候去啊,太慢了,那肯定是已经存在好的文件,那我们给他什么直接导入进去,然后你能插,这是如果能实现这个功能那就很好了,是吧?哎,接下来我们就实现这个功能,那既然你要插入的话,你首先要准备数据嘛,还要准备数据,那我们再开一个窗口,我们以后的数据都放在哪呢?放在这。
01:06
然后我们make Di一个data啊,就专门放数据的,你就后面做项目也好,或者什么东西也好,你就把数据放在这个地方统一管理一下,我们CD到这个里边。我们直接VI一个student.txt到时候我们就把这个本地的这个文件啊,给它导入到我们那个student表里边可以吧,好,那这里面我们写什么内容呢。幺,这刚才是有已经有幺了是吧,作为方二还是什么,注意我这个地方写的是推抱线啊。就是这个中间的空,我们用的是推广杠T杠铁啊,然后还有谁啊,还有谁有言咱班的吗?再再来一个,还有还有谁冰冰是然后再来一个,还有谁胖是啊不是,那上面是不是平啊,OK,三个够了,OK,那数据已经有了,在这,而且中间是用当性分割的,你这知道,然后我们需要把这个数据加载进来,那当然这个语法呢,大家现在还没学啊,我首首先我给它抄一下啊叫。
02:33
加载数据是的吧,加载吗的的电啊,这加载数据,然后是local pass从本地加载,那既然有local还有什么不带local的吧?那不带local的应该从哪加载啊。对HDIY加等啊HD加等快。我们的路径往哪一下不PWD这个地方,然后是什么结问呢?点TSG.tsg,然后a two table,你要导入到哪张表,是不是student这张表啊,OK,找一下它显示导入成功了,对吧?导入成功了,那我们查一下吧。
03:23
的心from student1查发现全当了。全面弄这说明还是有问题的吧,那这种导确实能导进来,就数据他也读到了,他也读到了,是三行也没问题吧,就是数据它字段没对应上,是不是这种感觉啊,没对应上它就忘了,这是因为它文件存储格式跟表,我们讲了,表跟文件它有中间还有一个元数对吗?它这个对应关系出了问题。
04:01
就他这个对应关系出了问题。那我们要对这个表进行一个改一下啊,怎么改呢?我们先把这个表删了吧,Drop table呢。刚才我们创建的表是不是最简单的那种方式?Student,然后跟着一个ID,然后是然后有一个name是string啊,这个没问题。然后我们就求分号结束了吧,算啊,注意这个地方我刚才特意强调的,我们刚才写的是杠T分割的嘛,你要在表数据啊,就是你建表的时候是不是就等于创建表的原数据信息啊,你在创建表的时候,你要指明你将来访问的这个文件啊。它中间的字段之间的分割符是什么?你要把这个给它写进去,那这个怎么来呢,是若。
05:09
加一个分号的的,就是每行的一个格式化吧。然后是什么意思啊。限制吧,哎,是做一个限制,它这个限制是什么呢。Feel字段的限制对吧,字段不字段嘛,然后是。Terminated by这个如果你忘了,像这种单词比较长是吧,忘了的话a table是可以提示的,你知道吧,它客户端上面提示的terminated by是什么意思啊,按什么分割吧,那我们加上我们的一个杠T吧,我们刚才那个数据就这个student.txt,是。中间的数据按杠T分割的吧,那你这个地方就指定一下,你在创建原数据信息的时候,其实创建表也等于创建了它的一个整个的原数据信息。
06:07
创建原数据信息的时候,你就告诉这张表你读进来的数据啊,它是按杠体进行分割的,钢筋进行分割的,走下创建成功了,创建成功了,那这个时候我们再把数据加载进来,然后是什么,然后是跟上我们具体的路径吗?对这款里面的一个单引号或者双引号是都可以的。然后是点TX,为了刚才的区分,我还是改成双引号是吧,要不然有的人怀疑是刚才的双引号出了问题是吧?我要控制一下变量是吧,一次少改点东西,我现在改的就是加了一个这么多是吧,我不能再改这个引号了是吧?再改有的就不好说,到底是这个引号问题还是这个问题是吧?啊,所以我先过了一下啊,到时候咱们可以再单独试一下这个单引号的问题可以吧,然后这后面写什么into table,然后是student,这张表总体好,然后写新。
07:20
F。看是不是就有三条数据进来了呀,这样就是说你在创建这个原数据信息的时候,你就要告诉将来你在这个表里面。你表创建原数据信息的时候,是创建表的时候,等于台,然后你将来你这个漏。是不是其实就是把数据放到HDFS?对吧,你就要告诉他中间这个元数据是怎么对应的,你中间是采用什么来分割的,那你在创建元数据,也就创建表的时候,你就要指明这个分割符是什么。
08:01
啊,你要做好这个原数据的一个映射。做好这个关系,那这样之后,哎,我们就能实际的把数据加载进来,加载进来。
我来说两句