00:00
那么接下来我们就快速的来。做一下案例,芒果DB跟其他的一个导入导出,那比如说我们来个啥呢。诶啊,应该在这面的,呃,B对塔差点PY-2MANGO DB reader-right,比如说写到HDFS,那我看看。这几个参数啊,那hdfs write咱们用过N次的,这个参数不用讲了,我们看芒GODB的,他要一个地址,这个就类似于咱们写那个JDBC地址一样,但它我们说它是一个no circle口,对吧,它并没有提供那种,它是直接通过呃IP跟端口去连接的,那接下来这个集合名是不是相当于一个表明啊,但是你看它这里很好玩。列名。DB内对吧,那用户名用户密码还是常规的几个配置,你按照他的来就行了呗,对吧。
01:07
那我们直接考吧。考过来是不是还得?改一下对吧,那hdfs writer咱们就不用再去看了,看了N次了啊看mango,呃,地址呢,是127.0.1是不是代表本机啊,这是本机地址对不对。那这个呢,27017是帮狗的默认天听端口啊,这个大家熟悉一下就行,嗯,那可以给大家瞅一眼,我其实刚才已经瞅了啊PGR-f mango。T。啊芒GOD啊四六四十四啊,这个命令大家应该知道吧,这个命令就等同于你这么写。
02:00
啊,你要这么写的话,是不是还蛮费劲的。对吧,这个是大家比较熟悉的,但这种咱们其实p gra就行了,加一个进程名就OK了,四六四十四,那然后我们看一下GRAPE46444,查看一下端口,大家可以发现它的端口是多少,27017啊这是默认的。他服务端默认的端口开放端口是27027。好,那这个我就不用动了,集合名艾特硅谷。数据库test,诶大家注意咱们这几个顺序是无所谓的,也就是说什么我把DB name这个写在第一个,把address放在最后一个,无所谓啊,这个无所谓,呃,艾特硅谷有吧,咱们是建了一个艾特硅谷啊,没错列呢。咱们好像只给了一个name对吧,那这个就不能给了。
03:01
好,我删掉了一个列啊,那么大家有疑惑了,为什么他又要写类型啊,因为人家是半结构化的。就没那么规范了,我无法明确的确定你是什么类型。所以这边你要也是像这种存储没规律的,你越是得明确的指定,你就记住这一点就行了啊,那列咱们指定了一个啊,集合名就表明艾特硅谷库名test啊,这没啥。又没密码,因为咱们没有配嘛啊,咱们没有加又没密码,所以这边不用啊,Writer这边得稍作修改对吧?首先这个列哎要对应上啊,我们只有一个name,那同样的,因为HDFS嘛啊,它是不明确的,所以你都得写啊,特别是类型一个列用一个大括号啊。地址name not的地址这一得改啊哈,18020分隔符,这这这个时候也不用分隔符就一列了呗,那不用动。
04:04
End追加啊,该目录CHANNEL1,好,就这样吧。诶哦不是,还好我想起来了。我这个是啥?我帮狗装在哈杜二上面差点忘了。YM job这个是什么?嗯,Mango DB two h dfs.Jason。好,保存退出,接下来执行就行了。b data差点py job mango。拒绝连接,因为咱们绑定的端口是多少啊,是127.0.0.1,这个是禁止外机访问的,我们把它绑定到其他地方吧,我稍作修改。
05:02
我们把这个服务端先停掉啊,之前是不是芒GOD端没有加任何参数啊,应该是有一个。我看一下吧,我忘了啊杠杠,Help,咱们瞅一眼是不是有N多个呀,我们只需要找到一个叫绑定IP的改一下就行了。啊,应该就是这个了啊,可以改端口,可以指定N多个东西,因为它没有配置文件嘛啊哎,你看这BY的IP,那就是杠杠败的IP啊。然后呢,给个什么0.0.0.0端口我不改了,还是27027是吧,回车。好了,这边。啊,又连上可以,那我重新执行一下,诶,关于127.0.0.1跟0.0.0,大家应该能理解吗?127.0.0是如果是这个IP的话,它只能是本机访问的。
06:09
那如果是全零呢,表示什么?不指定,只要我网卡配置所有的地址都可以用啊。说白了就是毫不限制,脱光光啊,什么也不限制对吧。不要因为它是一朵娇花而怜惜他。啊,行了,不啰嗦了,来走,你看现在不报错了吧?啊,这都是一些小常识啊。现在应该已经写完了。我们直接。mango.tst对吧,这边有了点一下看一眼应该是没问题啊。哎,没反应。这个不对呀,啊,我没刷新啊。
07:03
Yeah。吴彦祖。是谷彦组吗?我们统一确认一下吧,确认一下啊,DB点艾硅谷点find。啊,是吴彦祖啊,没错,没毛病啊。这个就是咱们导出到HDFS,那我们接下来瞅一瞅啥呢?导出到其他关键型数据库呗,那我们同样的先还是倒到买搜狗吧。杠二,My circle,其实这个都不用看,就reader刚才见过了my circle writer,咱们也熟啊。对吧,这还是DB的几个参数啊,那下面这个呢。买蛇的几个参数。其实这个插件只要写过一遍你就全懂了,哎,我看看。这应该有一个啊。
08:03
来把配置拷过来,删掉粘贴,你不要看它长,咱们需要做的事很少,对吧,因为很多都是固定格式,那像这里,呃,Mango DB reader,我是哈杜227027艾硅谷这个表明test这个库字段呢,只有一个。你要把ID同步过去也行啊,那writer my circle,呃,这边可以写个星,为啥呢?因为它是明确的对吧,明确的呃,连接配置my circlel do1那库呢,是咱们的data塔差表明。叫啥好呢?叫艾特硅谷吗?我叫mango吧,Mango同步过来的一张表啊,那用户名,密码,呃,类型插入好可以速率。一个并发好啊,但但是这个需要咱们什么先进表,先进表那我来见一下表啊,这是my circle。
09:08
呃,Create table mango,然后什么呢?Name ver,呃,20吧,填一个字段啊,叫mango好了,这个时候我们先查一下,现在是空的对吧?好了,准备好了。宝贝。Five am jobber mango TB two my circle店,Jason。好了,把它粘过来保存退出应该没啥问题了吧。这个比较简单啊,就不多啰嗦了。应该已经跑完了,来瞅一眼。是不是数据进来了就一条嘛,这个很简单一条。
10:05
那真的跑了十秒吗?不是啊,你看到源码就知道它这个是小于十秒,它就显示十秒啊,其实应该是瞬间就过去。你看他他连这这个都都是零啊,都是零,它会取整啊取整。嗯,应该是一秒都不到啊,一秒都不到。好,这个就是芒果啊,比较简单。
我来说两句