这个系列主要是考虑,用户在自己电脑上装上MLSQL后,其实有点茫茫然不知道该干啥。 毕竟不像线上,有数据仓库,数据湖,各种数据源,可以随时加载玩一玩。 这个系列就是希望即使是自己的电脑,咱也能充分利用MLSQL帮助自己完成一些好玩的任务。
我把之前用来备份用的1T固态硬盘用来装Docker,所以现在,MLSQL终于又可以用Docker来体验了。
一行定乾坤:
bash <(curl http://download.mlsql.tech/scripts/run-all.sh)
请确保3306,9002,9003 端口没有被占用哦。
执行大概是这个样子的:
然后docker ps 下:
这样就表示成功了。
打开浏览器:
选择注册,然后使用gmail邮箱(乱写的gmail也行)。然后输入个密码,然后就进去了,进去后再刷新下页面:
进入的界面是这样的。
本地新建一个data.csv文件,内容贴上:
商品,销售数量
衬衫,5
羊毛衫,20
雪纺衫,30
裤子,36
高跟鞋,75
袜子,93
然后打开 Tools/Dashboard:
拖拽文件到这个上传框:
第一次会慢一点(大家耐心点,ORZ),
出现右侧的描述就表示上传成功了。MLSQL提供了命令行让大家管理自己的主目录(MLSQL是多租户,每个用户有自己的主目录)。执行一把提示的命令:
看到已经有这个文件了。现在我们用Load语句来加载这个文件得到一张表,
语句如下:
load csv.`/tmp/upload/data.csv` where header="true" as data;
输出如下:
对数据做点加工,CSV默认加载时所有字段都看成了字符串,所以我们做下cast,然后按销售数量做个排序:
select cast(`销售数量` as long) as sales,`商品` as itemName from data as newdata;
select * from newdata order by sales desc as output;
从上面可以看到,MLSQL允许将任何一个select语句看做一张表,然后可以被下面的语句引用,从而避免单个SQL语句过于庞大,简化了SQL的书写。最后输出结果如下:
MLSQL Console 支持选中执行哦。
下期我们会教大家如何利用Docker中的MLSQL 玩转Excel.
更多部署运行方式参考官方文档啦: