祝威廉

200 篇文章
38 人订阅

全部文章

用户2936994

Your Guide to DL with MLSQL Stack (3)

This is the third article of Your Guide with MLSQL Stack series. We hope this ar...

732
用户2936994

Your Guide to NLP with MLSQL Stack (一)

MLSQL stack supports a complete pipeline of train/predict. This means the follow...

893
用户2936994

Your Guide to Python with MLSQL Stack (二)

In the previous post Your Guide to NLP with MLSQL Stack (一), we already have kno...

1014
用户2936994

Delta的真正用处和价值,你可知道

应该说,Delta是最近几年Databricks开源的最有价值的东西。Databricks这几年对外致力于AI,对内则努力给客户提供一站式分析处理平台。这个一站...

824
用户2936994

MLSQL 1.3.0开发版中最新三个MPIPs--调度,资源,缓存

MPIP 是新Feature提案。全称 MLSQL Project Improvement Proposals 。当然这个是学习Spark 的 SPIP,作为一...

883
用户2936994

Rust FFI 实践

部门算法团队开始成长起来,开始有越来越多的尝试以及成果,但是现在工程方面严重的限制了(主要是做预测服务)他们的研究成果转化为实际输出的能力。去年下半年,我们就发...

1022
用户2936994

MLSQL v1.2.0正式版发布

MLSQL v1.2.0发布时间距离上个版本v1.7.1.1 已经有接近3个月了。这次我们跳过了v1.1.8/v1.1.9 是因为我们会认为v1.2.0能作为第...

743
用户2936994

MLSQL 语法扩展设计

等几种语法。因为MLSQL为了简单起见,对扩展新语法是非常抵触的。比如,用户很希望能查看一张表的schema,在MLSQL中需要这么用:

620
用户2936994

FUSE(FileSystem in User Space) 对算法的价值

MLSQL 有一段时间致力于融合大数据平台和算法平台,实现 【同一个平台,同一个语言。】。事实上我们通过各种方式做到了,通过整合Spark ML,Spark M...

870
用户2936994

用MLSQL完成简书图片备份

我今天正好想做两个事,第一个是,我想把我简书内容备份下来,但是官方提供的备份功能只能备份成markdown,然后发现图片没办法备份。所以我需要把我简书里的所有图...

652
用户2936994

MLSQL Cluster 多Engine管理设计

我之前写了篇很简单的去描述了MLSQL Cluster 路由策略。有朋友就问,有没有一个更清晰一点的设计说明。这篇内容就是为这个目标而写的。

692
用户2936994

对技术负债,技术和业务权衡和重构,重写,升级的一些看法

在技术圈,有一个债务术语叫【技术负债】或者【技术债务】。【技术负债】带来的显性和隐性成本是非常高的。

551
用户2936994

MLSQL如何帮助分析师更高效

迄今为止,在之前文章提到的所有功能点,都已经在MLSQL中实现。当然,拥有这些还是远远不够的,因为SQL语言自身的设计和用途上的限制,导致做很多事情还是会有点力...

511
用户2936994

MLSQL数据源开发指南

那么我们如何实现自己的数据源呢?下面我们会分两部分,第一部分是已经有第三方实现了的标准Spark数据源的集成,第二个是你自己创造的新的数据源。

882
用户2936994

MLSQL Cluster 路由策略

MLSQL Cluster 具备多MLSQL Engine 实例管理功能,实现负载均衡,多业务切分等等功能。

592
用户2936994

MLSQL 编译时权限控制

权限控制,对于MLSQL而言的重要程度可以说是生命线。 MLSQL需要面对各式各样的资源访问,比如MySQL, Oracle,HDFS, Hive,Kafka...

874
用户2936994

MLSQL 真香(尝鲜版)

MLSQL 目前已经初步有一套Web Console 供使用。界面相对来说也比较清爽。我们先来看看一个尝鲜版本。

963
用户2936994

再谈数据中台是什么以及MLSQL为什么可以作为数据中台

昨天还是前天,正好看到朋友圈里大家都在发AI前线推的一篇文章。数据中台已成下一风口,它会颠覆数据工程师的工作吗?, 个人认为风口谈不上,但是确实是技术发展到一定...

1412
用户2936994

手动安装和启动MLSQL三套件

创建MySQL数据库,根据 src/main/resources/db.sql创建对应的库表。数据库名字为mslql_cluster.

972
用户2936994

数据部门起步阶段需要建立数仓么?

之前我写了一篇关于数据中台和数仓的关系 的文章,里面理清了数仓和中台的关系。后面我了解到更通用的技术词汇去表达数据管理的两种方式: 数据联邦和数据仓储。

1043

扫码关注云+社区