祝威廉

211 篇文章
40 人订阅

全部文章

用户2936994

为什么需要一个聪明且强势的编译器

我从2005年开始学习编程。到现在为止的这段期间,我已经使用了非常多的语言。包括C, Java, Ruby,JavaScript, Groovy, Scala.

702
用户2936994

How delta works

Most existing big data storages based on HDFS are lack of feature upsert(if exis...

612
用户2936994

Introducing Spark-Kafka integration for realtime Kafka SQL queries

Apache Kafka has been all the rage for the key join of the data pipeline. But in...

481
用户2936994

数据SCT定律:存储,计算,时间

其实没有SCT定律,这个是我根据分布式CAP定律瞎造的。不过呢,从大数据这个行业来说,我们始终都是在存储,计算和时间进行权衡,博弈以及突破。某种程度上来说,当拥...

1264
用户2936994

MLSQL 内置Delta数据湖以及Compaction功能介绍

之前写过一篇文章 Delta的真正用处和价值,你可知道,该项目开源的那天我就集到MLSQL了。不过当时只是尝鲜性质,主要原因是因为我一直觉得delta缺了Com...

942
用户2936994

多个不同类型对象如何统一JSon序列化小技巧

标题其实没说明白,就是假设我有四个不同类型的对象:A,B,C,D 但是呢,我序列化的时候不知道这对象会是哪个,反序列化的时候也不知道应该用哪个进行反序列化。

1165
用户2936994

为 Delta 新增 Upsert(Merge)功能

今天花了一早上以及午休时间,终于把delta的Upsert功能做完了。加上上周周四做的Delta Compaction支持,我想要的功能基本就都有了。

1124
用户2936994

MLSQL Stack 让流调试更加简单

有一位同学正在调研MLSQL Stack对流的支持。然后说了流调试其实挺困难的。经过实践,希望实现如下三点:

783
用户2936994

try.mlsql.tech 上线,快来体验

好友借了一台服务器给我用,2核4G, 虽然配置有点低,但是已经超开心了,一直希望能搭建一个能运行一些简单脚本的服务,这样用户就不需要自己搭建了,但一直碍于现在服...

773
用户2936994

MLSQL Stack指南

862
用户2936994

The next goal of MLSQL Stack

MLSQL is a SQL-Based language and MLSQL Stack is a platform including many syste...

1076
用户2936994

Your Guide to DL with MLSQL Stack (3)

This is the third article of Your Guide with MLSQL Stack series. We hope this ar...

912
用户2936994

Your Guide to NLP with MLSQL Stack (一)

MLSQL stack supports a complete pipeline of train/predict. This means the follow...

1063
用户2936994

Your Guide to Python with MLSQL Stack (二)

In the previous post Your Guide to NLP with MLSQL Stack (一), we already have kno...

1114
用户2936994

Delta的真正用处和价值,你可知道

应该说,Delta是最近几年Databricks开源的最有价值的东西。Databricks这几年对外致力于AI,对内则努力给客户提供一站式分析处理平台。这个一站...

1124
用户2936994

MLSQL 1.3.0开发版中最新三个MPIPs--调度,资源,缓存

MPIP 是新Feature提案。全称 MLSQL Project Improvement Proposals 。当然这个是学习Spark 的 SPIP,作为一...

1063
用户2936994

Rust FFI 实践

部门算法团队开始成长起来,开始有越来越多的尝试以及成果,但是现在工程方面严重的限制了(主要是做预测服务)他们的研究成果转化为实际输出的能力。去年下半年,我们就发...

1572
用户2936994

MLSQL v1.2.0正式版发布

MLSQL v1.2.0发布时间距离上个版本v1.7.1.1 已经有接近3个月了。这次我们跳过了v1.1.8/v1.1.9 是因为我们会认为v1.2.0能作为第...

793
用户2936994

MLSQL 语法扩展设计

等几种语法。因为MLSQL为了简单起见,对扩展新语法是非常抵触的。比如,用户很希望能查看一张表的schema,在MLSQL中需要这么用:

690
用户2936994

FUSE(FileSystem in User Space) 对算法的价值

MLSQL 有一段时间致力于融合大数据平台和算法平台,实现 【同一个平台,同一个语言。】。事实上我们通过各种方式做到了,通过整合Spark ML,Spark M...

1040

扫码关注云+社区

领取腾讯云代金券