用户2936994

LV1
发表了文章

数据即索引-大数据索引漫谈

传统意义上的索引,目标是为了加快查询速度,但独立于数据,通常可以加载到内存,典型的比如B-Tree等。

用户2936994
数据库
订阅了专栏

腾讯云自媒体分享计划

3 文章3.2K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.2K 关注者
发表了文章

为什么需要一个聪明且强势的编译器

我从2005年开始学习编程。到现在为止的这段期间,我已经使用了非常多的语言。包括C, Java, Ruby,JavaScript, Groovy, Scala.

用户2936994
IDEScalaJava编程算法
发表了文章

How delta works

Most existing big data storages based on HDFS are lack of feature upsert(if exis...

用户2936994
JSON
发表了文章

Introducing Spark-Kafka integration for realtime Kafka SQL queries

Apache Kafka has been all the rage for the key join of the data pipeline. But in...

用户2936994
sparkKafkaSQL
发表了文章

数据SCT定律:存储,计算,时间

其实没有SCT定律,这个是我根据分布式CAP定律瞎造的。不过呢,从大数据这个行业来说,我们始终都是在存储,计算和时间进行权衡,博弈以及突破。某种程度上来说,当拥...

用户2936994
sparkMySQLSQLHBase大数据
发表了文章

MLSQL 内置Delta数据湖以及Compaction功能介绍

之前写过一篇文章 Delta的真正用处和价值,你可知道,该项目开源的那天我就集到MLSQL了。不过当时只是尝鲜性质,主要原因是因为我一直觉得delta缺了Com...

用户2936994
SQL机器学习神经网络深度学习AI 人工智能
发表了文章

多个不同类型对象如何统一JSon序列化小技巧

标题其实没说明白,就是假设我有四个不同类型的对象:A,B,C,D 但是呢,我序列化的时候不知道这对象会是哪个,反序列化的时候也不知道应该用哪个进行反序列化。

用户2936994
文件存储JSON
发表了文章

为 Delta 新增 Upsert(Merge)功能

今天花了一早上以及午休时间,终于把delta的Upsert功能做完了。加上上周周四做的Delta Compaction支持,我想要的功能基本就都有了。

用户2936994
SQLsparkPython
发表了文章

MLSQL Stack 让流调试更加简单

有一位同学正在调研MLSQL Stack对流的支持。然后说了流调试其实挺困难的。经过实践,希望实现如下三点:

用户2936994
KafkaSQL编程算法
发表了文章

try.mlsql.tech 上线,快来体验

好友借了一台服务器给我用,2核4G, 虽然配置有点低,但是已经超开心了,一直希望能搭建一个能运行一些简单脚本的服务,这样用户就不需要自己搭建了,但一直碍于现在服...

用户2936994
SQL编程算法访问管理
发表了文章

MLSQL Stack指南

用户2936994
SQL官方文档
发表了文章

The next goal of MLSQL Stack

MLSQL is a SQL-Based language and MLSQL Stack is a platform including many syste...

用户2936994
SQLAPIHTTP
发表了文章

Your Guide to DL with MLSQL Stack (3)

This is the third article of Your Guide with MLSQL Stack series. We hope this ar...

用户2936994
SQL编程算法
发表了文章

Your Guide to NLP with MLSQL Stack (一)

MLSQL stack supports a complete pipeline of train/predict. This means the follow...

用户2936994
SQLHTTP编程算法XMLPHP
发表了文章

Your Guide to Python with MLSQL Stack (二)

In the previous post Your Guide to NLP with MLSQL Stack (一), we already have kno...

用户2936994
SQLPythonHTTPJSON
发表了文章

Delta的真正用处和价值,你可知道

应该说,Delta是最近几年Databricks开源的最有价值的东西。Databricks这几年对外致力于AI,对内则努力给客户提供一站式分析处理平台。这个一站...

用户2936994
开源SQLspark存储
发表了文章

MLSQL 1.3.0开发版中最新三个MPIPs--调度,资源,缓存

MPIP 是新Feature提案。全称 MLSQL Project Improvement Proposals 。当然这个是学习Spark 的 SPIP,作为一...

用户2936994
SQL缓存sparkLinuxAPI
发表了文章

Rust FFI 实践

部门算法团队开始成长起来,开始有越来越多的尝试以及成果,但是现在工程方面严重的限制了(主要是做预测服务)他们的研究成果转化为实际输出的能力。去年下半年,我们就发...

用户2936994
编程算法Java

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券