首页
学习
活动
专区
工具
TVP
发布

祝威廉

专栏作者
308
文章
199614
阅读量
44
订阅数
如何三分钟部署好生产可用 Byzer
Byzer 提供了Docker,发型包,桌面版等各种部署方式,有的时候会让人乱花渐欲迷人眼,对新手而言会有不知所措。
用户2936994
2023-03-01
5000
如何统一数据分析入口
对于一个大企业,不同部门可能都有一个或者多个上面的物理存在。如何能够完整的关联这些数据进行分析,是迫切的需求。 再看第二点,众多的分析引擎,诸如Kylin, Presto, Spark, Doris, ClickHouse同时存在,从用户视角,用户可能为了解决不同的问题,看不同的数据,需要使用不同的引擎,难以有统一的使用入口,这对于企业而言,也是迫切需要解决的。 最后,企业希望不仅仅能处理散落在各个地方的数据,还能够在一个系统中看到这些数据的完整库表形态,并且能够通过虚拟视图方式构建更多的易于使用的数据集。这种虚拟视图需要能够支持底层是多类型数据源的。
用户2936994
2023-02-02
5310
Byzer 条件分支语法入门
在 Byzer 中,if/else 并非关键字,都是一个宏函数。既然是一个宏函数,那么为了符合 Byzer 语法规范,那么每个命令后面都需要添加';'表示这个命令的结束。
用户2936994
2022-09-28
3330
Byzer 模块化编程
所以在当面对很复杂的业务场景时,如何有效的复用,管理和维护 SQL代码是非常重要的。Byzer 很好的解决了这方面的问题。除了本篇模块化编程以外,相辅相成的还有一个能力,就是模板编程的能力: Byzer Man:Byzer 模板编程入门。
用户2936994
2022-09-28
9200
Byzer 模板编程入门
里面所有的字段其实逻辑是一致的,但是没办法,写SQL的同学要不断复制黏贴然后修改。当然了,写一次还行,问题在于你可能还要维护,该一个逻辑,比如把 then 1 改成 then2, 那就无数个地方都要改,痛苦不堪,代码量也大。那有办法解决么? 当然,Byzer 提供了多种方式解决这个问题。
用户2936994
2022-09-27
3720
Byzer + OpenMLDB, SQL Boy 也能玩好工业级机器学习
其实,原先 Byzer 就已经可以通过几乎不需要编程就能完成整个机器学习的Pipeline,从数据加载,清洗,特征工程,模型训练对外提供端到端的 API 服务。具体的能力可以参考这篇文章: Byzer 机器学习最简教程(无需Python!) 当然这个系列还有特征工程,深度学习等等介绍,感兴趣看看。
用户2936994
2022-07-21
4820
Byzer 语句执行原理解析
所以根据前面的描述,Byzer 在执行 第一条 load 语句的时候,此时情况是:
用户2936994
2022-07-21
4630
如何最快的完成一个Web产品的开发?
2020年春节回东北的路上凌晨四点多诞生了一个想法,然后就开始吭哧坑次设计开发,基于我以前开发的 ServiceFramework 框架,一个春节假期就迭代开发出了一套名为 web-platform 框架。 该框架包含三个部分:
用户2936994
2022-07-21
5790
如何将Python算法模型注册成Spark UDF函数实现全景模型部署
> 本文作者来自MLSQL社区 & Kyligence 机器学习平台工程师 Andie Huang
用户2936994
2022-07-21
7000
可编程的SQL是什么样的?
如果你使用传统编程语言,比如Python,那么恭喜你,你可能需要解决大部分你不需要解决的问题,用Python你相当于拿到了零部件,而不是一辆能跑的汽车。你花了大量时间去组装汽车,而不是去操控汽车去抵达自己的目的地。大部分非计算机专业的同学核心要解决的是数据操作问题,无论你是摆地摊,开餐馆,或者在办公室做个小职员,在政府机构做工作,你都需要基本的数据处理能力,这本质上是信息处理能力。 但是在操作数据前,你必须要学习诸如变量,函数,线程,分布式等等各种仅仅和语言自身相关的特性,这就变得很没有必要了。操作数据我们也可以使用 Excel(以及类似的软件),但是Excel有Excel的限制,譬如你各种点点点,还是有点低效的,有很多较为复杂的逻辑也不太好做,数据规模也有限。那什么交互最快,可扩展性最好?语言。你和计算机系统约定好的一个语言,有了语言交流,总是比点点点更高效的。这个语言是啥呢?就是SQL。
用户2936994
2022-07-21
6270
AI模型注册成MLSQL UDF函数示例
训练一个Tensorflow模型 下面的代码仅支持Console notebook模式下运行 首先,准备minist数据集 include lib.`github.com/allwefantasy/lib-core` where force="true" and libMirror="gitee.com" and -- proxy configuration. alias="libCore"; -- dump minist data to object storage include
用户2936994
2022-07-21
2600
MLSQL: 可编程的SQL
SQL简单易用,但是现在大家用的多了,也慢慢发现它还是存在诸多问题的。我们认为良好的编程应该是创建小型、可理解、可重用的逻辑片段,并且这些逻辑片段还要被测试、被命名、被组织成包,而这些包之后可以用来构造更多有用的逻辑片段,这样的工作流程才是合理又便捷的。更进一步的,这些“高阶”能力应该是可选的,我们总是希望用户一开始能用最简单的方式来完成手头的工作。尽管如此,现在的SQL并不能很好的支持我们前面提到的这些。
用户2936994
2022-07-21
6500
用MLSQL完成简书文章图片备份
我今天正好想做两个事,第一个是,我想把我简书内容备份下来,但是官方提供的备份功能只能备份成markdown,然后发现图片没办法备份。所以我需要把我简书里的所有图片下载下来。
用户2936994
2022-07-21
2330
MLSQL与JuiceFS在AI方向的整合畅享
RespectM同学在文章[MLSQL集成JuiceFs](16 - MLSQL集成JuiceFs)中,已经详细的讲解了如何整合两者。丢一个配置文件到SPARK_HOME/conf以及启动时带上SDK Jar就可以完美在MLSQL访问各种对象存储和HDFS了,这非常酷。
用户2936994
2022-07-21
4100
SQL 劝学篇
乘着AI这波东风,大部分媒体和机构,包括教育界都开始推Python了。不过值得欣慰的是,相比之前让非计算机专业科班的同学学C还是一个巨大的进步。我编程十多年,依然觉得C/C++好难,你让一个非计算机的同学学C/C++这不是扯淡么,严重阻碍了编程的普及。
用户2936994
2022-07-21
2740
MLSQL智能代码提示
MLSQL智能补全功能现阶段是作为MLSQL的一个插件的形式提供的。在发布第一个版本后,我们会将其独立出来,作为一个通用的SQL提示引擎来进行后续的发展。为了方便对该项目指代,我们后续使用 【MLSQL Code Intelligence】
用户2936994
2022-07-21
9870
SQL一秒变命令,分析师都爱哭了
简单解释下,表单交付是指将SQL语句转化为表单。在MLSQL里其实非常容易做到这点,基本不会遇到任何困难。表单交付是一个极为优秀的交付方式,用户得到不再是数据,而是一段计算逻辑,但用户看到的交互形态是表单,而且用户有一定的自由度。这个是我非常推荐的一种交付方式。
用户2936994
2022-07-21
2360
SQL复用告别拷贝黏贴!兄dei, 来看看
本文将介绍如何通过MLSQL将一条又长又复杂(子查询,Join以及重复片段满天飞)的SQL简化成萌新都能看懂的SQL语句。
用户2936994
2022-07-21
4740
给大家引荐下我的开源项目【们】
效率在我看来是至关重要的。关于我对效率的理解,还可以看看我这篇文章 【抖音短文】痛点不能驱动一切,效率驱动才是
用户2936994
2022-07-21
3640
让我们再探讨是【移动数据】还是【移动计算】
第一件事,是Spark 3.0 开始重构shuffle部分,用以支持remote shuffle。这意味着我们终于可以为shuffle专门准备一个存储集群了,比如一个单独的HDFS之类的。这是Spark架构前进的一小步,也是业界开始朝计算和存储分离走了坚实的一步。计算和存储分离的好处我们就不多讲,而计算和存储的分离的前提是内网速度要足够快,所以也意味着内网速度已经基本达到要求了。通过这个我是想告诉大家,内网已经足够快。就像5G足够快,会带来什么,很快就会有结果。
用户2936994
2022-07-21
3640
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档