首页
学习
活动
专区
工具
TVP
发布

祝威廉

专栏成员
308
文章
212604
阅读量
45
订阅数
Byzer-LLM 利用大模型解决实际业务实战Demo
让每家公司都可以将自己的业务数据注入进商业或者开源大模型,完成私有化大模型应用。
用户2936994
2023-04-28
1.1K0
给大家引荐下我的开源项目【们】
效率在我看来是至关重要的。关于我对效率的理解,还可以看看我这篇文章 【抖音短文】痛点不能驱动一切,效率驱动才是
用户2936994
2022-07-21
4110
简单而又有效的设计才是好设计
Delta刚开源的时候我就去使用了一把,然后因为刚开源,很多功能还是缺失的,比如很重要的upsert/compaction 等。于是我就开发了
用户2936994
2022-07-21
1900
Meta(Facebook) 第三代 Notebook Daiquery 与 Byzer Notebook 对比
今天无意看到一篇文章,叫做SQL Notebooks: Combining the power of Jupyter and SQL editors for data analytics,在这篇文章里, Meta 介绍了自己的第三代 notebook 产品 Daiquery, 正如标题大家看到的,它的核心理念从一个以 Python 为主的 Notebook 转化成了一个以 SQL 为主, Python 为辅的 Notebook。 我觉得这是一个正确的进化路线。
用户2936994
2022-05-08
7870
谈在全场景下构建 Modern Data Stack
之前老板和我提到了国外的 Modern Data Stack 概念。三个字字字玑珠:
用户2936994
2022-04-25
4650
作为程序员的你,为什么会有【技术不重要论】
为什么上到老板,下到技术人员本身都会产生【技术不重要论】,比如在座的是不是都有(或者曾经有)这些想法: “技术是不重要的(这才是私底下真实的想法,别看在公开场合说的是哈)”,“技术难以形成壁垒”,“有钱叫几个程序员就搞出来了”,“挖几个人抄一下源代码,拷贝复制一下就行了”,“别跟我说工程,我听不懂”
用户2936994
2022-04-07
5100
Delta的真正用处和价值,你可知道
应该说,Delta是最近几年Databricks开源的最有价值的东西。Databricks这几年对外致力于AI,对内则努力给客户提供一站式分析处理平台。这个一站式的核心是,内核包含了流和批的真正统一,那什么才是真正的流和批的统一呢?
用户2936994
2019-05-14
8530
漫谈加持Blink的Flink和Spark
今天朋友圈有篇【阿里技术】发的文章,说Blink的性能如何强悍,功能现在也已经比较完善。譬如:
用户2936994
2019-02-27
1.2K0
高昂的PR,开源的困惑
我是个急性子,所以没怎么成功给社区提过PR,除非那个项目是我自己的,或者社区让我有直接Merge的权限。好比之前吐槽完SDL开发太慢后,自己直接fork了一份,然后在上面加功能。
用户2936994
2018-08-27
3860
StreamingPro-Editor, 基于Intellij Idea 的编辑器插件发布
StreamingPro在内部已经用在比较复杂的项目上了。所以导致配置文件巨复杂,之前同事提到这事,然后我自己把配置代码拉下来,看了下确实如此。一开始想着能否利用其它格式,比如自定义的,或者换成XML/Yaml等,后面发现JSON其实已经算是不错的了,项目大了,怎么着都复杂。后面反复思量,大致从编辑器这个方向做下enhance,可能可以简化写配置的人的工作量。所以有了这个项目。
用户2936994
2018-08-27
4210
开源选型中的基因论
如果能通过上面的几条,我么可能就会采用该套技术了。然而这往往会导致很多误用。比如很多人就把zookeeper当存储用了,因为倒也满足上面的一些需求。
用户2936994
2018-08-27
2330
ElasticSearch Rest/RPC 接口解析
早先ES的HTTP协议支持还是依赖Jetty的,现在不管是Rest还是RPC都是直接基于Netty了。
用户2936994
2018-08-27
2.4K0
这些年,我工作上走过的路
我走过了毕业季,创业征途,踏进开源之路,转型进入大数据,到最后有缘接触机器学习。每个章节,我都会提及对应那个阶段对技术的感悟,自己做的一些具体事情。
用户2936994
2018-08-27
9821
如何让开源项目成为你的良师益友
现在大部分公司产品的基石都是开源项目,从开发包到产品本身。我甚至在想,没有开源项目的世界将会是一个什么样的世界。互联网的共享精神让互联网得以如此的快速的发展。
用户2936994
2018-08-27
2290
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档