首页
学习
活动
专区
工具
TVP
发布

鸿的学习笔记

专栏成员
330
文章
293016
阅读量
49
订阅数
SQL Notebooks:一种新的设计理念
最近读到 Meta (前Facebook)公司发表的一篇文章,是介绍他们自己使用的 SQL Notebooks。在文章里,他们认为应该以 SQL 为核心去设计 Notebook,而不是像 Jupyter 那样以 Python 为核心设计 Notebook。
哒呵呵
2022-06-08
5080
Python3.7 迎来了终结。
今天浏览 Apache Superset 的 GitHub 时,发现UPDATING.md中间有一项是Removes Python 3.7 support.。
哒呵呵
2022-06-08
6650
半年后,再谈 Python3.10
2021 年 10 月 4 号,Python 官方正式发布了 Python3.10.0(https://www.python.org/downloads/release/python-3100/)。当时在忙着大数据相关的工作就没有写文章聊聊这个版本。就以这篇文章来简单聊聊。
哒呵呵
2022-04-14
6880
闲话 Spark 的一个重要改变
最近看到了 Apache Spark 发布了 3.2 版本的预告 Pandas API on Upcoming Apache Spark™ 3.2,文章写得很简单,但是体现了 Spark 的一个很重要的发展趋势,就是拥抱 Python 的数据科学社区。
哒呵呵
2021-10-19
7310
Python 的新特性-模式匹配
经过两三年,Python 终于出了一个值得写一写的特性。从 Python3.6 开始,Python 的语法层面的改动一直都没有发生大的改变,直到最近的 PEP622,也就是模式匹配。对于模式匹配的这个语法而言,第一次接触是在学习Scala的过程中,这是一个非常好用的特性,可以极大的改变 if/else 的写法,让代码写的更加优美。举个例子,比如我们要匹配Http状态的话,没有模式匹配的,使用if/else的话,会写成下面这样:
哒呵呵
2021-03-16
1.1K0
关于编程语言的一篇闲笔
在电脑面前发了一会呆,发现不知道写些啥了,思来想去,那么便写写在平时在数据处理过程常用的三门编程语言吧。这三门编程语言分别是 Python、Scala 和 Java。
哒呵呵
2020-08-10
4670
Python 之父说 Python 历史
这篇文章主要内容来源于 Python 编程语言的最初设计者及主要架构师 Guido van Rossum 的博客 The History of Python(http://python-history.blogspot.com/)。博客文章不多,只有32篇而已,但是 Guido van Rossum 在这个博客里叙述和解释了 Python 一些重要特性的发明历史和这个特性诞生的原因,比如为什么 Python 会叫 Python,Python 为什么会使用缩进区分编程语句等等,有些特性很平常,而且替代选择也很多,至于为什么会选择其中一个,使用者往往不好回答,而对于最初设计者而言,却轻而易举。
哒呵呵
2020-07-09
9450
闲聊数据交换的历史和现状
IBM 在 1960 年代发明了数据库,也就是 SystemR 。过了一段时间到了 1970 年代,数据库里面有了足够多的数据后,自然而然就有了数据交换(data exchange)的需求。1972 年 IBM 的 Fortran 编译器开始支持以逗号为分隔符的 CSV 文件格式为核心进行数据交换,于是由数据库导出数据到 CSV 格式文件,或者由 CSV 格式文件导入数据到数据库便成了数据交换历史的开端。
哒呵呵
2020-02-11
1K0
EasyDB:无需服务器,一键创建的数据库
博主在阅读2019年11月22日这一期的 DB Weekly 的时候,注意到一篇关于数据库的文章,感觉非常有趣,分享给读者们。
哒呵呵
2019-11-29
2.1K0
Koalas,构建在 Apache Spark 之上的 Pandas
今天和大家简单聊下 Koalas 。简而言之,Koalas 试图在 Spark 之上提供一个和 Python 的 Pandas 一样接口的包。笔者在第一次接触到 Koalas 时非常惊艳,因为这意味着 Python 数据科学领域的生态圈里很多常用的包都可以直接应用在 Spark 之上,使分析师、数据科学家可以使用自己熟悉的工具操作大数据,而不需要重新学习。简直就是 killer package!
哒呵呵
2019-11-19
1.1K0
深入分析Python的内存机制
当一个程序需要处理成千上万的object时,为object选择合适的数据结构减少内存的占用量就成了一个很重要的问题。 毕竟一台服务器的内存终究还是有限的。本文就是要简述在不同的数据结构下,一个单独的object的占用多大的空间,从而得出减少程序内存占用量的方案。
哒呵呵
2019-07-17
1.1K0
2019-03-31的一周好文推荐
https://kudu.apache.org/2019/03/19/testing-apache-kudu-applications-on-the-jvm.html
哒呵呵
2019-04-26
3830
一周好文推荐
微信公众号除了服务号以外,都不支持外部链接,建议读者复制链接在浏览器打开。 实现灾备的几种办法 https://www.cockroachlabs.com/blog/why-do-database-
哒呵呵
2019-04-26
3470
一周好文推荐
这是一个新的尝试,分享这一周遇到的好文章和简要的评论。 Prometheus 和 Flink 搭配使用 https://flink.apache.org/features/2019/03/11/pr
哒呵呵
2019-04-26
4030
2018年那些值得推荐的计算机类书籍
当之无愧的2018第一神书,虽然出版时间略晚,后发亦可先制。读此书之前可以先读《Streaming 101》和《Streaming 102》预热。《Streaming Systems》沉淀了谷歌过去十多年对流、批计算的思考,前半部分主要阐述了Dataflow模型,提出流计算不确定性和可靠性的有效解决方案,把批处理统一吸纳进同一套框架,后半部分叙述了Streaming SQL的可行性。这本书的也是大热的 Flink 和Structural Streaming 的理论基础。
哒呵呵
2019-03-14
1.1K0
聊聊在Python如何实现并行
何为并行和并发Python有哪些相关的模块该如何选择合适的模块CPU-bound和I/O-bound问题threading、asyncio和multiprocessing优劣抉择结论
哒呵呵
2019-03-01
8010
Python3.7的进化-异步编程
asyncio相关模块已经成为Python很核心的一部分,aio-libs一直在持续的发展中,例如aiohttp、aiopg等库已经可以初步的在生产环境使用了。在Python3.7中,引入了一系列的与asyncio相关变化,这些变化聚焦在代码质量,让开发者尽量地减少工作量和获得更好的性能体验,主要内容包括了<新的保留字>、<环境变量>、<新的asyncio.run()函数>、<更简单的任务管理、时间循环管理>、<回调更新>、<异步的上下文管理器>等。
哒呵呵
2019-01-23
2.7K0
简单聊聊Python的类型系统
这篇文章实际是The Ultimate Guide to Python Type Checking文的导读和个人理解,有不当之处,以原文为准。内容分为四个部分:
哒呵呵
2019-01-23
1.2K0
简单聊聊Python解释器(一)
Python的解释器,从运行过程上来说就是在模拟一个CPU的处理,只要理解了这一点,python中鼎鼎大名的全局解释锁和多进程也就能够理解了。(Ps:在远古时代,python社区试图把python的解释锁拿掉,但是效果并不理想,因为共享资源及其产生的锁机制极大的制约了处理速度。虽说如此,但是我们还是可以基于多台服务器,用python实现一个简单的分布式架构和多进程处理框架的,不过这又是另一话题了。)所以,在只要理解了CPU的处理机制也就理解了python的解释器。
哒呵呵
2018-08-06
3790
python源码阅读笔记之线程机制
六,python的线程机制 GIL锁的机制,来源于python的内存管理和为了实现多线程,对共享内存资源的互斥实现。 当然,python对进程的支持很好,这在linux下,很有比线程更好的使用,因为在linux里没有线程的概念, 有着的是轻量级的进程以及pipeline等进程间通信。 如果非要使用线程,解释器只有一个,导致的各种线程必须要获得字节码解释器,也就是GIL。 有两个核心问题:在何时挂起当前线程,选择下一个线程?在众多等待的线程中选择其中一个? 对于第一个问题,python通过执行的字节码指令弄的
哒呵呵
2018-08-06
7280
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档