首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python数据分析(中英对照)·Sequences 序列

在Python中,序列是按位置排序的对象集合。 In Python, a sequence is a collection of objects ordered by their position. 在Python中,有三个基本序列,即列表、元组和所谓的“范围对象”。 In Python, there are three basic sequences,which are lists, tuples, and so-called "range objects". 但是Python也有额外的序列类型来表示字符串之类的东西。 But Python also has additional sequence types for representing things like strings. 关于序列的关键方面是,任何序列数据类型都将支持公共序列操作。 The crucial aspect about sequences is that any sequence data type will support the common sequence operations. 但是,除此之外,这些不同的类型将有自己的方法可用于执行特定的操作。 But, in addition, these different types will have their own methods available for performing specific operations. 序列被称为“序列”,因为它们包含的对象形成了一个序列。 Sequences are called "sequences" because the objects that they contain form a sequence. 让我们以图表的形式来看。 So let’s look at this as a diagram. 假设这是我们的序列,在这个例子中,序列中有一些不同的对象——三角形、正方形和圆形。 Imagine that this is our sequence, and we have a few different objects in our sequence here– triangles, squares,and circles, in this example. 要理解序列的第一个基本方面是索引从0开始。 The first, fundamental aspect to understand about sequences is that indexing starts at 0. 因此,如果我们称这个序列为“s”,我们将通过键入“s”来访问序列中的第一个元素,并在括号中放入它的位置,即0。 So if we call this sequence "s", we would access the first element in our sequence by typing "s" and, in brackets, putting its location, which is 0. 这个位于第二个位置的对象将作为s[1]进行寻址和访问,依此类推。 This object here in the second position would be addressed and accessed as s[1], and so on. 这将是s2,3和4。 This would be s 2, 3, and 4. 访问序列中对象的另一种方法不是从左向右计数,而是从右向左计数。 Another way to access objects within the sequence is not to count from left to right, but from right to left. 所以我们可以通过给出一个正的索引来访问序列,这是从左到右计数一个位置,或者我们可以使用一个负的索引,这是从右到左计数位置。 So we can access sequences either by giving a positive index, which is counting a location from the left to right,or we can use a negative index, which is counting positions from right to left. 在这种情况下,我们必须对序列中的最后一个对象使用负1。 In that case, we have to use the negative 1 for the very last object in our sequence. 相应地,负2对应于倒数第二个对象,依此类推。 Corresponding

03

如何实现大数据集查询?Bloom Filter或许是你想要的

虽然上面描述的这几种数据结构配合常见的排序、二分搜索可以快速高效的处理绝大部分判断元素是否存在集合中的需求。但是当集合里面的元素数量足够大,如果有500万条记录甚至1亿条记录呢?这个时候常规的数据结构的问题就凸显出来了。数组、链表、树等数据结构会存储元素的内容,一旦数据量过大,消耗的内存也会呈现线性增长,最终达到瓶颈。有的同学可能会问,哈希表不是效率很高吗?查询效率可以达到O(1)。但是哈希表需要消耗的内存依然很高。使用哈希表存储一亿 个垃圾 email 地址的消耗?哈希表的做法:首先,哈希函数将一个email地址映射成8字节信息指纹;考虑到哈希表存储效率通常小于50%(哈希冲突);因此消耗的内存:8 * 2 * 1亿 字节 = 1.6G 内存,普通计算机是无法提供如此大的内存。这个时候,布隆过滤器(Bloom Filter)就应运而生。在继续介绍布隆过滤器的原理时,先讲解下关于哈希函数的预备知识。

05

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券