专栏首页网管叨bi叨如何在Go中使用切片容量和长度

如何在Go中使用切片容量和长度

来做一个快速测验-以下代码输出什么?

vals := make([]int, 5)for i := 0; i < 5; i++ {  vals = append(vals, i)}fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/7PgUqBdZ6Z

如果猜到了 [0000001234],那么你是正确的。 等一下为什么不是 [01234]

如果答错了,也不担心。从其他语言过渡到Go时,这是一个相当普遍的错误,在本文中,我们将介绍为什么输出不符合你的预期以及如何利用Go的细微差别来提高代码效率。

Slices vs Arrays

在Go中,既有数组又有切片。切片和数组之间有很多区别,数组的长度是其类型的一部分,所以数组不能改变大小,而切片可以具有动态大小,因为切片是数组的包装。这是什么意思?假设我们有一个数组 vara[10]int。此数组的大小固定,无法更改。如果我们调用 len(a),它将始终返回10,因为该大小10是该类型 [10]int的一部分。如果你在数组中需要10个以上的项,则必须创建一个类型完全不同的新对象,例如var b [11] int,然后将所有值从a复制到b。

虽然在特定情况下使用具有固定大小的数组很有价值,但通常来说这并不是开发人员想要的。相反,我们希望使用与Go中的数组类似的东西,但是具有随着时间增加长度的能力。一种简单的方法是创建一个比需要的数组大得多的数组,然后将该数组的子集当作使用的数组。下面的代码显示了一个示例。

var vals [20]intfor i := 0; i < 5; i++ {  vals[i] = i * i}subsetLen := 5
fmt.Println("The subset of our array has a length of:", subsetLen)
// Add a new item to our arrayvals[subsetLen] = 123subsetLen++fmt.Println("The subset of our array has a length of:", subsetLen)

Run it on the Go Playground → https://play.golang.org/p/Np6-NEohm2

上面代码中,我们将一个数组其大小设置为20,但是由于我们仅使用一个子集,因此我们的代码可以假装数组的长度为5,然后在向数组中添加新项后为6。

(很粗略地说)这就是切片的工作方式。它们包装一个具有设定大小的数组,就像上一个示例中的数组具有20的设定大小一样。它们还跟踪程序可使用的数组子集- length属性,它类似于上一示例中的 subsetLen变量。

切片还具有一个容量,类似于上一个示例中数组(20)的总长度。这很有用,因为它告诉你子集可以增长多大之后才能不再适合支撑切片的底层数组。当发生这种情况时,将会分配一个新的数组来支撑切片,但是所有这些逻辑都隐藏在 append函数的后面。

简而言之,将 sliceappend函数结合在一起可以为我们提供一种与数组非常相似的类型,但是随着时间的增长,它可以处理更多元素。

让我们再次看一下前面的示例,但是这次我们将使用切片而不是数组。

var vals []intfor i := 0; i < 5; i++ {  vals = append(vals, i)  fmt.Println("The length of our slice is:", len(vals))  fmt.Println("The capacity of our slice is:", cap(vals))}
// Add a new item to our arrayvals = append(vals, 123)fmt.Println("The length of our slice is:", len(vals))fmt.Println("The capacity of our slice is:", cap(vals))
// Accessing items is the same as an arrayfmt.Println(vals[5])fmt.Println(vals[2])

Run it on the Go Playground → https://play.golang.org/p/M_qaNGVbC-

我们仍然可以像访问数组一样访问切片中的元素,但是通过使用切片和 append函数,我们不再需要考虑支持数组的大小。通过使用 lencap函数,我们仍然可以弄清楚这些事情,但是我们不必太担心它们。

考虑到这一点,让我们回顾一下文章开头的测验代码,看看出了什么问题。

vals := make([]int, 5)for i := 0; i < 5; i++ {  vals = append(vals, i)}fmt.Println(vals)

调用 make时,我们最多可以传入3个参数。第一个是我们要分配的类型,第二个是类型的长度,第三个是类型的容量(此参数是可选的)。

通过make([] int, 5),我们告诉程序要创建一个长度为5的切片,并且容量默认为提供的长度-在这里是5。虽然这看起来似乎是我们最初想要的,但这里的重要区别是我们告诉切片要将长度和容量都设置为5,make 将切片初始化为 [0,0,0,0,0]然后继续调用 append函数,因此它将增加容量并在切片的末尾开始添加新元素。

如果在代码中添加 Println()语句,可以看到容量的变化。

vals := make([]int, 5)fmt.Println("Capacity was:", cap(vals))for i := 0; i < 5; i++ {  vals = append(vals, i)  fmt.Println("Capacity is now:", cap(vals))}
fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/d6OUulTYM7

结果,我们最终得到了输出 [00000001234]而不是期望的 [01234]。 我们该如何解决?嗯,有几种方法可以做到这一点,我们将介绍其中两种,你可以择最适合自己情况的一种。

不使用 append, 直接用索引写入

第一个解决方法是保持make调用不变,并明确声明要将每个元素设置为的索引。

vals := make([]int, 5)for i := 0; i < 5; i++ {  vals[i] = i}fmt.Println(vals)

Run it on the Go Playground → https://play.golang.org/p/JI8Fx3fJCU

我们设置的值恰好与我们要使用的索引相同,但是您也可以独立跟踪索引。 例如,如果您想获取map的key,则可以使用以下代码:

package main
import "fmt"
func main() {  fmt.Println(keys(map[string]struct{}{    "dog": struct{}{},    "cat": struct{}{},  }))}
func keys(m map[string]struct{}) []string {  ret := make([]string, len(m))  i := 0  for key := range m {    ret[i] = key    i++  }  return ret}

Run it on the Go Playground → https://play.golang.org/p/kIKxkdX35B

这之所以行之有效,是因为我们知道返回的切片的确切长度将与map的长度相同,因此我们可以使用该长度初始化切片,然后将每个元素分配给适当的索引。这种方法的缺点是我们必须跟踪 i,以便我们知道将每个值放入哪个索引。

这导致我们进入第二种方法

使用0作为长度,并指定容量

我们更新make调用,在切片类型之后为其提供两个参数。首先,新切片的长度将设置为0,因此我们没有在切片中添加任何新元素。第二个参数是新切片的容量,将被设置为map参数的长度,因为我们知道切片最终的长度就是 map 的长度。

这仍将在幕后构造与上一个示例相同的数组,但是现在,当我们调用 append时,它将知道将元素放置在切片的开头,因为切片的长度为0。

package main
import "fmt"
func main() {  fmt.Println(keys(map[string]struct{}{    "dog": struct{}{},    "cat": struct{}{},  }))}
func keys(m map[string]struct{}) []string {  ret := make([]string, 0, len(m))  for key := range m {    ret = append(ret, key)  }  return ret}

Run it on the Go Playground → https://play.golang.org/p/h5hVAHmqJm

使用 append 能自动扩容,为什么还要关心切片的容量

你可能要问的下一件事是:“如果append函数可以为我增加切片的容量,我们为什么还要告诉程序一个容量?”

事实是,在大多数情况下,无需太担心这一点。如果它使您的代码复杂得多,只需使用 varvals[]int初始化切片,然后让 append函数处理繁重的工作。但是针对知道切片最终长度的情况,我们可以在初始化切片时声明其容量,从而使程序不必执行不必要的内存分配。

请在Go Playground上运行以下代码。每当容量增加时,我们的程序就需要执行另一次内存分配:

package main
import "fmt"
func main() {  fmt.Println(keys(map[string]struct{}{    "dog":       struct{}{},    "cat":       struct{}{},    "mouse":     struct{}{},    "wolf":      struct{}{},    "alligator": struct{}{},  }))}
func keys(m map[string]struct{}) []string {  var ret []string  fmt.Println(cap(ret))  for key := range m {    ret = append(ret, key)    fmt.Println(cap(ret))  }  return ret}

Run it on the Go Playground → https://play.golang.org/p/fDbAxtAjLF

现在将切片预设容量后将其与上面相同的代码进行比较:

package main
import "fmt"
func main() {  fmt.Println(keys(map[string]struct{}{    "dog":       struct{}{},    "cat":       struct{}{},    "mouse":     struct{}{},    "wolf":      struct{}{},    "alligator": struct{}{},  }))}
func keys(m map[string]struct{}) []string {  ret := make([]string, 0, len(m))  fmt.Println(cap(ret))  for key := range m {    ret = append(ret, key)    fmt.Println(cap(ret))  }  return ret}

Run it on the Go Playground → https://play.golang.org/p/nwT8X9-7eQ

在第一个代码示例中,我们的容量从0开始,然后增加到1、2、4,最后是8,这意味着我们必须在5个不同的时间分配一个新数组,此外,最后一个数组用于支持我们 slice的容量为8,大于我们最终需要的容量。 另一方面,我们的第二个示例以相同的容量(5)开始和结束,并且只需要在 keys()函数开始时分配一次即可。我们还避免浪费任何额外的内存。

不要过度优化

通常不鼓励任何人担心像这样的次要优化,但是在确实很明显最终大小应该是多少的情况下,强烈建议为切片设置适当的容量或长度。

它不仅有助于提高应用程序的性能,而且还可以通过明确说明输入大小和输出大小之间的关系来帮助理清代码。

本文并不是要对切片或数组之间的差异进行详尽的讨论,而只是要简要介绍容量和长度如何影响切片以及它们在不同解决方案中的作用。

本文分享自微信公众号 - 网管叨bi叨(kevin_tech),作者:KevinYan11

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 从PHPer到Gopher要经历的一些转变

    学习一门新编程语言时,我们总会下意识地用自己熟悉语言类比着去理解新语言,甚至用原来语言的思维套路写新语言的程序。比如PHP里数组的长度是可以动态增长的,Go里面...

    KevinYan
  • Go 切片使用绕坑指南

    不知道大家有没有发现在一个函数内部对切片参数进行了排序后也会改变函数外部原来的切片中元素的顺序,但是在函数内向切片增加了元素后在函数外的原切片却没有新增元素,更...

    KevinYan
  • go中defer的一个隐藏功能

    在开始使用Go进行编码时,Defer是要关注的一个很重要的特性。它非常简单:在任何函数中,给其他函数的调用加上前缀 defer以确保该函数在外部函数退出之前立即...

    KevinYan
  • go 执行command命令

    solate
  • 从JSON进化到BSON

    自从MEAN引导的JSON数据格式取代传统JAVA推崇的XML以后, json的发展却停滞不前了, 当然这是好事, 因为稳定的结构是不需要向下兼...

    Jean
  • Linux Shell 从入门到删除根目录跑路指南

    shell 作为一门 linux 下使用广泛的系统语言,语法简单,上手容易,但是想要用好,少犯错误,也不是那么容易的一件事,可谓虽是居家旅行之良药,但也是杀人灭...

    用户1177713
  • go语言学习-json 解析

    Json 是一种比 XML 更轻量级的数据交换格式,易于人们阅读和编写,也易于程序解析 和生成。是较理想的、跨平台的、跨语言的数据交换语言,应用十分广泛。

    solate
  • python中json.loads,dumps,jsonify使用

    search_info = {'id':132,'user_role':3} print type(search_info) #输出 <type 'd...

    用户1558882
  • MYSQL not in not exists 我们不一样, 坑你还得入?

    MYSQL 8 这个版本已经和简单的查询慢慢的说再见了,MYSQL 8.017的功能Antijoin 也登录了,但问题大面积的MYSQL 5.X 怎么办,NOT...

    AustinDatabases
  • WPF/Silverlight中的Command

    这里所讨论的Command就是设计模式中的Command模式:命令(Command)模式属于对象的行为模式【GOF95】。命令模式又称为行动(Action)模式...

    张善友

扫码关注云+社区

领取腾讯云代金券