文章/答案/技术大牛

发布

社区首页 >问答首页 >遍历S3对象，而不仅仅是对象中的所有关键/bucket

问遍历S3对象，而不仅仅是对象中的所有关键/bucket
EN

Stack Overflow用户

提问于 2021-10-07 22:56:16

回答 1查看 125关注 0票数 1

下面是一个常见的共享函数，用于迭代存储桶中的所有对象，但如果我只想迭代特定的键怎么办，假设测试URI是: S3 ://S3-data-lake/test1/test2/

在测试二之后有五个json文件，即s3:// test -data-lake/test1/test2/test1.json..

我如何修改这段代码来处理上面的问题？

def iterate_bucket_items(bucket):
    """
    Generator that iterates over all objects in a given s3 bucket

    See http://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.list_objects_v2 
    for return data format
    :param bucket: name of s3 bucket
    :return: dict of metadata for an object
    """


    client = boto3.client('s3')
    paginator = client.get_paginator('list_objects_v2')
    page_iterator = paginator.paginate(Bucket=bucket)

    for page in page_iterator:
        if page['KeyCount'] > 0:
            for item in page['Contents']:
                yield item


for i in iterate_bucket_items(bucket='my_bucket'):
    print i

amazon-s3

boto3

python

python-3.x

amazon-web-services

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-08 00:01:47

您可以使用Prefix

def iterate_bucket_items(bucket, prefix=''):
    """
    Generator that iterates over all objects in a given s3 bucket

    See http://boto3.readthedocs.io/en/latest/reference/services/s3.html#S3.Client.list_objects_v2 
    for return data format
    :param bucket: name of s3 bucket
    :return: dict of metadata for an object
    """


    client = boto3.client('s3')
    paginator = client.get_paginator('list_objects_v2')
    page_iterator = paginator.paginate(Bucket=bucket, Prefix=prefix)

    for page in page_iterator:
        if page['KeyCount'] > 0:
            for item in page['Contents']:
                yield item


for i in iterate_bucket_items(bucket='my_bucket', prefix='test1/test2/'):
    print(i)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69488682

复制

相似问题

问遍历S3对象，而不仅仅是对象中的所有关键/bucket
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问遍历S3对象，而不仅仅是对象中的所有关键/bucketEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问遍历S3对象，而不仅仅是对象中的所有关键/bucket
EN