首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Pandas AWS Glue Python Shell Jobs

使用Pandas AWS Glue Python Shell Jobs
EN

Stack Overflow用户
提问于 2019-10-15 16:37:48
回答 5查看 5.6K关注 0票数 1

AWS文档https://docs.aws.amazon.com/glue/latest/dg/add-job-python.html

提到

运行Python作业的环境支持以下库:

..。

熊猫(需要通过python配置( setup.py)安装)

但它没有提到如何进行安装。

如何在AWS Glue Python Shell Jobs中使用Pandas?

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2019-10-15 16:41:26

  1. Goto https://docs.aws.amazon.com/glue/latest/dg/add-job-python.html#create-python-extra-library.检查部分以创建Python .egg或.whl文件,以获得“如何为python作业创建安装文件”setup.py文件中的
  2. ,添加行

安装程序(name=“”,version="0.1",packages=‘,install_requires=’熊猫=0.25.1‘)

我还编写了小的shell脚本来部署python作业,而无需手动步骤来创建鸡蛋文件并上传到s3,并通过cloudformation进行部署。脚本都是自动完成的。您可以在https://github.com/fatangare/aws-python-shell-deploy找到代码

票数 2
EN

Stack Overflow用户

发布于 2019-10-16 16:37:23

为了澄清桑迪普的回答,下面是对我有用的

1/忽略AWS文档

2/创建一个包含以下内容的setup.py文件:

代码语言:javascript
复制
from setuptools import setup

setup(name="pandasmodule",
        version="0.1",
        packages=[],
        install_requires=['pandas==0.25.1']
    )

3/在包含文件的文件夹中运行此命令:

代码语言:javascript
复制
python setup.py bdist_wheel

4/将.whl文件上载到s3

5/将Glue ETL作业中的"Python路径“配置为s3路径

您现在可以在Glue ETL作业中使用"import pandas as pd

票数 6
EN

Stack Overflow用户

发布于 2022-08-05 07:33:10

使用Glue Python,以下脚本直接用于熊猫:

代码语言:javascript
复制
from setuptools import setup

setup(name="pandasmodule",
        version="0.1",
        packages=[],
        install_requires=['pandas==0.25.1']
    )

# use pandas
import numpy as np
import pandas as pd

s = pd.Series([1, 3, 5, np.nan, 6, 8])

print(s)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58399180

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档