AWS文档https://docs.aws.amazon.com/glue/latest/dg/add-job-python.html
提到
运行Python作业的环境支持以下库:
..。
熊猫(需要通过python配置( setup.py)安装)
但它没有提到如何进行安装。
如何在AWS Glue Python Shell Jobs中使用Pandas?
发布于 2019-10-15 16:41:26
安装程序(name=“”,version="0.1",packages=‘,install_requires=’熊猫=0.25.1‘)
我还编写了小的shell脚本来部署python作业,而无需手动步骤来创建鸡蛋文件并上传到s3,并通过cloudformation进行部署。脚本都是自动完成的。您可以在https://github.com/fatangare/aws-python-shell-deploy找到代码
发布于 2019-10-16 16:37:23
为了澄清桑迪普的回答,下面是对我有用的
1/忽略AWS文档
2/创建一个包含以下内容的setup.py文件:
from setuptools import setup
setup(name="pandasmodule",
version="0.1",
packages=[],
install_requires=['pandas==0.25.1']
)3/在包含文件的文件夹中运行此命令:
python setup.py bdist_wheel4/将.whl文件上载到s3
5/将Glue ETL作业中的"Python路径“配置为s3路径
您现在可以在Glue ETL作业中使用"import pandas as pd“
发布于 2022-08-05 07:33:10
使用Glue Python,以下脚本直接用于熊猫:
from setuptools import setup
setup(name="pandasmodule",
version="0.1",
packages=[],
install_requires=['pandas==0.25.1']
)
# use pandas
import numpy as np
import pandas as pd
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)https://stackoverflow.com/questions/58399180
复制相似问题