首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在谷歌BigQuery中创建熊猫数据帧时执行na_values

如何在谷歌BigQuery中创建熊猫数据帧时执行na_values
EN

Stack Overflow用户
提问于 2019-05-30 02:35:07
回答 2查看 196关注 0票数 0

我曾经使用过pd.read_csv(my_csv, na_values=['N/A', '--']),这样字符串'N/A‘和'--’会被解释为NULL、NaN等。

但如果我使用BigQuery客户端,我不知道如何实现同样的壮举。我读了.to_dataframe()的快速帮助,它“从QueryJob返回一个熊猫DataFrame”,但它似乎没有接受任何额外的参数。

这个是可能的吗?或者我必须进行自己的自定义后处理来跟踪缺少的值?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-05-30 02:42:34

您可以从下面获得相同的结果:

代码语言:javascript
复制
dataFrame.applymap(lambda x: np.nan if x in ['N/A', '--'] else x)
票数 2
EN

Stack Overflow用户

发布于 2019-05-30 05:47:24

如果您在将结果放入数据帧之前运行某个查询,那么您可以在BigQuery端轻松完成此操作,而不必担心在客户端过滤结果。

IF(column in ('N\A', '--'), null, column) as column这样的东西应该可以为您做这项工作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56366643

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档