我只是在我的生物学研究中选择了Pandas来做一些数据分析工作。结果发现我正在分析的一种蛋白质叫做'NA‘。
我有一个矩阵,它是成对的'HA,M1,M2,NA,NP...‘在列标题上,与“行标题”相同(对于可能阅读本文的生物学家,我正在研究流感)。
当我直接将数据从CSV文件导入Pandas时,它将“行标题”读取为“HA,M1,M2...”。然后NA被读作NaN。有什么办法能阻止这一切吗?列标题很好- 'HA,M1,M2,NA,NP等...‘
发布于 2013-05-17 03:55:01
按如下方式关闭NaN检测:pd.read_csv(filename, keep_default_na=False)
我最初推荐的是na_filter=False
,它可以完成这项工作。但是,如果我理解Jeff下面的评论,这是一个更干净的解决方案。
示例:
In [1]: pd.read_csv('test')
Out[1]:[4]: pd.read_csv('test', keep_default_na=False)
Out[4]:1 2
2 3
发布于 2017-02-10 07:29:22
只是遇到了这个问题--我为列指定了一个字符串转换器,这样我就可以将na保存在其他地方:pd.read_csv(... , converters={ "file name": str, "company name": str})
https://stackoverflow.com/questions/16596188
复制相似问题