我正在使用Pandas来处理和输出以Wordpress发布的表的数据。
我正在添加HTML代码来格式化颜色一列
从Dataframe示例开始:
import numpy as np
import pandas as pd
df = pd.DataFrame({
'A': ['group1', 'group2', 'group3'],
'B': ['foo', 'foo', 'foo'] })
打印df
A B
0 group1 foo
1 group2 foo
2 group3 foo
然后,我向每一行添加相同的格式代码,如下所示:
df['Status'] = '<span style="color: #00CD00">Active</span>'
print df
A B Status
0 group1 foo <span style="color: #00CD00">Active</span>
1 group2 foo <span style="color: #00CD00">Active</span>
2 group3 foo <span style="color: #00CD00">Active</span>
我将数据导出为csv文件,因为我需要逗号分隔符:
output = r'C:\test\test.csv'
df.to_csv(output, index=False)
如果我在Excel中打开csv,它看起来与上面的一模一样
但是,如果我在文本编辑器中打开它(我需要这样做才能获得分隔符),我发现带有格式字符串的列具有额外的双引号字符,如下所示:
"<span style=""color: #00CD00"">Active</span>"
-这没有增加的双引号--这是正确的:
<span style="color: #00CD00">Active</span>
有人知道我如何在没有额外字符的情况下导出这个吗?
任何帮助都很感激。
发布于 2014-10-03 12:17:59
df.to_csv('test.csv', index=False, quoting=csv.QUOTE_NONE)
参考文献:
样本计划:
import numpy as np
import pandas as pd
import csv
df = pd.DataFrame({
'A': ['group1', 'group2', 'group3'],
'B': ['foo', 'foo', 'foo'] })
df['Status'] = '<span style="color: #00CD00">Active</span>'
df.to_csv('test.csv', index=False, quoting=csv.QUOTE_NONE)
结果:
$ cat test.csv
A,B,Status
group1,foo,<span style="color: #00CD00">Active</span>
group2,foo,<span style="color: #00CD00">Active</span>
group3,foo,<span style="color: #00CD00">Active</span>
https://stackoverflow.com/questions/26186033
复制