我目前正在使用漂亮的汤在一个网站上抓取一个表格,这个表格包括链接,然后我将这个表格转换成一个熊猫数据帧,并使用熊猫的'to_html‘选项将其转换为html,这都是在Django中运行的。
这就是我在Python中创建表的方式:
res = []
for row in table.find_all('tr'):
row_data = []
for td in row.find_all('td'):
td_check = td.find('a')
if td_check is not None:
link = td.find('a')
row_data.append(link)
else:
not_link = ''.join(td.stripped_strings)
if not_link == '':
not_link = None
row_data.append(not_link)
res.append(row_data)
然后,我使用下面的代码将其转换为HTML:
sangerDF = sangerDF.to_html(classes=["table-bordered", "table-striped", "table-hover",], index=False, justify="initial")
但它在我的网站上输出的表如下:
我不明白为什么它不能点击?如果我使用浏览器检查表中的单元格,则HTML为:
<td>
<a href="https://www.sanger.ac.uk/htgt/wge/crispr/1006029202">1006029202</a>
</td>
如果某个地方的格式化出了问题,我该如何修复呢?
谢谢!
发布于 2019-03-22 04:27:10
我想明白了,对于我的'to_html‘,我必须在末尾的括号里加上'escape=False’。
所以我之前的代码是:
sangerDF = sangerDF.to_html(classes=["table-bordered", "table-striped", "table-hover",], index=False, justify="initial")
在此之后:
sangerDF = sangerDF.to_html(classes=["table-bordered", "table-striped", "table-hover",], index=False, justify="initial", escape=False)
希望这能有所帮助。
https://stackoverflow.com/questions/55288612
复制相似问题