https://yeastmine.yeastgenome.org/yeastmine/customQuery.do
上面的网页是这样的。据我所知,JSON不支持单引号,只允许双引号。因此,{}中的内容不是有效的JSON对象。从产生的HTML页面中提取此对象并将其转换为JSON的最佳方法是什么?谢谢。
var helpMap = {'NcRNAGene': ...
这里提到了JSON.stringify
。但我不确定在python或nodejs中如何首先将helpMap作为JS对象。
发布于 2019-09-27 21:02:49
在该网站的控制台中,您可以编写javascript。在这种情况下,JSON.Stringify就是您想要的,通过将javascript对象helpMap
作为参数传递给它来使用它,结果是JSON编码的字符串:
jsonString = JSON.stringify(helpMap)
console.log(jsonString)
您应该能够将该json字符串从控制台复制出来(在chrome中,它的末尾会有一个“复制”按钮)。
发布于 2019-09-28 05:09:26
假设网页已下载到x.html,请运行以下命令。
grep '^ \+var helpMap' < x.html | ./main.js
main.js
具有以下代码。
fs=require('fs');
data = fs.readFileSync(process.stdin.fd);
eval(data.toString());
console.log(helpMap);
如果有必要,可以在helpMap
上使用JSON.stringify()
。
https://stackoverflow.com/questions/58141207
复制