我试着用漂亮的汤做一些非常简单的web抓取,我使用requests.get命令从网站中获取HTML数据。然而,从这个给定的网站,我的内核似乎无法处理请求,我的内核被卡住了。以前有没有人经历过这种情况,并找到了解决办法?
我只是简单地尝试以下几点:
requests.get('http://www.nasdaqomxnordic.com/etp/leverage-certifikat/info?Instrument=CSE192562') r=
r
发布于 2021-01-02 16:17:18
问题是,这个网站需要加载一些标题,您可以在请求中传递这些标题。
作为
>>>requests.get('http://www.nasdaqomxnordic.com/etp/leverage-certifikat/info?Instrument=CSE192562', headers={"User-Agent": "Mozilla/5.0 (X11; CrOS x86_64 12871.102.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.141 Safari/537.36"})
<Response [200]>https://stackoverflow.com/questions/65541041
复制相似问题