enter code here我正在编写代码来抓取https://www.imdb.com/chart/top?ref_=nv_mv_250 我试着使用美汤,请求和re从收视率最高的电影标题的imdb.com中抓取数据。 #Import the library to query a website
import requests
from bs4 import BeautifulSoup
import re
#specify the url
imdb_link="https://www.imdb.com/chart/top?ref_=nv_mv_250
我试图创建一个程序,在收到包含要从OMDb获取数据的电影名称的请求时,从IMDB加载IMDB。当我运行这个程序时,通过尝试从电影“Shawshank救赎”中获取数据来测试它,我会得到以下错误:
无法从程序集“System.Web、Version=4.0.0.0、Culture=neutral、PublicKeyToken=b03f5f7f7f7f11d50a3a”加载“System.Web”类型。
using (WebClient wc = new WebClient())
{
var json = wc.DownloadString(u
我正在进行一个类项目,并试图获取所有IMDB电影数据(标题,预算)。等)直到2016年。我采用了来自的代码。
我的想法是:从我在范围(1874年,2016年)(从1874年是最早的一年显示在上),引导程序到相应的年份的网站,并从该网址获取数据。
但问题是,每一页每年只显示50部电影,所以在抓取50部电影之后,我如何才能继续到下一页呢?在每年爬行之后,我怎么才能继续到明年呢?到目前为止,这是我用于解析url部分的代码,但是它只能在特定的一年中抓取50部电影。
class tutorialSpider(scrapy.Spider):
name = "tutorial"
我正在尝试通过以下代码从IMDB中进行一些网络电影评论的抓取: import requests
from time import sleep
url='https://www.imdb.com/title/tt0068646/reviews?ref_=tt_urv'
response= requests.get(url) 我得到了这个错误: SSLError: HTTPSConnectionPool(host='www.imdb.com', port=443): Max retries exceeded with url: /title/tt0068646/r
我试着用asp.net来学习和做一些事情。我正试图使用IMPO.io的api从json中获得一些信息,但是我想不出什么。我试图在两天前解决这个问题:
错误:没有为“imdb_io_web.IMDB[]”类型定义无参数构造函数
为什么我会犯我真的不明白的错误?
我有个课
namespace imdb_io_web
{
public class IMDB
{
public string director { get; set; }
}
}
并试图从IMDB中获得导演的名字
var wc = new WebClient();
var seri
我一直在试图在这里发现的问题中找到一个解决方案,但是找不到一个能给我某种解决方案或类似方法来解决我的问题的方法。我对python非常陌生,作为第一步,我想学习如何使用漂亮的soup从IMDB中抓取数据。我想刮电影的名字,IMDB评级和票数。名单上有些电影没有评级和票数,我得到的是:非常感谢你的评论。完整的跟踪如下:跟踪(最近一次调用):文件"C:/Users/nmartine/PycharmProjects/ratings_ScraperMetracritic/venv/ratings_ScraperMetacritic.py",第24行,在container.find= co