Web从imdb项目中抓取特定数据_从HTML、python、web抓取接收特定数据_Web从ajax页面抓取数据 - 腾讯云开发者社区

python、web-scraping、scrapy

我想知道我是否可以设置一些存储信息必须满足的条件(使用Scrapy版本1.7.3进行web抓取)。例如，在抓取IMDB的网站时，只存储评分大于7的电影。或者我必须在查看输出文件时手动执行此操作？(我目前正在将数据输出为CSV文件)

浏览 10提问于2019-10-13得票数 1

回答已采纳

1回答

IMDB刮擦问题

php、curl

可能的重复：我正在使用PHP从curl中抓取电影细节。它在获取数据方面非常有效，但我现在面临的问题是：当我去买像这样的非英语电影时。当我在浏览器中打开这部电影时，它会显示这部电影的"IMDB“-version页面，其中显示电影名为”寄宿学校“。但是，当我通过curl获取数据时，它会获取这部电影的原始页面，其中电影名为"Leidenschaftlicheümchen“。因此，请建议我如何获取curl数据的英文版本IMDB页面。

浏览 4提问于2011-08-10得票数 6

回答已采纳

1回答

在没有imdb的情况下获取电影数据

c#、imdb

我正在做一个小程序(使用C#)，在那里我可以获得电影的细节。我的第一选择是使用imdb。但显然imdb已经改变了他们的网站，所以我发现的所有Web抓取示例或api都不再起作用了。所以我的问题是:有没有可以替代的电影数据库。

浏览 4提问于2012-12-05得票数 2

回答已采纳

6回答

我应该如何创建一个库(.dll)文件，供其他开发人员使用C#在他们的项目中使用？

c#、.net、libraries

当然，Visual中有一种类型的项目输出人们可以使用的DLL。我知道这个。我只是想知道，在使用我的DLL文件时，会期望达到哪些标准。我将提供一个类，用于在IMDB中搜索电影，并返回开发人员要使用的结果。不是一个DLL服务，而是一个本地DLL文件。(我知道IMDB不赞成web抓取，但我也知道，如果有人要求，他们会允许人们使用。我的许可已经发出了。) 我该怎么处理这个？

浏览 10提问于2009-10-29得票数 3

3回答

尽管-td -class=titlecolumn-element存在，漂亮的td-returns returns none-even

web-scraping

enter code here我正在编写代码来抓取https://www.imdb.com/chart/top?ref_=nv_mv_250 我试着使用美汤，请求和re从收视率最高的电影标题的imdb.com中抓取数据。 #Import the library to query a website import requests from bs4 import BeautifulSoup import re #specify the url imdb_link="https://www.imdb.com/chart/top?ref_=nv_mv_250

浏览 24提问于2019-06-10得票数 2

2回答

将“预算”的值更改为R中的类别级别

我(目前)有一个问题，但我找不到解决方案。背景: Termpaper，主题:使用从Kaggle抓取imdb的电影数据的数据集。分析了预算-> imdb评级和收入-> imdb评级的相关性。我有可变的预算(最小= 11.000，最大300.000.000)，并希望将其分类为级别(低预算/<2，5mil，中-低，中，高，极高)。之后，我想从这些数据中得到一个箱线图。有什么提示吗？

浏览 2提问于2017-07-22得票数 0

2回答

从网站抓取数据最有效的方法是什么( php)？

php、screen-scraping

我正在尝试从IMDB中抓取数据，但是自然会有很多页面，而且串行方式需要花费太长的时间。即使我做了多线程卷曲。有没有更快的方法呢？是的，我知道IMDb提供了文本文件，但他们并不是以任何合理的方式提供所有文件。

浏览 0提问于2010-02-09得票数 1

回答已采纳

1回答

SystemT.ypeLoadException--无法从程序集System.Web.Util加载System.Web？

c#、.net、visual-studio、system.web.extensions

我试图创建一个程序，在收到包含要从OMDb获取数据的电影名称的请求时，从IMDB加载IMDB。当我运行这个程序时，通过尝试从电影“Shawshank救赎”中获取数据来测试它，我会得到以下错误：无法从程序集“System.Web、Version=4.0.0.0、Culture=neutral、PublicKeyToken=b03f5f7f7f7f11d50a3a”加载“System.Web”类型。 using (WebClient wc = new WebClient()) { var json = wc.DownloadString(u

浏览 4提问于2017-12-10得票数 1

1回答

将数据从HTML文本输入传递到python脚本

javascript、jquery、python、ajax、django

我正在创建一个网络抓取应用程序，使用Django，它抓取imdb网站，并根据用户在文本字段中键入的内容列出电影名称假设如果用户键入'b'，它将列出所有以字母'b‘开头的电影名称我有一个html文本输入和一个按钮。 <body> <h1>The IMDB Scraper</h1> <form method="POST" action=""> <input type="text" name="name" placeholder

浏览 1提问于2018-01-11得票数 4

1回答

从不均匀的列表创建数据框

我的下面的代码是我从IMDB中从多个页面抓取数据，但是，当我试图将数据组合到一个数据帧中时，它给我一个错误，告诉我总量和元的不同行。我想知道如何将NA值插入到这些空位中，以便字符串长度相等？(注意，我必须删除一些链接，因为我需要某些代表来张贴更多的链接) urls <- c("https://www.imdb.com/search/title?title_type=feature&release_date=2010-01-01,2017-12-31", "https://www.imdb.com/search/title?tit

浏览 0提问于2018-12-12得票数 0

2回答

是否有一种使用IMDb提取IMDbPY评论的方法？

python、web-scraping、imdb、imdbpy

我不需要数据集，这是可用的卡格尔。我希望使用IMDb或任何其他抓取方法从IMDbPY中提取电影评论。

浏览 2提问于2020-01-29得票数 1

回答已采纳

2回答

从脚本获取不同的电影信息与从python shell获取不同的电影信息

python、shell、imdb、imdbpy

下面的脚本可以将电影的放映输出到文本文档中： import imdb ia = imdb.IMDb() movie = ia.get_movie(0111161) cast = movie['cast'] text_file = open("Cast.txt", "w") text_file.write("{0}".format(movie)) text_file.write("{0}".format(cast)) text_file.close() 正如您所看到的，我从IMDB网站而不是从数据库中抓取它。当我在

浏览 3提问于2017-08-20得票数 1

回答已采纳

2回答

无法使用python筛选器返回预期输出

python、python-3.x

我在做网络抓取。我拿到了标题列表，现在我过滤掉了不需要的东西。但是在过滤的时候，我没有得到预期的输出。我在代码中找不到错误。 import re def filter_header(item): if(item): if(item == 'Rank & Title'): rank_title_split = re.split('[&]', item) print(rank_title_split) # getting ['Rank','Title']

浏览 1提问于2019-03-31得票数 1

回答已采纳

3回答

IMDB抓取所有电影数据

python、python-2.7、scrapy、scrapy-spider

我正在进行一个类项目，并试图获取所有IMDB电影数据(标题，预算)。等)直到2016年。我采用了来自的代码。我的想法是:从我在范围(1874年，2016年)(从1874年是最早的一年显示在上)，引导程序到相应的年份的网站，并从该网址获取数据。但问题是，每一页每年只显示50部电影，所以在抓取50部电影之后，我如何才能继续到下一页呢？在每年爬行之后，我怎么才能继续到明年呢？到目前为止，这是我用于解析url部分的代码，但是它只能在特定的一年中抓取50部电影。 class tutorialSpider(scrapy.Spider): name = "tutorial"

浏览 4提问于2016-03-05得票数 0

回答已采纳

1回答

如何在python中使用scrapy从图像元素中提取imdb格式的电影分级

python、scrapy

我正在尝试用蟒蛇抓取imdb。然而，我无法从页面获取评级信息，如下所示：我使用了下面的代码： from scrapy.spiders import Spider from scrapy.selector import Selector from imdb.items import ImdbItem class ImdbSpider(Spider): name = "imdb" allowed_domains = ["imdb.com"] start_urls = [ "http://www.imdb.com

浏览 0提问于2016-04-27得票数 0

1回答

程序冻结-没有错误，没有例外。

c#、regex、parsing、imdb

我正在编写一个程序从IMDB中抓取数据，使用，它工作得很好，但有时.就这样停了下来。没有抛出的异常，没有错误，没有在智力上显示的任何东西，都找不到停止的原因。它是无止境的，因为它停止的点是完全随机的！比如说..。如果我启动它，它成功地刮了100次数据，但是如果我重新启动它，它会在50之后被卡住。我真的不知道为什么会这样。如果我暂停代码，如果它被卡住了，它就不会写任何东西(就像它正常运行，没有任何错误)，(或者我只是没有注意到)。左边的绿色标志在 IMDb imdb_movie = new IMDb(link, false); 源代码可以找到有什么想法吗？谢谢前进！

浏览 0提问于2012-06-24得票数 4

回答已采纳

1回答

从Google图像中提取图像

mysql、database、import.io

我正在用电影制作数据库，我不知道如何从Google图像中保存图像，并将它们与特定的电影进行排序。在数据库中，我有17000部电影，我用import.io从IMDB中抓取它们，但是图像太小了。请给我点建议？

浏览 1提问于2015-05-05得票数 2

回答已采纳

2回答

VBA运行时错误438 / getElementbyClassName

html、excel、vba、web-scraping、getelementsbytagname

我是一个新手，试图从imdb.com网站上抓取高宽比的细节。我在你管上盗取了一些代码，并使用检查元素对其进行了修改。代码打开imdb并按标题运行搜索，但返回运行时错误438。理想情况下，我希望它返回顶部结果的html，这样我就可以执行进一步单击顶部结果来跟踪页面的技术细节，从那里可以获得高宽比信息并将其粘贴到单元格中。不幸的是，我从我的点击指令失败-甚至还没有到点提取的纵横比信息。有人能看到我哪里出了问题吗？非常感谢，尼克 Private Sub Worksheet_Change(ByVal Target As Range) If Target.Row = Range("

浏览 0提问于2018-09-25得票数 0

回答已采纳

1回答

为什么我的PowerShell脚本不能按预期运行

html、css、powershell

我已经创建了一个脚本来抓取IMDB网站。我的脚本获取IMDB urls列表，运行并提取电影标题、发行年份、剧情摘要等数据，然后将其导出到CSV中的文本文件中。我写的脚本如下所示。 $listToCrawl = "imdb_link_list.txt" $pathOfFile = "K:\MY DOCUMENTS\POWERSHELL\IMDB FILE\" $fileName = "plot_summary.txt" New-Item ($pathOfFile + $fileName) -ItemType File Set-Content ($

浏览 12提问于2020-03-03得票数 0

4回答

Python的新技术-一般Web抓取

python、web-scraping

为了学习更高级的Python，我要求自己创建一个定位到网站的python脚本(在本例中是imdb.com)，输入一个单词(已经声明为变量)，然后将前5个标题输出到数组中，然后输出到控制台。我的问题是:这样的事情可能吗？是否有使这成为可能的库/框架？如果可能的话，我该从哪里开始？Web抓取对我来说并不是什么新鲜事，但Python中的web抓取却是新的。我真正需要的是指引正确的道路。25分钟的谷歌搜索得到了一些模糊的答案，只是让我更加困惑。

浏览 11提问于2014-04-16得票数 0

回答已采纳

3回答

在Java中使用子字符串()

java、string、substring、jsoup

为了从IMDB中提取电影信息，我创建了一个基本的web刮刀。然而，当我抓取体裁时，我不得不得到这样的输出：行动冒险幻想2011年4月27日(英国) 是否有一种方法可以使用子字符串()，以便当它命中一个数字时，它将带走其余的字符串？在这种情况下，数字27。谢谢

浏览 2提问于2013-10-19得票数 0

回答已采纳

1回答

Imdb抓取器制导

php

需要一点帮助。例如，我有一个Imdb抓取器，可以从网站上抓取某些细节。这段代码 $ps = $dom->getElementsByTagName('p'); for($i=0;$i<$ps->length;$i++){ $itemprop = $ps->item($i)->getAttribute("itemprop"); if ($itemprop=="description"){ $tmp = explode("See full summary",$ps->item($i)->te

浏览 0提问于2013-09-16得票数 0

2回答

如何使用具有相同类名的scrapy来抓取内容

python、css、xpath、web-scraping、scrapy

我使用刮除从网站的数据，但我有问题时，从div刮内容，其中有相同的类名。 <div class="list"> <a id="followed_by" name="followed_by"></a> <h4 class="li_group">Followed by</h4> <div class="soda odd"><a href="http://www.imdb.com/title/tt0094450"&

浏览 2提问于2017-08-29得票数 3

回答已采纳

1回答

用rvest抓取:如何填充行中的空白数字以转换到数据帧中？

r、rvest

我正在尝试用我在IMDB上抓取的2个数据构建一个数据帧:第一个有50个值，第二个只有29个值。有没有一种简单的方法可以让R用NA自动填充他没有找到的其他21个值？我的代码： imdb <- read_html("http://www.imdb.com/search/title?genres=horror&genres=mystery&sort=moviemeter,asc&view=advanced") title <- html_nodes(imdb, '.lister-item-header a') title <

浏览 0提问于2017-08-17得票数 0

回答已采纳

1回答

如何从url中提取以特定字母开头和结尾的字符串

string、web-scraping

我正在做网络抓取，我的任务是，给出电影名称列表，找到一些数据(IMDBid，cast等)。关于它从imdb网站。因此，首先，我做了谷歌搜索"IMDB Movie_Name“，并试图废除谷歌搜索结果，以获得网址到goto电影标题页。 url = 'https://www.google.com/search?q=IMDB+title+taare+zameen+par' headers = {'Accept-Language': 'en-US, en;q=0.5'} page = get(url, headers = headers) so

浏览 5提问于2022-05-30得票数 -1

1回答

SSLError: HTTPSConnectionPool

python、html、web

我正在尝试通过以下代码从IMDB中进行一些网络电影评论的抓取： import requests from time import sleep url='https://www.imdb.com/title/tt0068646/reviews?ref_=tt_urv' response= requests.get(url) 我得到了这个错误： SSLError: HTTPSConnectionPool(host='www.imdb.com', port=443): Max retries exceeded with url: /title/tt0068646/r

浏览 84提问于2020-10-29得票数 3

2回答

在java中将IMDB数据获取到JSON数组

java、imdb、geojson

我正在使用java做一个项目。在这个项目中，我必须从IMDB获取电影数据。到目前为止，我已经了解到，使用与电影id的直接链接，我们可以以JSON文件的形式获取数据。 http://www.omdbapi.com/?i=tt2975590&plot=full&r=json 我希望在java中将这些数据发送到JSON数组。有人能帮我做这个吗。谢谢。

浏览 3提问于2016-07-16得票数 0

回答已采纳

1回答

web抓取主管部分IMDB在

r、web-scraping

我试图从IMDB网站中获取数据，我试图用以下命令获取董事的名字: html_nodes("p.text-mutated + a")，也尝试了html_nodes(“..text mutated+p”)，但两者都无法工作。请注意，这是我第一次做网络抓取。你的帮助将不胜感激。谢谢！

浏览 4提问于2020-05-20得票数 0

3回答

为电影预告片抓取IMDB？

python、youtube、web-crawler

我想抓取IMDB并下载符合某些标准的电影预告片(无论是从YouTube还是IMDB) (例如:今年发布，评分在2以上)。我想用Python来做这件事--我看到了一些用于爬行IMDB和下载YouTube视频的包。问题是，我目前的计划是爬行IMDB，然后在youtube上搜索“$movie_name”+“预告片”，并希望最重要的结果是预告片，然后下载。尽管如此，这似乎有点令人费解，我想知道是否有一个更容易的方法。任何帮助都将不胜感激。

浏览 0提问于2018-04-21得票数 0

回答已采纳

2回答

没有为类型定义无参数构造函数

asp.net、json、deserialization

我试着用asp.net来学习和做一些事情。我正试图使用IMPO.io的api从json中获得一些信息，但是我想不出什么。我试图在两天前解决这个问题：错误：没有为“imdb_io_web.IMDB[]”类型定义无参数构造函数为什么我会犯我真的不明白的错误？我有个课 namespace imdb_io_web { public class IMDB { public string director { get; set; } } } 并试图从IMDB中获得导演的名字 var wc = new WebClient(); var seri

浏览 7提问于2014-11-24得票数 0

1回答

使用rvest读取多个html链接

r、web-scraping、rvest

我试图从IMDB抓取信息，但我遇到了一些问题，我不知道如何解决它。我成功地抓取了片名，年份，评级等，但当我试图抓取演员名称时，我首先需要进入每个电影的链接，并从那里获得完整的演员页面。 read_html函数不允许我读取多个html，而且我不确定我还可以使用什么其他函数。以下是我的代码 library(rvest) library(dplyr) link = "https://www.imdb.com/search/title/?title_type=feature&num_votes=25000,&genres=adventure&sort=user_r

浏览 15提问于2021-09-23得票数 0

1回答

利用JSoup浏览网页

java、web、screen-scraping、jsoup

我制作了一个网络刮刀，在IMDB上抓取一些信息。它通过将url中的数字更改为不同的随机数字来遍历每个页面，然后在这个新页面上重复web抓取过程。 <--将这个号码更改为一部新电影。我怎样才能在BFI网站上做到这一点？我看不到从一部电影到另一部电影的路。提前感谢！

浏览 2提问于2013-10-25得票数 0

回答已采纳

1回答

如何从网页中抓取一些数据

java、jsoup

我对网络抓取有问题。我想做的是：我有一个网站：正如你在页面按钮"Rezervisi“上看到的，当我点击它时，我想要抓取下一个数据：第一个下拉菜单当站点打开新窗口时，其"Volkswagen！1.0“在下拉列表中我要抓取所有汽车，然后在这个名为"Mesto preuzimanja vozila”下拉菜单中我要抓取所有项目，而在名为"Mesto vracanja vozila“的下拉菜单中我要抓取所有项目。这是我尝试在第一个下拉菜单中输入汽车名称的方法： Document doc = Jsoup.connect("https:

浏览 0提问于2019-08-07得票数 0

2回答

为什么使用selenium时只能获取首页数据？

python、selenium-webdriver、web-scraping

我使用python包selenium自动单击"load more“按钮，这是成功的。但是为什么在“加载更多”后无法获取数据？我想用python从imdb抓取评论。它只显示25条评论，直到我点击“加载更多”按钮。我使用python包selenium自动单击"load more“按钮，这是成功的。但是为什么我不能在“加载更多”之后获取数据，而只是重复获取前25条评论数据？ import requests from bs4 import BeautifulSoup from selenium import webdriver import time seed =

浏览 0提问于2019-04-05得票数 2

1回答

web服务与api有什么不同？

web-services、api、rest、soap

我正在学习开发web服务。据我所知，有两个方法:1.SOAP和2.REST。Soap主要使用XML进行通信，而REST是HTTP请求。我可以有像google api，twitter api，或者imdb电影API这样的外部api作为我的web服务吗？这些API中的大多数都是restAPI，所以这是否意味着如果我开发一个电影信息web服务，它将是restful的？我目前正在学习创建一个web服务，它将使用imdb http请求返回电影信息到它的api。web服务内部是否可以有不同的外部api，如imdb api，即rest？

浏览 0提问于2014-06-17得票数 1

2回答

如何从一个标签中抓取单个文本？

python、pandas、web-scraping、beautifulsoup

我试图从IMDB抓取前250部电影的数据。 from bs4 import BeautifulSoup import requests import pandas as pd url="https://www.imdb.com/chart/top/?ref_=nv_mv_250" page=requests.get(url).content soup=BeautifulSoup(page,"html.parser") data=[] titles=soup.find_all("td",class_="titleColumn")

浏览 13提问于2022-06-10得票数 1

2回答

使用Python和Beautiful Soup获取IMDB评级

python、web-scraping、beautifulsoup、pycharm

我已经在这里尝试了几种不同的方法，但似乎都不起作用，所以我希望您能提供任何帮助！我试图抓取一个IMDB页面(例如：https://www.imdb.com/title/tt0120382/)来获取电影的评分。当我抓取页面上的链接文本时，我设法做了类似的事情。这很好用，但这不是一个链接，所以我没有尝试过任何东西。评级肯定是以普通HTML格式提供的： "ratingCount": 905028, "bestRating": "10.0", "worstRating": "1.0", "rating

浏览 10提问于2020-07-29得票数 0

回答已采纳

2回答

NFT清单价格

web-scraping、blockchain、nft、opensea

OpenSea允许用户买卖NFT。在OpenSea中，您可以查看项目中列出的NFT的价格。当NFT被列出时，列出的价格是存储在区块链上，还是静态地存储在OpenSea的平台上？最终，我正在寻找一种方法，以刮价格上市的令牌在任何NFT项目。虽然我可以直接从OpenSea的网站上抓取，但是NFT数据被延迟加载，这使得直接从OpenSea.io抓取数据的过程更加复杂--我不希望使用selenium。 tl;dr :在不使用OpenSea的情况下，有什么方法可以确定项目中NFT令牌的价格吗？

浏览 7提问于2022-03-03得票数 0

1回答

使用python抓取web数据

python、web-scraping、beautifulsoup

我正在尝试写一个代码，从imdb的TOP250网页抓取数据。我写的代码如下所示。代码可以工作，并给出我想要的结果。但我面临的问题在于代码返回的结果数量。当我在我的笔记本电脑上使用它时，它产生了23个结果，imdb列出的前23个电影。但是当我从我的一个朋友那里跑的时候，它产生了正确的250个结果。这一切为什么要发生？为了避免这种情况，应该做些什么？ from bs4 import BeautifulSoup import requests import sys from StringIO import StringIO try: import cPickle as pickle exc

浏览 3提问于2014-09-16得票数 3

1回答

在python中抓取网页

python、web-scraping

我对抓取网页是完全陌生的，但我真的想在python中学习它。我对python有一个基本的理解。我很难理解代码来抓取网页，因为我找不到关于代码使用的模块的好文档。代码删除了一些网页上的电影数据在评论“模式中的选择遵循CSS的规则”之后，我陷入了困境。我想了解这些代码背后的逻辑，或者一个好的文档来理解模块。我以前有什么需要学习的话题吗？守则如下： import requests from pattern import web from BeautifulSoup import BeautifulSoup url = 'http://www.imdb.com/search/tit

浏览 2提问于2014-01-12得票数 1

回答已采纳

2回答

抓取位于同一标题/类下的多个锚标记

python、web-scraping、beautifulsoup

我正试图从IMDB中抓取顶级集数据，并提取节目名称和该集的名称。然而，我面临的问题是，节目名称和节目名称都是锚标签，在相同的标题下。以下是代码： url = "https://www.imdb.com/search/title/?title_type=tv_episode&num_votes=1000,&sort=user_rating,desc&ref_=adv_prv" response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser')

浏览 4提问于2022-02-17得票数 0

回答已采纳

1回答

使用WebScraping从IMDb到BeautifulSoup的故事情节部分

python、beautifulsoup、imdb

我正在尝试抓取IMDb的故事情节部分，但是我无法用下面的代码来实现。有人能帮帮我吗？ import imdb import requests from tqdm import tqdm from bs4 import BeautifulSoup ia = imdb.IMDb() import re def get_summary(url): r = requests.get(url=url) soup = BeautifulSoup(r.text, 'html.parser') summ = soup.find_all("div",

浏览 6提问于2022-07-08得票数 0

1回答

通过Scrapy下载动态网页内容(python 2.7)

python、web-scraping、scrapy

我回到了这个项目(web抓取动态内容)，然后继续学习本教程，但是我无法完成它。我在框架0.14中使用python2.7 在我的项目中，获取数据显然是最重要的一点，我开始了解使用ajax抓取动态数据的站点的技术，但是在这个示例中，我无法实际下载图像。刮刀器运行命令(在windows 7上的cmd.exe中)：刮除性蜘蛛nasa.py 但是它实际上没有下载任何东西(它只解析数据)。我是不是遗漏了什么？这是第一个真正的编程项目，在那里我冒险进入非初学者的领域，肯定是迷路了。这是本教程：对于允许脚本下载图像到本地存储的正确代码，有什么建议吗？谢谢:)

浏览 2提问于2012-02-06得票数 0

回答已采纳

2回答

如何在Python中使用VPN进行VPN抓取？

python、web-scraping、beautifulsoup、ip、vpn

我已经做了一个Python程序，它用美丽的汤在网上抓取IMDB，以制作一个mySQL数据库，里面有不同类别中所有收视率最高的电影的表。到目前一切尚好。我的问题是，我是在挪威做这件事的，而且很多电影片名都被翻译成了挪威语。例如，在从挪威IP地址打开的IMDB的顶部列表中，"The Shawshank Redemption“被翻译为"Frihetens Regn”。我希望所有的标题都是英文的。也许有一些免费的VPN，你可以从Python中激活，并与Beautifulsoup一起工作？或者有没有人有其他的解决方案？

浏览 197提问于2019-12-28得票数 2

回答已采纳

1回答

如何根据刮取结果中的符号将一列分成两列？

r、dataframe、split

因此，我使用rvest抓取了IMDB网站，并遇到了一些分裂问题。我尝试过不同的方法来拆分列，但都失败了。这是我从IMDB网站抓取信息的代码： votes_gross <- pagesource %>% html_nodes(".sort-num_votes-visible") %>% html_text() 然后，我使用以下代码进行清理和拆分： votes_gross <- gsub("\r?\n|\r", " ", votes_gross) votes_gross <- data.frame(votes_gros

浏览 1提问于2019-04-09得票数 1

回答已采纳

1回答

R-帮助我从网页上抓取链接

r、web-scraping、rvest

我正在从IMDB电影列表中抓取数据。我想刮每一部电影的链接，但不能正确地确定它是存储在页面上的位置。链接的一部分是这样存储的:链接屏幕截图我尝试过的：完整代码预期的解决方案:抓取每个胶片的链接，如果需要，可以在以后使用。

浏览 29提问于2019-07-12得票数 0

回答已采纳

1回答

无法用漂亮汤打印“无”：'NoneType‘对象不可订阅

python、beautifulsoup

我一直在试图在这里发现的问题中找到一个解决方案，但是找不到一个能给我某种解决方案或类似方法来解决我的问题的方法。我对python非常陌生，作为第一步，我想学习如何使用漂亮的soup从IMDB中抓取数据。我想刮电影的名字，IMDB评级和票数。名单上有些电影没有评级和票数，我得到的是:非常感谢你的评论。完整的跟踪如下:跟踪(最近一次调用)：文件"C:/Users/nmartine/PycharmProjects/ratings_ScraperMetracritic/venv/ratings_ScraperMetacritic.py"，第24行，在container.find= co

浏览 2提问于2018-06-11得票数 0

回答已采纳

1回答

for循环在jinja中，烧瓶

python、html、flask、jinja2

我有一个从数据集中选择匹配数据并将其作为dict返回的函数。函数如下所示。 def Return_details(movie_name): t = movie_details.loc[movie_details['title'].str.contains(movie_name), 'title'] imdb = movie_details.loc[movie_details['title'].str.contains(movie_name), 'imdb_score'] g = movie_details

浏览 22提问于2020-02-02得票数 0

回答已采纳

1回答

将一行与Python中的sql结合在一起

python、sql、list、row

我创建了一个使用python从imdb.txt文件中插入一些数据的sql文件。我的密码是： import re import sqlite3 conn = sqlite3.connect('imdb1.db') c = conn.cursor() c.execute('''CREATE TABLE imdb1 (ROWID INTEGER PRIMARY KEY, Title, Rating)''') x = open("ratings.list.txt","r") movread = x.r

浏览 3提问于2014-05-10得票数 1

回答已采纳

1回答

asp.net mvc应用程序中的网络浏览器托管问题

asp.net-mvc、web-scraping

在我的Asp.Net MVC web应用程序中，我必须通过网站从站点获取数据。对于刮取数据，我需要登录到站点，然后通过单击菜单选项卡到达一个站点，然后从该页面中刮取数据。该站点的刮除包含2帧。我以前通过windows控件在我的一个windows项目中实现了web抓取。我遵循以下将web浏览器控件集成到我的web应用程序中。在visual环境下，一切都很好，我通过web浏览器抓取网站上的数据。但是当我试图托管应用程序时，它并没有像预期的那样工作。web浏览器控件不会加载。我一直在寻找解决方案，但还没有找到可行的解决方案。我尝试通过iframe和使用Silverlight Webbrowser控

浏览 3提问于2013-07-18得票数 6