如何用BeautifulSoup提取JSON脚本元素

文章/答案/技术大牛

发布

1回答

json、python-3.x、web-scraping、beautifulsoup

我希望在脚本标记中使用键：startDate来提取值。下面是我的代码： # import libraryimport requestsresponse = requests.get(url) #soup = Beau

浏览 15提问于2021-01-28得票数 1

回答已采纳

1回答

如何解决BeautifulSoup抓取时的双重问题

python、web-scraping、beautifulsoup、ldjson

我有一个奇怪的问题，我的脚本从网页上提取一些日期。下面是脚本：import jsonimport requestsimport datetimeid="mediaTable").find_all('script', type='application/ld+json') date_hour = [<e

浏览 2提问于2021-02-03得票数 0

3回答

使用BeautifulSoup解析脚本标记内的json文本

python、json、web-scraping、beautifulsoup、findall

我正在尝试使用BeautifulSoup提取Python3中('script', type='application/ld+json')的@context元素中的文本。我有多个脚本在一个页面内，我想得到在上面的json列出的具体功能。我尝试使用以下代码：

浏览 4提问于2018-10-01得票数 0

1回答

BeautifulSoup -从JS中提取特定的JSON键值

python、html、json、beautifulsoup、html-parsing

我在玩BeautilfulSoup，我正在寻找一种在JS元素中获取特定json字符串的方法。|| []; window.Rent.MOVING_LEADS_SID = 96;</script> 我能够通过BeautifulSoup提取JS，我正在寻找与window.Rent.data键对应的json字符串。

浏览 1提问于2017-05-08得票数 5

回答已采纳

1回答

如何在python中的wanted_list库中组合AutoScraper项时处理数据的不匹配？

python、web-scraping

由于有错配，就有一种可能，如问题和答案被错误地映射出来。在使用AutoScraper或其他web报废库时，是否有适当的方法处理丢失的数据和映射问答？

浏览 3提问于2022-10-17得票数 0

回答已采纳

3回答

从HTML脚本元素内部提取对象键的值

python、beautifulsoup、html-parsing、lxml

--window.agency = < %- JSON.stringify(agency) % >;--> </script>我想要的输出是4243456。我如何使用lxml的美丽汤提取它呢？

浏览 5提问于2017-12-15得票数 2

回答已采纳

1回答

无法通过python抓取从HTML文件中提取#文档

python、html、web-scraping、beautifulsoup

当我检查浏览器上的元素时，显然可以看到确切的web内容。但是当我尝试运行下面的脚本时，我看不到一些网页细节。在网页中，我看到了"#document“元素，这是我运行脚本时缺少的。我怎样才能看到#文档元素的细节，或者用脚本提取。？from bs4 import BeautifulSoup response = requests.get('http://123.123.123.123

浏览 1提问于2017-03-22得票数 3

回答已采纳

1回答

用Python抓取Web数据

python、web、python-requests、screen-scraping

特别是，我希望能够使用这种格式的urls (显然可以更改其他日期的数据)来抓取以前的NHL游戏数据：然而，当我到达页面时，我注意到数据被分解成了几个页面，我不知道如何获得脚本，以获得页面底部的"all

浏览 4提问于2016-11-25得票数 0

回答已采纳

3回答

如何使用python中的Beautifulsoup刮地址(逗号分隔文本)

python、python-3.x、text、beautifulsoup、urllib

urllib.request as url soup = bs.BeautifulSoup

浏览 3提问于2020-12-19得票数 0

回答已采纳

1回答

用美汤刮桌子

python、web-scraping、beautifulsoup

% 17.44 % None import requestsimport pandas91.0.4472.114 Safari/537.36'r =requests.get('https://coinmarketcap.com/historical/20220206/') soup=BeautifulSoup

浏览 4提问于2022-02-14得票数 0

1回答

使用<script>中的BeautifulSoup提取html python3中元素的问题

python-3.x、web-scraping、beautifulsoup、jupyter-notebook、scrape

<div class="c2p6A5" data-qa-locator="product-item" data-tracking="product-card"<script type="application/ld+json"></script>import requests from

浏览 0提问于2019-01-07得票数 0

回答已采纳

1回答

如何用美丽的汤提取数组

python、beautifulsoup

我试图从html文件中的脚本标记中提取一个列表。如何从脚本标记中提取名为标记的列表？from bs4 import BeautifulSoupimport re soup = BeautifulSoup(requests.get

浏览 1提问于2022-10-09得票数 0

回答已采纳

1回答

从html列表返回json字符串

python、beautifulsoup

h2>Pig A</h2> <li><h2>Pig B</h2> <li><h2>Pig C</h2></ol> 我想返回下面列出的三头猪，在JSON我尝试过使用find_all和re def get_pigs(): soup = BeautifulSoup(html_doc, '

浏览 19提问于2019-09-13得票数 3

回答已采纳

2回答

使用Python的BeautifulSoup库从HTML中提取元素

python、html、beautifulsoup、instagram、instagram-api

我希望从Instagram中提取数据，并记录帖子的时间，而不使用auth。from bs4 import BeautifulSoupsession = HT

浏览 1提问于2018-09-11得票数 1

1回答

使用BeautifulSoup创建带有XML文件的JSON

json、xml、beautifulsoup

我正在使用木星笔记本，运行python 3，我的任务是从XML文件中提取数据并将其转换为json格式(甚至可能将json保存在一个output.dat文件中)。我使用BeautifulSoup在节点中导航。我有以下数据："Title": "One km Time Trial"

浏览 0提问于2018-11-10得票数 0

回答已采纳

2回答

无法使用请求和BeautifulSoup定位元素

python、web-scraping

我正在用Python编写一个脚本，使用模块'requests‘和'BeautifulSoup’来抓取以下页面链接中的足球比赛结果：提取并导航到元素中的导航或到"Stats"-tab并提取元素中的信息：page = requests.get("https:&#

浏览 6提问于2021-10-04得票数 0

2回答

用BeautifulSoup隔离脚本

python、html、beautifulsoup

我已经在BeautifulSoup.Is中加载了整个HTML页面，有一种方法可以隔离这个字典集合？ contents = f.read() soup = BeautifulSoup(contentscdn-assets-s3.streeteasy.com/assets/manifest-c93475b02bd2409b4a52e21af023e5d5

浏览 2提问于2020-07-10得票数 1

回答已采纳

1回答

在BeautifulSoup* python中搜索特定的单词*

python、string、python-2.7、beautifulsoup、text-extraction

我正在尝试制作一个python脚本，它读取crunchyroll的页面，并给出副标题的ssid。例如:- <a href="/i-cant-understand-what-my-husband-is-saying/episode-ssid=154757" title="English (US)">English (US)</a> 我想提取"154757&

浏览 0提问于2015-06-28得票数 0

回答已采纳

1回答

无法使用美丽汤从网站上读取表格

python、beautifulsoup、python-requests

import requestsr= requests.get(url)soup = BeautifulSoup(data,"html.parser") 结果，当我在浏览器中手动“检查”元素时，我无法看到表。知道如何用</em

浏览 0提问于2018-03-18得票数 5

回答已采纳

1回答

如何去除第二层的空隙？

python、html

":false},{"iso2":"AL","route":"albania","name":"Albania","url":"/en/rates/albania/import jsonimport requests url = "https://

浏览 4提问于2022-11-21得票数 0

回答已采纳

点击加载更多