首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在BeautfulSoup中索引多个表

在BeautfulSoup中索引多个表
EN

Stack Overflow用户
提问于 2020-11-09 04:42:00
回答 2查看 60关注 0票数 2

我想解析的这个页面- https://fbref.com/en/comps/9/gca/Premier-League-Stats

它有两个表,我试图从第二个表中获取信息,但是每次运行这段代码时,它都会显示第一个表。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from bs4 import BeautifulSoup
import requests

source = requests.get('https://fbref.com/en/comps/9/gca/Premier-League-Stats').text
soup = BeautifulSoup(source, 'lxml')
stattable = soup.find('table', class_= 'min_width sortable stats_table min_width shade_zero')[1]

print(stattable)

min_width sortable stats_table min_width shade_zero是‘第二个’表的ID。

它没有给我一个错误,也没有返回任何东西。它是空的。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-11-09 11:30:21

既然第二个表是动态生成的,那么为什么不结合seleniumBeautifulSouppandas来获得您想要的呢?

例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import time

import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.headless = False
driver = webdriver.Chrome(options=options)

driver.get("https://fbref.com/en/comps/9/gca/Premier-League-Stats")
time.sleep(2)

soup = BeautifulSoup(driver.page_source, "html.parser").find("div", {"id": "div_stats_gca"})
driver.close()

df = pd.read_html(str(soup), skiprows=[0, 1])
df = pd.concat(df)
df.to_csv("data.csv", index=False)

这会产生一个.csv文件,看起来就像你想要的那个表。:)

票数 1
EN

Stack Overflow用户

发布于 2020-11-09 10:56:13

您在检查元素时看到的HTML是使用Javascript生成的。但是,在原始html中不能使用脚本获得相同的类。我禁用了这个站点的Javascript,我发现表是不可见的。

您可以尝试类似于Selenium之类的东西。this问题中有很好的信息。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64751900

复制
相关文章
从mybatis sql模板中获取参数信息
最近在尝试从mybatis sql模板中获取参数信息,期间学习了mybatis内部的一些结构,接下来笔者就向大家分享mybatis相关知识和具体代码实现。
zhangheng
2021/01/12
7.8K0
从mybatis sql模板中获取参数信息
【工具类】jwt 从request头信息中获取jwt信息
XcOauth2Util 类 package com.xuecheng.framework.utils; import lombok.Data; import org.apache.commons.lang3.StringUtils; import javax.servlet.http.HttpServletRequest; import java.util.Map; /** * Created by mrt on 2018/5/25. */ public class XcOauth2Util {
周杰伦本人
2022/10/25
1.3K0
Springsecurity从当前请求对象中获取用户信息
SpringMVC中Controller的请求参数都是当前请求HttpServletRequest带来的,Authentication Principal也是HttpServletRequest带来的,在Controller层我们拿到的是HttpServletRequest的实例是Servlet3SecurityContextHolderAwareRequestWrapper
周杰伦本人
2022/10/25
2.9K0
Spring Security - 02 从 SecurityContextHolder 中获取用户信息
新建 HelloController 控制器类,我们可以通过 SecurityContextHolder 获取用户信息(第 17 ~ 19 行):
用户6619361
2022/04/20
2K0
定时从列表中爬今日通知信息,打包成windows服务
每天8点爬取今日发布的新闻和通知公告,将爬取后的信息保存到Excel文件中,将程序发布成windows服务,开机即可自动启动。
happlyfox
2018/10/31
6410
简单的语音分类任务入门(需要些深度学习基础)
上次公众号刚刚讲过使用 python 播放音频与录音的方法,接下来我将介绍一下简单的语音分类处理流程。简单主要是指,第一:数据量比较小,主要是考虑到数据量大,花费的时间太长。作为演示,我只选取了六个单词作为分类目标,大约 350M 的音频。实际上,整个数据集包含 30 个单词的分类目标,大约 2GB 的音频。第二 :使用的神经网络比较简单,主要是因为分类目标只有 6 个。如果读者有兴趣的话,可以使用更加复杂的神经网络,这样就可以处理更加复杂的分类任务。第三:为了计算机能够更快地处理数据,我并没有选择直接把原始数据‘’喂“给神经网络,而是借助于提取 mfcc 系数的方法,只保留音频的关键信息,减小了运算量,却没有牺牲太大的准确性。
用户2870857
2019/12/22
5K1
听音识情绪 | 程序员手把手教你搭建神经网络,更快get女朋友情绪,求生欲max!⛵
《礼记·乐记》中说:“凡音之起,由人心生也。人心之动,物使之然也。感于物而动,故形于声。声相应,故生变。”
ShowMeAI
2022/08/09
6900
听音识情绪 | 程序员手把手教你搭建神经网络,更快get女朋友情绪,求生欲max!⛵
浅谈MFCC
MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将维的目的。
全栈程序员站长
2022/07/21
1.7K0
浅谈MFCC
从SpringMVC获取用户信息谈起
上周末拜读了一位牛人的公众号文章<[Token认证,如何快速方便获取用户信息](https://mp.weixin.qq.com/s/Qi82d5xmlYwiuaGRSn54uw)>,语言风趣,引人入胜,为了表示涛涛敬仰之情,已经转载到自己的公众号了。
A稻田守望者
2019/09/30
1.5K0
从SpringMVC获取用户信息谈起
Flink中Watermark定时生成源码分析
watermark的生成策略有两种:一种是周期性生成,另外一种是根据特定标记生成。在实际使用中大多数情况下会选择周期性生成方式也就是AssignerWithPeriodicWatermarks方式,使用方式如下:
Flink实战剖析
2022/04/18
6590
Flink中Watermark定时生成源码分析
用python获取天气数据,并作定时播报
思路 1.调用和风天气的API,获取天气数据 2.用百度语音API,将天气数据合成语音 3.用树莓派每天早上定时播报天气(定时任务crontab + Python脚本 + mpg123播放器) Pyt
机器学习AI算法工程
2018/03/14
2.6K0
用python获取天气数据,并作定时播报
如何使用AndroidQF快速从Android设备中获取安全取证信息
AndroidQF,全称为Android快速取证(Android Quick Forensics)工具,这是一款便携式工具,可以帮助广大研究人员快速从目标Android设备中获取相关的信息安全取证数据。该工具基于Snoopdroid项目实现其功能,利用的是官方ADB源码,并且使用了Go语言进行重构。
FB客服
2021/12/27
7.1K0
如何使用AndroidQF快速从Android设备中获取安全取证信息
安卓(Android)生成证书和信息获取
这套方法生成证书没有什么问题,但是在获取证书信息的时候,jdk1.8版本没有什么问题,但是jdk11和jdk17均无法输出MD5秘钥。为此找了一个比较好用的工具来进行识别。(该工具也可以进行生成各种秘钥,非常强大)
华创信息技术
2022/05/28
7810
从Go的二进制文件中获取其依赖的模块信息
我们用 Go 构建的二进制文件中默认包含了很多有用的信息。例如,可以获取构建用的 Go 版本:
Jintao Zhang
2021/02/26
2.6K0
人工智能下的音频还能这样玩!!!!
Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大。本文主要介绍librosa的安装与使用方法。
Python研究者
2021/08/21
1.5K0
Python MFCC算法
MFCC(梅尔倒谱系数)的算法思路 读取波形文件 汉明窗 分帧 傅里叶变换 回归离散数据 取得特征数据 Python示例代码 import numpy, numpy.fft def mel(f): return 2595. * numpy.log10(1. + f / 700.) def melinv(m): return 700. * (numpy.power(10., m / 2595.) - 1.) class MFCC(objec
Pulsar-V
2018/04/18
1.6K0
从Python调用堆栈获取行号等信息
程序中的日志打印,或者消息上传,比如kafka消息等等。经常上传的消息中需要上传堆栈信息中的文件名、行号、上层调用者等具体用于定位的消息。Python提供了以下两种方法:
职场亮哥
2020/10/10
2.6K0
python获取linux中top信息
import os,time,sys import paramiko,pexpect
py3study
2020/01/10
3.7K0
Flutter中的获取设备信息以及获取地理位置
在使用之前,我们一定要好好阅读文档,关于Android以及iOS平台的相关配置,我在这里不做过多介绍,大家自己去看文档。
拉维
2019/09/10
12.3K0
点击加载更多

相似问题

用Librosa计算MFCC

11

为什么librosa librosa.feature.mfcc()会吐出一个2D数组?

23

从MySQL获取特定时间添加的信息

34

从频谱图时间/频率序列数组中获取MFCC

140

Librosa未能绘制生成的mfcc

16
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文