开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在BeautfulSoup中索引多个表

问在BeautfulSoup中索引多个表
EN

Stack Overflow用户

提问于 2020-11-09 04:42:00

回答 2查看 60关注 0票数 2

我想解析的这个页面- https://fbref.com/en/comps/9/gca/Premier-League-Stats

它有两个表，我试图从第二个表中获取信息，但是每次运行这段代码时，它都会显示第一个表。

from bs4 import BeautifulSoup
import requests

source = requests.get('https://fbref.com/en/comps/9/gca/Premier-League-Stats').text
soup = BeautifulSoup(source, 'lxml')
stattable = soup.find('table', class_= 'min_width sortable stats_table min_width shade_zero')[1]

print(stattable)

min_width sortable stats_table min_width shade_zero是‘第二个’表的ID。

它没有给我一个错误，也没有返回任何东西。它是空的。

媒体处理1元起

智能、强大、全面的多媒体数据处理服务，助您提升媒体质量、降低成本，媒体处理套餐低至1元

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-11-09 11:30:21

既然第二个表是动态生成的，那么为什么不结合selenium、BeautifulSoup和pandas来获得您想要的呢？

例如：

import time

import pandas as pd
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

options = Options()
options.headless = False
driver = webdriver.Chrome(options=options)

driver.get("https://fbref.com/en/comps/9/gca/Premier-League-Stats")
time.sleep(2)

soup = BeautifulSoup(driver.page_source, "html.parser").find("div", {"id": "div_stats_gca"})
driver.close()

df = pd.read_html(str(soup), skiprows=[0, 1])
df = pd.concat(df)
df.to_csv("data.csv", index=False)

这会产生一个.csv文件，看起来就像你想要的那个表。:)

票数 1

EN

Stack Overflow用户

发布于 2020-11-09 10:56:13

您在检查元素时看到的HTML是使用Javascript生成的。但是，在原始html中不能使用脚本获得相同的类。我禁用了这个站点的Javascript，我发现表是不可见的。

您可以尝试类似于Selenium之类的东西。this问题中有很好的信息。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64751900

复制

相关文章

从mybatis sql模板中获取参数信息

mybatis sql xml 网络安全

最近在尝试从mybatis sql模板中获取参数信息，期间学习了mybatis内部的一些结构，接下来笔者就向大家分享mybatis相关知识和具体代码实现。

zhangheng

2021/01/12

7.8K0

从mybatis sql模板中获取参数信息

【工具类】jwt 从request头信息中获取jwt信息

jwt request 工具类

XcOauth2Util 类 package com.xuecheng.framework.utils; import lombok.Data; import org.apache.commons.lang3.StringUtils; import javax.servlet.http.HttpServletRequest; import java.util.Map; /** * Created by mrt on 2018/5/25. */ public class XcOauth2Util {

周杰伦本人

2022/10/25

1.3K0

Springsecurity从当前请求对象中获取用户信息

servlet authentication null ole security

SpringMVC中Controller的请求参数都是当前请求HttpServletRequest带来的，Authentication Principal也是HttpServletRequest带来的，在Controller层我们拿到的是HttpServletRequest的实例是Servlet3SecurityContextHolderAwareRequestWrapper

周杰伦本人

2022/10/25

2.9K0

Spring Security - 02 从 SecurityContextHolder 中获取用户信息

新建 HelloController 控制器类，我们可以通过 SecurityContextHolder 获取用户信息（第 17 ~ 19 行）：

用户6619361

2022/04/20

2K0

定时从列表中爬今日通知信息，打包成windows服务

每天8点爬取今日发布的新闻和通知公告，将爬取后的信息保存到Excel文件中，将程序发布成windows服务，开机即可自动启动。

happlyfox

2018/10/31

6410

简单的语音分类任务入门（需要些深度学习基础）

神经网络 python 语音识别

上次公众号刚刚讲过使用 python 播放音频与录音的方法，接下来我将介绍一下简单的语音分类处理流程。简单主要是指，第一：数据量比较小，主要是考虑到数据量大，花费的时间太长。作为演示，我只选取了六个单词作为分类目标，大约 350M 的音频。实际上，整个数据集包含 30 个单词的分类目标，大约 2GB 的音频。第二：使用的神经网络比较简单，主要是因为分类目标只有 6 个。如果读者有兴趣的话，可以使用更加复杂的神经网络，这样就可以处理更加复杂的分类任务。第三：为了计算机能够更快地处理数据，我并没有选择直接把原始数据‘’喂“给神经网络，而是借助于提取 mfcc 系数的方法，只保留音频的关键信息，减小了运算量，却没有牺牲太大的准确性。

用户2870857

2019/12/22

5K1

听音识情绪 | 程序员手把手教你搭建神经网络，更快get女朋友情绪，求生欲max！⛵

深度学习 NLP 服务语音识别

《礼记·乐记》中说：“凡音之起，由人心生也。人心之动，物使之然也。感于物而动，故形于声。声相应，故生变。”

ShowMeAI

2022/08/09

6900

听音识情绪 | 程序员手把手教你搭建神经网络，更快get女朋友情绪，求生欲max！⛵

MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如：对于一帧有512维(采样点)数据，经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将维的目的。

全栈程序员站长

2022/07/21

1.7K0

从SpringMVC获取用户信息谈起

上周末拜读了一位牛人的公众号文章<[Token认证，如何快速方便获取用户信息](https://mp.weixin.qq.com/s/Qi82d5xmlYwiuaGRSn54uw)>，语言风趣，引人入胜，为了表示涛涛敬仰之情，已经转载到自己的公众号了。

A稻田守望者

2019/09/30

1.5K0

从SpringMVC获取用户信息谈起

Flink中Watermark定时生成源码分析

processing flink unix 大数据

watermark的生成策略有两种：一种是周期性生成，另外一种是根据特定标记生成。在实际使用中大多数情况下会选择周期性生成方式也就是AssignerWithPeriodicWatermarks方式，使用方式如下：

Flink实战剖析

2022/04/18

6590

Flink中Watermark定时生成源码分析

用python获取天气数据，并作定时播报

python api json linux

思路 1.调用和风天气的API，获取天气数据 2.用百度语音API，将天气数据合成语音 3.用树莓派每天早上定时播报天气（定时任务crontab + Python脚本 + mpg123播放器） Pyt

机器学习AI算法工程

2018/03/14

2.6K0

用python获取天气数据，并作定时播报

如何使用AndroidQF快速从Android设备中获取安全取证信息

https 网络安全 github shell git

AndroidQF，全称为Android快速取证（Android Quick Forensics）工具，这是一款便携式工具，可以帮助广大研究人员快速从目标Android设备中获取相关的信息安全取证数据。该工具基于Snoopdroid项目实现其功能，利用的是官方ADB源码，并且使用了Go语言进行重构。

FB客服

2021/12/27

7.1K0

如何使用AndroidQF快速从Android设备中获取安全取证信息

安卓(Android)生成证书和信息获取

github https git 开源网络安全

这套方法生成证书没有什么问题，但是在获取证书信息的时候，jdk1.8版本没有什么问题，但是jdk11和jdk17均无法输出MD5秘钥。为此找了一个比较好用的工具来进行识别。（该工具也可以进行生成各种秘钥，非常强大）

华创信息技术

2022/05/28

7810

从Go的二进制文件中获取其依赖的模块信息

我们用 Go 构建的二进制文件中默认包含了很多有用的信息。例如，可以获取构建用的 Go 版本：

Jintao Zhang

2021/02/26

2.6K0

人工智能下的音频还能这样玩！！！！

Librosa是一个用于音频、音乐分析、处理的python工具包，一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有，功能十分强大。本文主要介绍librosa的安装与使用方法。

Python研究者

2021/08/21

1.5K0

Python MFCC算法

python 编程算法 numpy 人工智能

MFCC(梅尔倒谱系数)的算法思路读取波形文件汉明窗分帧傅里叶变换回归离散数据取得特征数据 Python示例代码 import numpy, numpy.fft def mel(f): return 2595. * numpy.log10(1. + f / 700.) def melinv(m): return 700. * (numpy.power(10., m / 2595.) - 1.) class MFCC(objec

Pulsar-V

2018/04/18

1.6K0

从Python调用堆栈获取行号等信息

python serverless

程序中的日志打印，或者消息上传，比如kafka消息等等。经常上传的消息中需要上传堆栈信息中的文件名、行号、上层调用者等具体用于定位的消息。Python提供了以下两种方法：

职场亮哥

2020/10/10

2.6K0

python获取linux中top信息

free import paramiko root time

import os,time,sys import paramiko,pexpect

py3study

2020/01/10

3.7K0

Flutter中的获取设备信息以及获取地理位置

ios android device location 高德地图

在使用之前，我们一定要好好阅读文档，关于Android以及iOS平台的相关配置，我在这里不做过多介绍，大家自己去看文档。

拉维

2019/09/10

12.3K0

点击加载更多

相似问题

用Librosa计算MFCC

11

为什么librosa librosa.feature.mfcc()会吐出一个2D数组？

23

从MySQL获取特定时间添加的信息

34

从频谱图时间/频率序列数组中获取MFCC

140

Librosa未能绘制生成的mfcc

16

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例