腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >从网站上抓取新闻标题的问题

问从网站上抓取新闻标题的问题
EN

Stack Overflow用户

提问于 2022-11-03 00:51:42

回答 1查看 63关注 0票数 0

我试图从这个网站上提取所有的标题：https://www.theguardian.com/international。我已经尝试过这么多的xpath，但是没有一个能给我带来标题，尽管代码可以工作。对我做错了什么有什么想法吗？谢谢!

这是我的密码：

guardian_url <- "https://www.theguardian.com/international"
guardian <- read_html(guardian_url)

headlines <- guardian %>% 
  html_elements(xpath = '//html/body/div[3]/div') %>% 
  html_text2()

web-scraping

xpath

性能强劲，每月20元起的MySQL

功能完善，便宜稳定，没有业务可以自动停机，强效降本的MySQL

回答 1

Stack Overflow用户

发布于 2022-11-03 02:31:41

//a[@data-link-name='article'and not(contains(@class, 'u-faux-block-link__overlay'))]

这就选择了标题和副标题。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74300277

复制

spark读取多个文件夹(嵌套)下的多个文件

spark 腾讯云测试服务

在正常调用过程中，难免需要对多个文件夹下的多个文件进行读取，然而之前只是明确了spark具备读取多个文件的能力。

sparkexpert

2022/05/07

3.2K0

matlab处理多个文件夹中的image，保存为mat格式。

matlab image

train = cell(11400, 1); label = zeros(11400, 1); dis1 = dir(['E:\Adesk\Cpp-Primer\PCANet\PCANet\datas\train\' '.']); nms1 = {dis1.name}; i=0; for m = 1:length(nms1) nm1 = ['E:\Adesk\Cpp-Primer\PCANet\PCANet\datas\train\' nms1{m}]; dis2 = dir([nm1 '

MachineLP

2022/05/09

1.1K0

Java中多个异常的捕获顺序(多个catch)

打包 java

import java.io.IOException; public class ExceptionTryCatchTest { public void doSomething() throws IOException{ System.out.println("do somthing"); } public static void main(String[] args){ ExceptionTryCatchTest etct = new ExceptionTryCatchTest(); try { etct.doSomething(); } catch (Exception e) { } catch (IOException e) { } } }

用户7886150

2021/04/25

3.8K0

使用Python和OpenCV检测图像中的多个亮点

detect gif image label

本文来自光头哥哥的博客【Detecting multiple bright spots in an image with Python and OpenCV】，仅做学习分享。

周旋

2020/10/23

4.1K0

在pycharm中如何将django中多个app放到同个文件夹apps处理

app import message task

新建apps文件夹后mark为source目录，然后在Setting中import方式为

Ewdager

2020/07/14

2K0

在MapReduce中利用MultipleOutputs输出多个文件

c++编程算法 tcp/ip hadoop mapreduce

用户在使用Mapreduce时默认以part-＊命名，MultipleOutputs可以将不同的键值对输出到用户自定义的不同的文件中。

星哥玩云

2022/07/03

2.1K0

python中多个if语句用法_python中if函数多个条件怎么用

python apple cookies title

1.只有 if 进行判断desserts = [‘ice cream’, ‘chocolate’, ‘apple crisp’, ‘cookies’]

全栈程序员站长

2022/11/09

4.4K0

Centos8中如何更改文件夹中多个文件的扩展名

shell 编程算法

在目录中递归更改文件扩展名的最常见方法是使用 shell 的 for 循环。我们可以使用 shell 脚本提示用户输入目标目录、旧的扩展名和新的扩展名以进行重命名。以下是脚本内容：

用户7639835

2021/09/01

3.7K0

图像处理中C++如何同时返回多个值

程序设计程序员工作求职算法

1 . pair<T,T> 返回两个值 //返回两个值的情况 pair<vector<double>,int> R_R(Mat& img) { int n=img.rows; vector<double> a; unsigned int m=img.cols; unsigned int k=img.rows; for(unsigned int i=0;i<m;i++) { for(unsigned int j=0;j<k;j++)

用户9831583

2022/06/16

7960

Centos8中如何更改文件夹中多个文件的扩展名

shell 编程算法

用户9236362

2021/11/30

4K0

Centos8中如何更改文件夹中多个文件的扩展名

shell 编程算法

在目录中递归更改文件扩展名的最常见方法是使用 shell 的 for 循环。我们可以使用 shell 提示用户输入目标目录、旧的扩展名和新的扩展名以进行重命名。以下是内容：

用户1685462

2021/09/05

3.3K0

15. 在错误分析中并行多个想法

其他

你的团队有以下几个想法，来改进你的猫咪分类器: • 解决狗被错误分为猫咪的问题。 • 解决“大型猫科动物(greast cats)”（狮子或豹子等）被错认家猫（宠物）的问题 • 提高系统在模糊(

YingJoy_

2018/05/30

1.3K0

在Ubuntu 系统中怎么切换多个 PHP 版本

php ubuntu 程序工作系统

会长君

2023/04/25

2.5K0

网页中多个盒子的设置

hbuilder

在网页排版时，通常会将网页分成几个部分，这就需要将网页分成一个个的盒子。探讨网页中多个盒子的设置。

算法与编程之美

2021/11/23

2.1K0

15. 在错误分析中并行多个想法

编程算法机器学习

你的团队有以下几个想法，来改进你的猫咪分类器: • 解决狗被错误分为猫咪的问题。 • 解决“大型猫科动物(greast cats)”（狮子或豹子等）被错认家猫（宠物）的问题 • 提高系统在模糊(Blurry)图像上的表现 • … 你可以并行并且有效的评估这些想法。我通常会创建一个表格，查看100个分类错误的开发集样本并记录在表格上，同时进行注释。用有小开发集里的4个错误分类样本来说明这个过程，你的表格大概将会是下面的样子:

YingJoy_

2018/05/09

2.9K2

python中处理多个异常

面向对象编程

我们把多个明确的异常归类到一起，用同一种方式来进行处理。我们把多个异常写到同一个except中用小括号括起来，中间的异常用逗号隔开。

刘金玉编程

2019/09/19

4.2K0

java中类中多个Synchronized方法

java

下面给出一个例子，说明一个class中有两个方法synchronized的情况。它们互相阻挡的用法和上面的“一个方法有synchronized”的情况是一样的。

马克java社区

2021/04/23

9070

Spring读取mybatis在多个jar包下的的mapper文件

xml spring jar java

刚开始的时候我的配置文件在同名目录下都是在/mapper下，导致只能读取一个jar中的mapper文件。先解决如下： 1.将mapper文件放在不能放在同名的目录下。比如：user.jar放在/user下，common.jar放在common下 2.在Spring中配置 (记住：classpath后跟*号) <bean id="sqlSessionFactory" class="org.mybatis.spring.SqlSessionFactoryBean"> <property name="mapperLocations"> <array> <value>classpath*:user/*.xml</value> <value>classpath*:common/*.xml</value> </array> </property>

似水的流年

2019/12/06

1.9K0

python 中迭代多个序列

其他

http://blog.csdn.net/he_jian1/article/details/40819407

bear_fish

2018/09/20

8670

点击加载更多

相似问题

Server日期时间到日期时间字符串列

Datatable Compute方法将字符串列转换为日期

清理熊猫日期时间字符串列

将日期时间的字符串列表转换为日期时间

在DataTable中按日期对字符串列进行排序

活动推荐

快速将图片识别为可编辑文本，高准确率

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例