腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Python
和
beautifulSoup
从
XML
输出
创建
多个
txt
文件
、
我有一个
XML
页面,我想把它分成几个部分,然后把每个部分的文本分成一个.
txt
文件
,保存的名称
从
001开始,一直到099。例如,我希望在名为001的
文件
中包含Section1的所有内容,在名为002的
文件
中包含Section2的所有内容,依此类推。= urllib.request.urlopen('https://www.govinfo.gov/bulkdata/CFR/2018/title-49/CFR-2
浏览 24
提问于2019-02-11
得票数 0
2
回答
如何
创建
一个循环来遍历URL列表,抓取所有的数据。类似页面的所有URL都保存在一个file.
txt
中(一行中的每个URL)?
、
、
、
我想从具有相似页面结构的
多个
页面中提取一些信息。页面的所有URL都保存在一个file.
txt
中(一行中的每个URL)。我已经
创建
了代码来从一个链接中抓取所有数据(它可以工作)。但我不知道如何
创建
一个循环来遍历
txt
文件
中的所有URL列表,并刮取所有数据。from bs4 import
BeautifulSoup
import requests import pandas as pd\
Pytho
浏览 8
提问于2021-10-06
得票数 1
回答已采纳
0
回答
使用
Python
和
BeautifulSoup
从
XML
文件
创建
字典
、
、
请原谅我对
Python
的初学知识。我需要
使用
BeautifulSoup
遍历
XML
文件
中的某个元素。我正在尝试从一个天气网站
创建
的
XML
文件
中获取信息,现在我正像这样保存
XML
; url = "http://api.met.no/weatherapi/locationforecast我需要
创建
一个符号id的图,以及它在整个
浏览 3
提问于2016-12-29
得票数 1
回答已采纳
3
回答
xml
定义中的
Python
双问号
、
、
、
问题是,当我用
BeautifulSoup
文件
的内容初始化.xhtml时,
xml
在它的末尾得到两个问号。Edit1:,为什么否决? <?
xml
version="1.0" encoding="UTF-8"??>>>>
浏览 9
提问于2012-04-18
得票数 0
回答已采纳
1
回答
迭代
Python
-bs4中的URL列表
、
、
、
我有一个.
txt
文件
(名为test_1.
txt
),格式如下:如果您转到上面的链接之一,您将看到
XML
中的
输出
。我也能做到这一点,准确地打印我需要的数据时,每次只
浏览 6
提问于2014-03-16
得票数 1
回答已采纳
1
回答
运行
python
脚本并
输出
到
txt
以获取URL列表
我有一个用于抓取的
python
脚本--一些URL。URL位于
txt
文件
中的列表中。
python
脚本(只有相关部分)如下:from bs4 import
BeautifulSoup
print urlprint descriptionprint director 我想对
浏览 0
提问于2019-03-28
得票数 1
2
回答
如何
使用
python
在
xml
中找到特定标记elemnet的值?
、
我试图解析
从
RESTful接口接收到的
xml
数据。在错误情况下(当查询没有在服务器上产生任何结果时),将返回以下文本。现在,我想解析这个字符串以搜索第五行中的status值,例如下面给出的示例。
xml
version="1.0" encoding="UTF-8"?><?
xml
-stylesheet type="text/xsl" href="/3.0/style/exchange.xsl"?b
浏览 9
提问于2013-12-16
得票数 0
回答已采纳
4
回答
将HTML标记替换为另一个并保留文本的AWK
、
、
我有一个很大的HTML
文件
,其中包含:我想将<span>标记替换为<strong>标记: <strong我不是在寻找HTML处理器,因为输入是一个文本
文件
,其中包含一些HTML代码(不是一个干净的/有效的HTML),我正在手动处理
输出
(复制、修改、
使用
它的最后位置)。我只想省点时间换新的。
浏览 8
提问于2022-01-20
得票数 0
回答已采纳
2
回答
如何向heroku节点服务器添加
python
依赖项?
、
、
、
我已经将
python
和
节点构建包添加到我的项目中,我已经
创建
了一个虚拟环境并成功地安装了requirements.
txt
,但是我继续获得模块未找到的错误。requirements.
txt
:报告说,这些要求已经得到满足。(from -r requirements.
txt
(line 1)) Requirement already satisfied (use --upgrade to upgrade):
浏览 3
提问于2017-03-10
得票数 9
2
回答
BeautifulSoup
打印
多个
标签/属性
、
、
、
首先,这是我在
Python
上的第一次尝试,到目前为止,它看起来很容易
使用
,尽管我仍然遇到了一个问题。我正在尝试将
xml
文件
更改为rss-
XML
,原始
xml
源代码如下所示:它最终看起来是这样的: <item&g
浏览 2
提问于2011-05-17
得票数 0
回答已采纳
1
回答
如何修改
Python
代码以将
多个
相邻的"Location“标记打印到单行
输出
、
我是
python
新手,我正在尝试
使用
以下代码将.
xml
文件
中标识为位置的所有标记打印到.
txt
文件
: output = '
浏览 0
提问于2012-10-08
得票数 1
回答已采纳
1
回答
加载大型
XML
文件
并处理MemoryError
、
、
、
我有一个非常大的
XML
文件
(确切地说是20 it,是的,我需要所有的
文件
)。当我尝试加载该
文件
时,收到以下错误:*** error()这是我用来读取
XML
文件
的当前代码:
xml
= open(
浏览 0
提问于2013-02-18
得票数 13
回答已采纳
2
回答
使用
Python
/
BeautifulSoup
遍历.
txt
文件
中的
多个
URL
、
我正在尝试
创建
一个脚本,该脚本获取包含多行YouTube用户名的.
txt
文件
,将其附加到YouTube用户主页URL,然后遍历以获取配置
文件
数据。下面的代码给了我想要的一个用户的信息,但是我不知道
从
哪里开始导入
和
迭代
多个
URL。# -- coding: utf-8 --import re impor
浏览 0
提问于2012-04-09
得票数 1
回答已采纳
1
回答
将
多个
html
文件
中的RegEx结果写入.
txt
外部
文件
、
我很难将从
多个
html
文件
(非英文文本)获得的RegEx结果写入.
txt
外部
文件
。它将它们作为几个字符串
输出
到屏幕上的新行中,但当我试图将其写入一个外部
文件
时,它只编写一个随机字符串。我的代码如下所示:请帮助我如何
从
大约100个
文件
中将所有字符串写入到外部
文件
中?from bs4 import
BeautifulSoup
import stringimport os te
浏览 6
提问于2017-02-09
得票数 1
回答已采纳
2
回答
如何
从
html
文件
中删除所有不必要的标签
和
符号?
、
、
、
、
我正在尝试
使用
Python
的
BeautifulSoup
或HTMLParser
从
美国证券交易委员会的EDGAR系统上的10-K报告(例如公司的代理报告)中提取“唯一”文本信息。然而,我
使用
的解析器似乎不能很好地处理‘
txt
’格式的
文件
,包括很大一部分毫无意义的符号
和
标签以及一些xbrl信息,这些信息根本不是必需的。"""for
Python
3, from urllib.request import url
浏览 2
提问于2017-05-09
得票数 2
1
回答
从
Python
中提取nct_id、PubMed
和
发布类型
、
、
、
从这样的
xml
文件
中,我尝试提取pmid、nct_id
和
发布类型。四个示例
文件
是,一个是NCT_ID。D016428">Journal Article</PublicationType>理想情况下,我希望有一个pd数据
文件
article NCT030707823
浏览 16
提问于2021-12-21
得票数 0
回答已采纳
1
回答
对漂亮的汤对象
使用
diff
、
、
我试图比较两个
XML
文件
中一个特定标记的所有实例的文本。我
使用
的OCR引擎
输出
一个带有标记<OCRCharacters>...</OCRCharacters>中所有ocr字符的
xml
文件
。我
使用
python
2.7.11
和
漂亮的汤4 (bs4)。在终端中,我
使用
两个
xml
文件
名作为参数调用
python
程序。我
使用
$
浏览 1
提问于2016-02-29
得票数 2
回答已采纳
2
回答
如何解析保存为文本的html代码?
、
、
、
我有
多个
.
txt
文件
包含.
txt
代码(来自网页的HTML被复制并保存为.
txt
)。谢谢你的帮助。
浏览 0
提问于2018-08-01
得票数 0
回答已采纳
2
回答
有办法用漂亮的汤写html
文件
吗?我尝试了一个
xml
文件
,它运行得非常好。
、
、
输入:我对
BeautifulSoup
有基本的了解,我部署了代码并
创建
了一个.
xml
文件
,但是现在我想要一个
使用
BeautifulSoup
的.html
文件
。是否有一种方法可以
使用
BeautifulSoup
和
Python
来部署代码以生成以下
输出
?
浏览 2
提问于2012-04-01
得票数 0
1
回答
如何在处理bs4
和
请求后正确打印unicode文本?
、
、
、
、
我正在尝试
创建
一个
txt
单个
文件
,其中包含了Torah的整个文本。我能在谷歌上找到的最好的来源是:。import requests url = 'http://www.mechon-mamre.org/i/t/t01
浏览 2
提问于2013-09-17
得票数 4
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券