首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python2.7:未知url类型: urllib2 - BeautifulSoup

Python2.7:未知url类型: urllib2 - BeautifulSoup
EN

Stack Overflow用户
提问于 2018-06-11 02:00:33
回答 1查看 243关注 0票数 0

导入库

代码语言:javascript
复制
import urllib2
from bs4 import BeautifulSoup

新库:

代码语言:javascript
复制
import csv
import requests 
import string

定义变量:

代码语言:javascript
复制
i = 1
str_i = str(i)
seqPrefix = 'seq_'
seq_1 = str('https://anyaddress.com/')
quote_page = seqPrefix + str_i

#然后,使用Python来声明url的urllib2页面。

代码语言:javascript
复制
# query the website and return the html to the variable 'page'
page = urllib2.urlopen(quote_page)  


#Finally, parse the page into BeautifulSoup format so we can use BeautifulSoup to work on it.

# parse the html using beautiful soup and store in variable `soup`
soup = BeautifulSoup(page, 'html.parser')

因此,所有的都是fine...except:

错误消息:

页面= urllib2.urlopen(quote_page)文件"C:\Python27\lib\urllib2.py",第154行,在url打开返回opener.open( url,数据,超时)文件"C:\Python27\lib\urllib2.py",第423行,在open protocol = req.get_type()文件"C:\Python27\lib\urllib2.py",第285行,在get_type raise ValueError中,“未知url类型:%s”% self.__original ValueError:未知url类型: seq_1

为什么?

txs。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-11 02:53:15

您可以使用局部变量字典vars()

代码语言:javascript
复制
page = urllib2.urlopen(vars()[quote_page])

按照您的方式,它试图使用字符串" seq_1“作为URL打开URL,而不是使用有效URL的seq_1变量的值。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50786579

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档