分别说明我们的环境是python,编码是utf-8
然后import了四个库,分别是urllib2,urllib,os,和Beautifulsoup库....导入Beautifulsoup库的方式和其他三个不太一样.我暂时也不清楚为什么python用这种导入方式,不过照猫画虎就行了..../doc/1/1279/1279531.shtml').read()
这句很简单,就是读取网页的html.然后把值赋给html这个变量.python里声明变量前面不用加任何东西,不用加声明语句和变量类型...,就连JavaScript声明变量还要加个var呢....我们获取了网页的html之后呢,声明了一个Beautifulsoup变量soup,用来准备解析html.
liResult = soup.findAll('img',attrs={"width":"175