import csv  

csvFile = open("../files/test.csv", 'w+')
try:
	writer = csv.writer(csvFile)
	writer.writerow(('number', 'number plus 2', 'number times 2'))
	for i in range(10):
		writer.writerow( (i, i+2, i*2))
finally:
	csvFile.close()
```  
  
这种方案来处理教务处的数据，就很方便。  

这里拿处理课表的来说。  

解析课表的网页源码会看到有一个table的标签，这个很重要。  

    <table id="tableObj" width="99%" border="0" cellspacing="0" cellpadding="0" class="arranging_arrange">

确定了table和class，就看开始剥洋葱了。

import csv from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen(“课表url”) bsObj = BeautifulSoup(html)

看网页源码的class

table = bsObj.findAll(“table”,{“class”:”arranging_arrange”})[0]

#剥第一层洋葱 rows = table.findAll(“tr”)

#存储CSV csvFile = open(“../files/editors.csv”, ‘wt’, newline=’’, encoding=’utf-8’) writer = csv.writer(csvFile)

try: for row in rows: csvRow = []

#继续一层层剥洋葱
for cell in row.findAll(['td', 'th']):
    csvRow.append(cell.get_text())
writer.writerow(csvRow)

finally: csvFile.close() ```

这样就可以得到存储在当前目录的CSV文件了。

用Notepad++打开可以看，用excel打开会乱码。

虐狗节，撸代码，还有谁。

哈哈哈哈。

学习【爬虫】系列

【爬虫】（五）数据存储之CSV

看网页源码的class

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐