我用python编写了一些代码来解析网页中的标题和链接。最初,我试图从左边的栏中解析链接,然后通过跟踪每个链接从每个页面中抓取上述文档。我做得完美无缺。我试图将不同链接的文档保存在一个excel文件中不同的页面中。但是,它创建了几个“工作表”,从我的脚本中的标题变量中提取所需的部分作为工作表名。我面临的问题是-当数据被保存时,只有链接中的每个页面的最后记录保存在我的excel工作表中,而不是完整的记录中。下面是我尝试过的脚本:
import requests
from lxml import html
from pyexcel_ods3 import save_data
web_link =