首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我正在使用python pandas来提取一些数据(页面标题),但是输出的顺序与我放入代码中的URL的顺序不同

我正在使用python pandas来提取一些数据(页面标题),但是输出的顺序与我放入代码中的URL的顺序不同
EN

Stack Overflow用户
提问于 2021-01-20 23:04:15
回答 2查看 74关注 0票数 0

因此,我编写了代码并运行它,获得了.xlsx文件,但输出的顺序与我在代码中输入的Url列表的顺序不同。

代码语言:javascript
运行
复制
#importing the libraries
import re
import lxml
import  chardet
from os import truncate
import bs4
from bs4 import BeautifulSoup
import multiprocessing
import requests
import pandas as pd
from fake_useragent import UserAgent
import numpy as np

urls = list(('https://isabad.com/advanced-professional-email-templates-opencart-extension' ,
'https://isabad.com/seo-basic-pack-opencart-extension',
'https://isabad.com/x-shipping-pro',
'https://isabad.com/bot-blocker-opencart-extension',
'https://isabad.com/opencart-mobile-application'
))

dit = {}
user_agent = UserAgent()
for url in urls:
        data = requests.get(url, headers={"user-agent": user_agent.chrome})
        soup = bs4.BeautifulSoup(data.content, "lxml")
        dit[url] = soup.find_all("title")
        ex = pd.DataFrame({"title": dit ,})
        print(ex)
        ex.to_excel('sasa.xlsx', index=False, engine='xlsxwriter')

我如何解决这个问题?

EN

回答 2

Stack Overflow用户

发布于 2021-01-20 23:10:08

您正在使用set数据结构来存储URL列表,而Python中的set数据结构是一个无序数据结构。要以相同的顺序输出,您应该将URL存储在list数据结构中,如下所示:

代码语言:javascript
运行
复制
urls = [
  'https://www.sample.com/search/category-mobile/' ,
  'https://www.sample.com/search/category-tablet-ebook-reader',
  'https://www.sample.com/search/category-laptop/',
  'https://www.sample.com/search/category-computer-parts/',
  'https://www.sample.com/search/category-office-machines/'
]

干杯!

票数 2
EN

Stack Overflow用户

发布于 2021-01-20 23:17:27

使用list,这样结果的顺序将与您定义的顺序相同。

代码语言:javascript
运行
复制
urls = ['https://www.sample.com/search/category-mobile/' ,
'https://www.sample.com/search/category-tablet-ebook-reader',
'https://www.sample.com/search/category-laptop/',
'https://www.sample.com/search/category-computer-parts/',
'https://www.sample.com/search/category-office-machines/'
]

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65812129

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档