Pandas问题从excel中提取超链接

Pandas是一个基于Python的数据分析库，它提供了丰富的数据结构和数据分析工具，可以帮助我们进行数据清洗、数据处理、数据分析和数据可视化等工作。

对于从Excel中提取超链接的问题，我们可以使用Pandas的read_excel函数来读取Excel文件，并通过DataFrame对象的方法来处理超链接。

首先，我们需要安装Pandas库。可以使用以下命令来安装：

pip install pandas

接下来，我们可以使用read_excel函数来读取Excel文件，并将其存储为一个DataFrame对象。假设Excel文件名为data.xlsx，并且超链接所在的列名为hyperlink，我们可以使用以下代码来读取Excel文件：

import pandas as pd

df = pd.read_excel('data.xlsx')

读取Excel文件后，我们可以使用str.extract方法来提取超链接。假设超链接的格式为<a href="URL">Text</a>，我们可以使用正则表达式来提取URL和Text。以下是一个示例代码：

import re

df['URL'] = df['hyperlink'].str.extract(r'href="(.*?)"')
df['Text'] = df['hyperlink'].str.extract(r'>(.*?)<')

上述代码将提取的URL存储在URL列中，提取的Text存储在Text列中。

除了使用正则表达式，我们还可以使用BeautifulSoup库来解析超链接。以下是一个示例代码：

from bs4 import BeautifulSoup

df['URL'] = df['hyperlink'].apply(lambda x: BeautifulSoup(x, 'html.parser').a['href'])
df['Text'] = df['hyperlink'].apply(lambda x: BeautifulSoup(x, 'html.parser').a.text)

上述代码将使用BeautifulSoup库解析超链接，并将提取的URL存储在URL列中，提取的Text存储在Text列中。

完成上述步骤后，我们可以通过访问URL列和Text列来获取提取的超链接和对应的文本。

关于腾讯云相关产品，腾讯云提供了一系列云计算服务，包括云服务器、云数据库、云存储等。你可以访问腾讯云官方网站（https://cloud.tencent.com/）了解更多关于腾讯云的产品和服务。

页面内容是否对你有帮助？

有帮助

没帮助

Pandas问题从excel中提取超链接

python、json、pandas、scripting

请看下面的代码和结果df.to_excel(r'C:/Users/user.name/Desktop/PythonScript_Data_medverify.csv.xlsxName: URL, dty

浏览 88提问于2019-11-08得票数 0

回答已采纳

2回答

尝试从URL中提取具有超链接的表，并将其保存在Excel [Python]中

python、excel、pandas、selenium

我试图从URL中提取表并保存超链接。当前代码将表保存到Excel，但超链接未保存。我知道这是因为pd.read_html将数据提取为文本。我如何提取它与超链接？当前代码：from selenium.webdriver.common.by import By import pandas as pdxlWriter = pd.ExcelWriter('testrep

浏览 3提问于2022-06-03得票数 0

回答已采纳

1回答

通过python追加保留超链接的xlsx文件

python、excel、pandas、xlsx

我可以用pandas很容易做到这一点，问题是在第一列中，我有超链接，当我使用pandas附加我的xlsx文件时，我丢失了超链接，只得到列中的文本。这是使用pandas的代码。for x in excels]combined = pd.concat(frames) combined.to_excel("c.xlsx", heade

浏览 2提问于2019-10-02得票数 0

1回答

从Excel超链接中提取链接文本

excel、vba

我有一组来自旧Excel工作表的超链接。我正在尝试使用这个函数从每个超链接中提取链接文本旧的超链接在公式栏中显示为 =超链接(“”，&q

浏览 7提问于2016-05-02得票数 0

回答已采纳

1回答

将列的数据提取到变量中

python、pandas、jupyter

那本字典是超链接的一部分，这是我想要的。我想我需要：让我们来处理第一步，我将为接下来的步骤提出其他问题。如何将数据文件中的值提取到我可以使用的变量中？impor

浏览 2提问于2019-08-07得票数 2

1回答

使用Python pandas.to_excel()将(可单击的)超链接输出到电子表格

python、html、pandas

我有一个数据框架，其中一列都是超链接(例如，)。我已经设法使这些链接在Jupyter Notebook中呈现为html：df["URL"] = df["URL"].apply(lambda'<a href="{}">{}</a>'.format(x,x))df 但是我不能将这些链接以html而不是文本的形式

浏览 14提问于2018-01-29得票数 1

1回答

为python(csv)中的列中的每个项目创建超链接

python、csv、hyperlink

我正在尝试为基于另一列的列中的每个项目创建一个超链接。每个标题都应该超链接到相应的URL。(当你点击苹果时，它应该转到apple.com，当你点击香蕉时，它应该转到banana.com，依此类推)有没有办法在python中对CSV文件执行此操作？提前感谢

浏览 124提问于2021-05-25得票数 1

回答已采纳

6回答

从Excel单元格中的超链接文本中提取URL

c#、.net、excel、hyperlink、vsto

我在excel中有一个满是超链接文本的表格，所以它基本上是一堆名字，但当我点击其中一个时，它会把我带到我默认浏览器中的一些URL。所以我在我的程序中从这个excel表中提取文本，但是当我从这些超链接单元格中提取时，我得到的值是里面的字符串的值，当我想要该字符串链接到excel文件中的URL时。我可以将excel文件中的所有超链接文本转换为相应的URL，也可以使用C

浏览 5提问于2011-04-13得票数 8

回答已采纳

2回答

单元格中的delphi excel超链接

delphi、excel

如何用Delphi从excel表格中的某些单元格中提取超链接？

浏览 0提问于2010-09-09得票数 2

回答已采纳

1回答

在VB中检索excel中的超链接数据

excel、vb.net、ssms、oledb

所以我正在尝试创建一个SSMS数据库，这是没有问题的，并有文件存储在数据库表中，这是没有问题的。我的问题是我正在从excel文件中提取数据(相当多)。它们很小，提取列并传输到数据库中没有任何问题。我想解决的问题是，在excel文件中，其中一列(.pdfs、word文档等)中有指向其他文件的超链接。我希望能够读取excel，用excel</

浏览 43提问于2019-02-25得票数 0

回答已采纳

1回答

如何从python的docx文件中提取超链接文本？

python、docx、python-docx

我正在处理的docx文件有一个带有注释的超链接。带有学生成绩的 -文件from docx import Document我就

浏览 2提问于2022-07-27得票数 0

2回答

这不是重复的，尽管这个问题已经在2011年的，2013年的和2014年的的这个论坛上提出了；仍然没有答案。在深入研究了xlrd模块之后，似乎Data_sheet.hyperlink_map.get((row，col))项出错了，因为"xlrd不能在没有formatting_info的情况下读取超链接，这在的问:有人在从存储在excel文件中的超链接中提取URL方面取得了进展吗？比方说，在所有客户数据中，有一列超链接。我正在考虑将exc

浏览 2提问于2015-10-15得票数 4

1回答

使用形状内的输入参数调用子过程

vba、visio

我的目标是在MS应用程序中调用形状内部的宏(输入来自形状的特定信息)。如何将形状的参数(字符串类型)(在我的示例中是此形状的PDF文件名)传递给子过程？如果能够做到这一点，我可以打开每个形状的相应数据表。如何在每个形状中保存输入参数值(类型字符串)？如何在VBA子过程中调用它们？

浏览 2提问于2020-06-06得票数 0

回答已采纳

1回答

Excel VBA -提取/打开动态超链接URL/地址

vba、excel、dynamic、hyperlink

我试图使用excel vba从OR提取动态超链接，使用excel vba打开工作表中的动态超链接。我可以点击超链接，它将正确打开。到目前为止，我无法找到与如何提取超链接指向的URL有关的任何相关信息，或者只是打开超链接。下面是用于建立基于模型选择的动态超链接的公式。), "Click Here to Open Box Label"), "Unable

浏览 6提问于2016-05-10得票数 0

回答已采纳

4回答

带超链接的Pandas* read_excel*

excel、pandas

我有一个Excel电子表格，我正在将其读入熊猫DataFrame中：但是，电子表格的其中一列包含具有与其相关联的超链接的文本。如何访问Pandas中的基础超链接？

浏览 5提问于2016-02-11得票数 10

3回答

excel -从链接文本中获取url

excel

我需要复制一个具有链接文本的列，并粘贴一个显示链接文本的所有URL的列

浏览 3提问于2010-07-03得票数 2

1回答

Excel字符串中的Visual Basic GetAddress (超链接)

excel、vba

我在excel中有一个VB，可以从粘贴的单元格中提取超链接：If HyperlinkCell.Hyperlinks.CountHyperlinkCell.Hyperlinks(1).Address, "mailto:", "NOTHING HERE")GetAddress = ""End Function 问题

浏览 1提问于2014-03-25得票数 0

2回答

SSIS从Excel单元格中提取链接以加载到SQL中。

sql-server、excel、ssis、etl、excel-interop

问题：我尝试了两种不同的方法从我的专栏中提取超链接，但每种方法都有各

浏览 5提问于2019-12-30得票数 3

回答已采纳

1回答

保留Pandas中的超链接- Excel到dataframe

python、python-3.x、pandas

我有一个包含几张数据表的大型excel文件，需要将其转换为HTML。我很兴奋地尝试Pandas来帮助简化转换，避免将Excel表格保存为HTML，然后花一整天的时间删除所有可怕的MS标签。我能够读取Excel文件+工作表，然后将它们作为数据帧加载。唯一的问题是，它正在剥离单元格中的所有超链接。我已经找遍了所有地方，但没有找到保留超链接的答案。这是我第一次使用Pandas，所以它可能只是缺乏经验。下面是我的代码和输出的截图。谢谢你的帮助

浏览 32提问于2016-09-13得票数 4

1回答

如何从Excel公式中提取超链接？

excel、power-automate

何使用Power Automate从Excel工作表中提取超链接地址？ 

浏览 7提问于2021-12-23得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas问题从excel中提取超链接

相关·内容

Pandas问题从excel中提取超链接

尝试从URL中提取具有超链接的表，并将其保存在Excel [Python]中

通过python追加保留超链接的xlsx文件

从Excel超链接中提取链接文本

将列的数据提取到变量中

使用Python pandas.to_excel()将(可单击的)超链接输出到电子表格

为python(csv)中的列中的每个项目创建超链接

从Excel单元格中的超链接文本中提取URL

单元格中的delphi excel超链接

在VB中检索excel中的超链接数据

如何从python的docx文件中提取超链接文本？

如何让XLRD读取XLSX单元格中的超链接？

使用形状内的输入参数调用子过程

Excel VBA -提取/打开动态超链接URL/地址

带超链接的Pandas* read_excel*

excel -从链接文本中获取url

Excel字符串中的Visual Basic GetAddress (超链接)

SSIS从Excel单元格中提取链接以加载到SQL中。

保留Pandas中的超链接- Excel到dataframe

如何从Excel公式中提取超链接？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐