首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用Python在excel工作表中查找带有下划线的单词

使用Python在excel工作表中查找带有下划线的单词
EN

Stack Overflow用户
提问于 2019-08-07 15:36:02
回答 2查看 210关注 0票数 2

是否可以使用python搜索/解析excel中的两列(比如列C& D),而只查找带有下划线的字段?也许是这样的密码?不太确定..:

代码语言:javascript
运行
复制
Import xl.range 
Columns = workbook.get("C:D"))
Extract = re.findall(r'\(._?)\', str(Columns)

请让我知道我的代码是否可以进一步改进!:)

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-08-13 03:50:18

对于那些需要答案的人,我通过使用以下代码来解决这个问题:

代码语言:javascript
运行
复制
import openpyxl
from openpyxl.reader.excel import load_workbook
dict_folder = "C:/...../abc"
for file in os.listdir(dict_folder):
  if file.endswith(".xlsx"):
  wb1 = load_workbook(join(dict_folder, file), data_only = True)
  ws = wb1.active

for rowofcellobj in ws["C" : "D"]:
 for cellobj in rowofcellobj:
    data = re.findall(r"\w+_.*?\w+", str(cellobj.value))
    if data != []:
       fields = data[0]
       fieldset.add(fields)
票数 0
EN

Stack Overflow用户

发布于 2019-08-07 16:11:38

是的,这确实是可能的。您将得到的主要库是pandas。当然,在安装了python之后(指令这里),您可以按照

代码语言:javascript
运行
复制
import pandas as pd

# Reading the Excel worksheet into a pandas.DataFrame type object
sheet_path = 'C:\\Path\\to\\excel\\sheet.xlsx'
df = pd.read_excel(sheet_path)

# Using multiple conditions to find column substring within
underscored = df[(df['C'].str.contains('_')) | (df['D'].str.contains('_'))]

对于工作表中的CD列也是这样。

pandas有一个非常多样化的文档,但在您需要的范围内,功能文档 (有示例)就足够了,如果需要的话,还可以提供更多关于python本身的内容。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57397933

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档