首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >有没有一种方法可以通过正则表达式搜索快速处理大量多余的数据?

有没有一种方法可以通过正则表达式搜索快速处理大量多余的数据?
EN

Stack Overflow用户
提问于 2019-04-18 09:28:36
回答 1查看 41关注 0票数 1

我正在尝试提取一些数据,以便将数据输入到服务器中。我从一个web API中获得了这些数据,其中包含了很多对我来说都是垃圾的信息。我需要处理掉一大堆,但我不知道从哪里开始。我需要的数据一直到“Contherious”,然后再从"name":"Contherious“开始。And here's that link。我一直在做的大多数数据处理都是尝试使用正则表达式搜索来尝试处理,我能想到的唯一搜索是在我需要的名称和不需要的名称之间留一个空格,并在它们后面直接指向ID。我只是不清楚如何获取这些名字中的每一个,如果有任何帮助,我将不胜感激。

我试过了

代码语言:javascript
运行
复制
DMG_DONE_FILE = "rawDmgDoneData.txt"

out = []

with open(DMG_DONE_FILE, 'r') as f:
    line = f.readline()
    while line:
        regex_id = search('^+"name":"\s"+(\w+)+"id":',line)
        if regex_id:
            out.append(regex_id.group(1))

        line = f.readline()

我会收到错误,因为我通常不知道如何处理正则表达式搜索

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-04-18 10:04:54

代码语言:javascript
运行
复制
import sys
import json

# use urllib to fetch from api 
# example here for testing is reading from local file
f=open('file.json','r')
data=f.read()
f.close()
entries = json.loads(data)

现在,您有了一个可以轻松寻址的数据结构

例如,条目‘entries’‘name’

或者使用jq https://stedolan.github.io/jq/

代码语言:javascript
运行
复制
cat file.json |jq '.entries[]| {name:.name,id:.id,type:.type,itemLevel:.itemLevel,icon:.icon,total:.total,activeTime:.activeTime,activeTimeReduced:.activeTimeReduced}'
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55737966

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档