首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >当信息不存在时,是否可以使用findall - regex追加任何值?

当信息不存在时,是否可以使用findall - regex追加任何值?
EN

Stack Overflow用户
提问于 2019-02-18 08:16:11
回答 1查看 76关注 0票数 1

我想解析文本并将其保存到dataframe。有时信息不存在,就像二手资料一样,那里没有关于座位1的信息,我想在字典中附加任何或任何值。

PokerStars手#163417399919:不限(欧元1/2欧元)- 2016/12/ 23 :48:52 桌子'Dnoces II‘6-最大座位#2是按钮 座位1: xxx (200美元芯片) 座位2: yyy (364.58美元芯片) 座位3: zxc (200美元芯片) 座位4: zdf (芯片235.43美元) 座位5: zdasdasII (芯片206.02美元) 座位6:密码(芯片92.53美元) PokerStars手#162960631727:不限(1欧元/欧元2欧元)- 2016/12/15 2:10:16 CET 2016/12/14 20:10:16 ET 桌子'Suleika‘6-最大座位#4是按钮 座位2: xxx(芯片137.08美元) 座位3: yyy (200美元芯片) 座位5: xyz(201.20美元芯片) PokerStars Hand #163416930846:持有不限(1/2美元)- 2016/12/ 23 :39:57 CET 2016/12/23 17:39:57 ET 桌子'Pieksamaki II‘6-最大座位#5是按钮 座位1: xxx (芯片230.90欧元) 座位2: yyy (芯片256.25欧元) 座位3: zzz (芯片200欧元) 座位4: ddd (芯片200欧元) 座位5: ccc (芯片223.40欧元) 座位6: fff (芯片77.65欧元)

代码语言:javascript
运行
复制
file = open(r'example_hands.txt','r')
lines = [i.strip('\n') for i in file]
tab2 = {'Seat1': [],'S1_stack': [], 'Seat2': [], 'S2_stack':[]}
for i in range(len(lines)):
    tab2_2 = re.findall('Seat\s1\:\s(\w+)\s\(\$(\d+(\.\d+)?)\s',lines[i])
    for t2_2 in tab2_2:
        if tab2_2 is None:
            tab2['Seat1'].append(None)
            tab2['S1_stack'].append(None)
        else:
            tab2['Seat1'].append(t2_2[0])
            tab2['S1_stack'].append(t2_2[1])
    tab2_3 = re.findall('Seat\s2\:\s(\w+)\s\(\$(\d+(\.\d+)?)\s',linia[i])
    for t2_3 in tab2_3:
        tab2['Seat2'].append(t2_3[0])
        tab2['S2_stack'].append(t2_3[1])

目前,我无法在列表中添加任何值。有什么办法解决这个问题吗?有可能用re.findall吗?我想要这样的产出:

EN

回答 1

Stack Overflow用户

发布于 2019-02-18 10:56:43

您可以修改以下原型,它确实从您的文件中提取了所有相关信息。

留给你做作业的唯一一点就是以一种表格的方式显示它。

代码语言:javascript
运行
复制
import re

class PockerStarHand:
  def __init__(self, handId, date, seats):
    self.handId=handId
    self.date=date
    self.seats=seats

# does not scale, do this on small input files
with open('example_hands.txt','r') as content_file:
    content = content_file.read()
    chunck = re.findall(ur'^PokerStars\sHand\s#(\d+):.+?-(\s\d{4}\/\d{2}\/\d{2}\s\d{,2}:\d{2}:\d{2}).+\s+Table.+\s+^((?:Seat\s\d:\s\w+\s?\(.+\)\s*)+)',content, re.MULTILINE)
    hands = []
    for c in chunck:
      hands.append(PockerStarHand(c[0],c[1], re.findall(ur'^Seat\s*(\d)\s*\:\s*(\w+)\s*\(([\$\u20AC])(\d+(?:\.\d+)?)',c[2].decode('utf-8') ,re.MULTILINE | re.UNICODE)))

    for hand in hands:
      print ("ID: " + str(hand.handId))
      print ("date: " + str( hand.date))
      for s in hand.seats:
        print ("seat: " + str(s[0]))
        print ("seat text: " + str(s[1]))
        print ("seat curr: " + str(s[2].encode('utf-8')))
        print ("seat price: " + str(s[3]))

电流输出:

代码语言:javascript
运行
复制
ID: 163417399919
date:  2016/12/23 23:48:52
seat: 1
seat text: xxx
seat curr: $
seat price: 200
seat: 2
seat text: yyy
seat curr: $
seat price: 364.58
seat: 3
seat text: zxc
seat curr: $
seat price: 200
seat: 4
seat text: zdf
seat curr: $
seat price: 235.43
seat: 5
seat text: zdasdasII
seat curr: $
seat price: 206.02
seat: 6
seat text: assfds
seat curr: $
seat price: 92.53
ID: 162960631727
date:  2016/12/15 2:10:16
seat: 2
seat text: xxx
seat curr: $
seat price: 137.08
seat: 3
seat text: yyy
seat curr: $
seat price: 200
seat: 5
seat text: xyz
seat curr: $
seat price: 201.20
ID: 163416930846
date:  2016/12/23 23:39:57
seat: 1
seat text: xxx
seat curr: €
seat price: 230.90
seat: 2
seat text: yyy
seat curr: €
seat price: 256.25
seat: 3
seat text: zzz
seat curr: €
seat price: 200
seat: 4
seat text: ddd
seat curr: €
seat price: 200
seat: 5
seat text: ccc
seat curr: €
seat price: 223.40
seat: 6
seat text: fff
seat curr: €
seat price: 77.65

Regex详细信息:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54742936

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档