首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将字符串列拆分为带有“变量”分隔符的两列?

如何将字符串列拆分为带有“变量”分隔符的两列?
EN

Stack Overflow用户
提问于 2021-11-27 17:10:44
回答 1查看 362关注 0票数 1

我从一个PDF数据表中提取了一个粗略的df,该数据表由一个包含字符串的列组成。该栏中的每一项均采用以下形式:

代码语言:javascript
复制
Mayor ............... Paul Jones
Senator ................. Billy Twister
Congress Rep. .......... Chris Rock
Chief of Staff ....... Tony Allen

我希望使用string.split(pat=".")将这些字符串拆分为两列,用于使用句点字符串的TitleName。但是,列中的每个条目对于句点字符串分隔符都有不同的长度。正如预期的那样,例如,如果我使用pat="."pat=".......",最终会出现不一致的拆分。

我的目标是实现一种使分隔符能够处理给定最小和最大长度的句点字符串长度范围的方法。我在谷歌上搜索过这个问题,但一直没有找到一个直接的答案。这有可能实现吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-27 17:19:43

Series.str.split与regex \s+\.+\s+一起使用,该正则表达式除以1+空间、1+句点、1+空间:

代码语言:javascript
复制
df = pd.DataFrame({'A': ['Mayor ............... Paul Jones', 'Senator ................. Billy Twister', 'Congress Rep. .......... Chris Rock', 'Chief of Staff ....... Tony Allen']})

df[['Title', 'Name']] = df['A'].str.split('\s+\.+\s+', expand=True)

#                                          A           Title           Name
# 0         Mayor ............... Paul Jones           Mayor     Paul Jones
# 1  Senator ................. Billy Twister         Senator  Billy Twister
# 2      Congress Rep. .......... Chris Rock   Congress Rep.     Chris Rock
# 3        Chief of Staff ....... Tony Allen  Chief of Staff     Tony Allen
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70137015

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档