文章/答案/技术大牛

发布

社区首页 >问答首页 >如何将字符串列拆分为带有“变量”分隔符的两列？

问如何将字符串列拆分为带有“变量”分隔符的两列？
EN

Stack Overflow用户

提问于 2021-11-27 17:10:44

回答 1查看 362关注 0票数 1

我从一个PDF数据表中提取了一个粗略的df，该数据表由一个包含字符串的列组成。该栏中的每一项均采用以下形式：

Mayor ............... Paul Jones
Senator ................. Billy Twister
Congress Rep. .......... Chris Rock
Chief of Staff ....... Tony Allen

我希望使用string.split(pat=".")将这些字符串拆分为两列，用于使用句点字符串的Title和Name。但是，列中的每个条目对于句点字符串分隔符都有不同的长度。正如预期的那样，例如，如果我使用pat="."或pat="......."，最终会出现不一致的拆分。

我的目标是实现一种使分隔符能够处理给定最小和最大长度的句点字符串长度范围的方法。我在谷歌上搜索过这个问题，但一直没有找到一个直接的答案。这有可能实现吗？

python

pandas

dataframe

strsplit

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-27 17:19:43

将Series.str.split与regex \s+\.+\s+一起使用，该正则表达式除以1+空间、1+句点、1+空间：

df = pd.DataFrame({'A': ['Mayor ............... Paul Jones', 'Senator ................. Billy Twister', 'Congress Rep. .......... Chris Rock', 'Chief of Staff ....... Tony Allen']})

df[['Title', 'Name']] = df['A'].str.split('\s+\.+\s+', expand=True)

#                                          A           Title           Name
# 0         Mayor ............... Paul Jones           Mayor     Paul Jones
# 1  Senator ................. Billy Twister         Senator  Billy Twister
# 2      Congress Rep. .......... Chris Rock   Congress Rep.     Chris Rock
# 3        Chief of Staff ....... Tony Allen  Chief of Staff     Tony Allen

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70137015

复制

相似问题

问如何将字符串列拆分为带有“变量”分隔符的两列？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将字符串列拆分为带有“变量”分隔符的两列？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将字符串列拆分为带有“变量”分隔符的两列？
EN