开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >将列拆分为2+行；指定分隔符&最大字符长度

问将列拆分为2+行；指定分隔符&最大字符长度
EN

Stack Overflow用户

提问于 2018-11-30 09:58:11

回答 1查看 68关注 0票数 0

我有一个由10列和30,000+行组成的数据文件。我需要对这个数据文件进行预处理以供下游使用(最后的文件格式必须是Excel；不幸的是，将其保持为纯文本文档不是一种选择)。

我遇到的问题是，第7列中的几行超出了Excel的字符限制(32,767)。如何指定将第7列拆分，使其不超过字符限制，但同时也将文本的上下文保存在列中？(第7栏包含了一堆句子，我不想把它们分开)。

例如/简单性:下一段载于"A“栏。我想将这一段分解为"X“行数，如所示，这样A列中的每一行在保持句子结构的同时不超过100个字符。

分隔符：".“{句号后面跟着空格}
最大字符长度: 100

他给我们讲了一个非常激动人心的冒险故事。我们从未去过亚洲，也没有访问过非洲。我们应该现在开始上课，还是应该等每个人到这里来。大家都很忙，所以我一个人去看电影。上个星期五，在三周的时间里，我看到一条条纹的蓝色蠕虫和一只没有腿的蜥蜴握手。

以下是我尝试过的：

sed/gsub：但这将替换分隔符的每个实例
折叠：但我不知道如何指定除空格之外的分隔符，并且使用空格作为包装会干扰句子。
substr：我认为这可能是一条路，但现在，它只是(1)输出第一个“行”，(2)以最大字符长度而不是在我想要的分隔符处拆分段落。

“-F”。‘'BEGIN {OFS=“\n’}；{ $0=substr($0,1,100)；打印}‘

有奖征集｜云上CPU玩转AIGC挑战赛

参加活动赢取洛斐键盘、小米电纸书、智能音响等鹅厂周边！

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-30 14:22:40

当您对拆分A列感兴趣时，可以使用sed。

你试着用最大的99匹配尽可能多的字符，然后是一个点和一个空格。

用换行符替换最后一个空格。

columnA="He told us a very exciting adventure story. We have never been to Asia, nor have we visited Africa. Should we start class now, or should we wait for everyone to get here. Everyone was busy, so I went to the movie alone. Last Friday in three week’s time I saw a striped blue worm shake hands with a legless lizard."
echo "${columnA}" | sed -r 's/(.{1,99}\.) /\1\n/g'

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53562583

复制

相关文章

ExcelVBA删除指定列含有指定字符的所在的行

range set 数据优化字符串

2.用SpecialCells(xlCellTypeConstants, 16)快速定位

哆哆Excel

2023/09/09

1K0

ExcelVBA删除指定列含有指定字符的所在的行

bootstrap 将页面分为三列

class container image png row

<div class="container"> <div class="row"> <section class="content-primary col-md-5">

用户5760343

2019/10/14

1.5K0

bootstrap 将页面分为三列

SQL中如何将一列中的值显示出字符指定位置与指定长度。

我们在对比系统目前存在的生日与身份证的时候会问，怎么只取其中值的特定位置，获得对比结果。例如我们有一个值是123456789,那么我们怎么只显示4567呢？

繁华是客

2023/03/03

6.9K0

LeetCode 2138. 将字符串拆分为若干长度为 k 的组

https 网络安全编程算法

注意，在去除最后一个组的填充字符 fill（如果存在的话）并按顺序连接所有的组后，所得到的字符串应该是 s 。

Michael阿明

2022/03/10

9530

VBA：基于指定列删除重复行

vba https 网络安全

文章背景：在工作生活中，有时需要进行删除重复行的操作。比如样品测试时，难免存在复测数据，一般需要保留最后测试的数据。之前通过拷贝行的方式保留最后一行的数据（参见文末的延伸阅读1），但运行效率较低。目前通过借助数组和字典达到删除重复行的效果。

Exploring

2022/12/18

3.4K0

VBA：根据指定列删除重复行

vba http python

文章背景：在工作生活中，有时需要进行删除重复行的操作。比如样品测试时，难免存在复测数据，一般需要删除第一行数据，保留后一行的数据。

Exploring

2022/09/20

3.2K0

JS将字符串拆分为字符数组

数组字符串

有多种方法可以将字符串分割成字符数组，我更喜欢使用扩展操作符(...): <!DOCTYPE HTML> <html> <head> <title></title> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <link rel="stylesheet" href="https://cdn.bootcss.com/twitter-bootstrap/4.3.

王小婷

2021/06/17

3.7K0

VBA将一行数据分为多行

有个表格，有许多单元格的数据，制作者为了方便，很多数据是写在一行的，类似下面这种：

xyj

2020/07/28

4.6K2

对称字符串的最大长度

题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。思路：可能很多人写过判断一个字符串是不是对称函数，这个题目可以看成是该函数的加强版。首先想到的就是遍历，暂且先不考虑效率问题。判断一个字符串是不是对称的函数，可以用这个字函数逐一检查原字符串中所有的子字符串，然后输出长度最大的即可。怎样判断一个字符串是不是对称的字符串？ -->可以用两个指针分别指向字符串的第一个字符和最后一个字符，判断是否相等，如果不

猿人谷

2018/01/17

3.3K0

字符串长度最大乘积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

喜欢ctrl的cxk

2019/11/08

3K0

PHP实现给定一列字符，生成指定长度的所有可能组合示例

本文实例讲述了PHP实现给定一列字符，生成指定长度的所有可能组合。分享给大家供大家参考，具体如下：

用户8675788

2021/07/13

9330

最大的 String 字符长度是多少？

编程算法 java

String 类可以说是在 Java 中使用最频繁的类了，就算是刚刚接触 Java 的初学者也不会陌生，因为对于 Java 程序来说，main 方法就是使用一个 String 类型数组来作为参数的（String[] args）。对于这样一个频繁使用的类，String 字符串可以有多长呢？十万字符？一百万字符？还是无限的呢？

武培轩

2020/02/12

5.3K0

Python下字符串指定多个分隔符分割

编程算法 javascript python 正则表达式

之前在文章Python数据类型之字符串中介绍了split等分割字符串的方法，但是你会发现只能指定一个分隔符，那在Python下指定多个分隔符像AWK命令那样来分割字符串应该怎么做呢？

后场技术

2020/09/03

4.2K0

将列表分成指定长度的列表

python 编程编码技巧面试

在工作或参加面试过程中，经常遇到将一个列表，按指定长度分割成多个列表的问题。详细实现过程，看如下具体实例：

TalkPython

2019/05/24

2.9K0

webservice最大长度_网址最大长度

php http https java 网络安全

HTTP GET请求的最大长度是多少？是否定义了一个响应错误，如果服务器收到超过此长度的GET请求，服务器可以/应该返回该错误？

全栈程序员站长

2022/09/23

3.2K0

webservice最大长度_网址最大长度

pandas按照指定的列排序、paste命令指定分隔符、ggplot2添加拟合曲线

linux image line paste png

geom_smooth()函数不需要指定任何参数，自己直接就添加的是二次方程的拟合曲线，当然以上结果是因为自己的数据非常标准，是直接用二次方程来生成的

用户7010445

2020/07/23

1.2K0

Java中的字符串的最大长度

打包存储 ide java utf8

看String的源码可以看出来，String实际存储数据的是char value[]，数组的长度是int类型，

用户8554325

2023/03/10

3.8K0

ExcelVBA删除包含指定字符所在的行

set 工作数据学习笔记优化

哆哆Excel

2023/09/09

3470

ExcelVBA删除包含指定字符所在的行

点击加载更多

相似问题

将文本拆分为最大长度的行

31

将列字符拆分为行

12

根据分隔符和最大长度将长字符串拆分为较小的字符串？

42

根据分隔符将列表分为行和列

17

SQL server通过分隔符将字符串拆分为列(动态长度)

21

活动推荐

即时通信IM，低门槛快速接入

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例