我有下面这个文本(以这种格式),我希望将单词分开,并按它们出现在垂直列表中的顺序逐一放置,如下面的示例https://stackoverflow.com/a/21672824/10824251。我尝试了egrep -vi "'?[^\\p{L}']+'?|^'|'$" mytext.txt > output.txt
,但没有得到结果,只是output.txt没有(空的)内容。
我的短信:
教学心理学是教育心理学的一部分,是指学校教育。正如后面将看到的那样,两者都有着相同的目标:研究、解释和理解人们由于参与活动而产生的行为变化过程,教育赋予一个适合于教学心理学的实体,是行为变化研究基础上存在的教育活动的性质和特征。
我的葡萄牙文:
A psicologia do ensino éa parte da psicologia da educacão que se refere àeducacão escolar.Como se verámais adiante,ambas têm um mesmo objetivo: estudar,explicar e compreender os processos de mudanca comportamental se produzem nas comöêconseqüência da suãõo atividades .base uma entidade própria àpsicologia do ensino éa natureza e as caracterís- ticas das atividades as que existem base dos processos s de mudanca comportamental。
发布于 2019-10-24 22:21:22
您可能希望通过空格标记文本:
grep -o '[^[:space:]][^[:space:]]*' mytext.txt > output.txt
grep -o '[^[:space:]]\{1,\}' mytext.txt > output.txt
grep -oE '[^[:space:]]+' mytext.txt > output.txt
或者,您可以使用PCRE正则表达式提取1+字母(\p{L}
)、diacritics (\p{M}
)和数字(\p{N}
)的所有块:
grep -oP '[\p{L}\p{M}\p{N}]+' mytext.txt > output.txt
https://stackoverflow.com/questions/58549527
复制相似问题