因此,这个网页使用这些符号呈现,它们在整个网站/应用程序中都可以找到,但在其他网站上找不到。有谁能告诉我
发布于 2016-09-21 08:32:58
该字符是U+2028行分隔符,它是换行符的一种。可以把它看作是HTML语言的<br>
的Unicode等价物。
至于它为什么出现在这里:我的猜测是,内部数据库使用LSEP来避免与文字换行符或HTML标记冲突(这可能会破坏数据库或导致安全错误),并且:
把数据库转换成超文本标记语言的服务器端脚本忽略了用<br>
有关行分隔符的更多信息,摘自Unicode标准,第5.8章,新行指南(on p. 12 of this PDF):
行分隔符和段落分隔符
段落分隔符-独立于其编码方式-用于指示段落之间的分隔。行分隔符指示单独换行的位置,通常是在段落中。例如:
这是一个带有行分隔符的段落,
导致单词“导致”出现在不同的行上,但不会导致
典型的段落缩排、断句、行距或
对齐方式的更改(右、中或左段落)。作为比较,行分隔符基本上对应于HTML,而段落分隔符则对应于HTML<P>
的旧用法(现代的<BR>
通过将段落括在<P>...</P>
中来分隔段落)。在字处理程序中,段落分隔符通常使用键盘RETURN
或ENTER
输入;行分隔符通常使用修改后的RETURN
或ENTER
输入,如SHIFT-ENTER
。
记录分隔符用于分隔记录。例如,交换表格数据时,一种常见的格式是用制表符分隔单元格,并在单元格行的末尾使用CRLF
。此函数与行分隔符不完全相同,但经常使用相同的字符。
传统上,NLF
最初是一个行分隔符(有时也是记录分隔符)。在简单的文本编辑器(如程序编辑器)中,它仍然用作行分隔符。当平台和程序开始处理自动换行的文字处理时,这些字符被重新解释为段落分隔符。例如,即使是Windows记事本程序和Mac SimpleText程序这样的简单程序也会将其平台的NLF
解释为段落分隔符,而不是行分隔符。一旦NLF
被重新解释为段落分隔符,在某些情况下,另一个控制字符就会被用作行分隔符。例如,Microsoft Word中使用垂直制表VT。但是,用于行分隔符的字符的选择比用于NLF
的字符的选择的标准化程度更低。许多互联网协议和许多现有文本都将NLF
视为行分隔符,因此实现者不能在所有情况下都将NLF
简单地视为段落分隔符。
进一步阅读:
Unicode Technical Report #13: Newline Guidelines
General Punctuation (U+2000–U+206F) chart PDF
SE: Why are there so many spaces and line breaks in Unicode?
SO: What is unicode character 2028 (LS / Line Separator) used for?
U+2028 on codepoints.net这里的一个印刷错误说U+2028是在Unicode标准的v.1.1中添加的,这是错误的-它是在1.0中添加的
发布于 2020-01-22 19:02:45
我发现在WordPress中删除"L SEP“和"P SEP”字符的最简单方法是执行以下两个查询:
UPDATE wp_posts SET post_content = REPLACE(post_content, UNHEX('e280a9'), '')
UPDATE wp_posts SET post_content = REPLACE(post_content, UNHEX('e280a8'), '')
javascript方式(在一些答案中提到)可能会破坏一些东西(在我的例子中,一些模式窗口停止工作)。
发布于 2017-03-16 16:01:08
你可以使用这个工具...http://www.nousphere.net/cleanspecial.php
...to删除Chrome显示的所有特殊字符。
步骤:粘贴您的超文本标记语言和使用超文本标记语言清理选项。
您可以在此页面上手动删除编辑器中的字符并查看结果。
将HTML粘贴回文件中并保存:)
https://stackoverflow.com/questions/39603446
复制相似问题