在大多数浏览器中(我查看了Chrome、Firefox和Opera),设置lang="ro“将自动将一些cedille字符替换为其他字符。
检查这里:https://jsfiddle.net/dhtfb190/13
<!DOCTYPE html>
<html lang="ro">
<head>
<meta charset="utf-8">
</head>
<body>
<div style="font: 500% georgia;">şșşșŞȘŞŞȘ</div>
</body>
</html>
如果语言设置为"en“或未设置,则在Edge或IE中不会发生这种情况。而且,并不是所有的字体都会出现这种情况。例如,如果发生在格鲁吉亚,而不是阿里尔。但是佐治亚州有所有这些字符,因为它们都是用lang="en“显示的。
即使使用转义实例化,它也会这样做。
这个文件在哪里?我在网上搜索了很多,只找到了一些中文替换符号的例子。我怎样才能看到哪些字符被替换?为什么它只做一些字体呢?
发布于 2020-08-19 13:34:08
象形文字(“印刷字符”)取决于语言。这是一个很好的排版规则,好的字体支持这样的特性。
所以你得到了特定字符的"ro“变体。
这是“某种程度上的记录”。它位于字体定义的一个部分(只有较新的字体格式支持它们),但是很难提取此类数据。Python库很少。顺便说一句:在我的TODO列表中,还有一个显示字符变体的项目。
也许,如果您查看字体的设计页面,您可能会发现哪些语言有变体。
这一点在印度语上更明显,在这些语言中,连接依赖于文本的确切语言和epoc。在拉丁文中,这主要是一个琐碎的问题。Unicode标准引用了相同字体的法语和波兰口音的不同倾向。
增编:
我能找到的最好的信息是在https://learn.microsoft.com/en-us/typography/opentype/spec/gsub中,例如在下面的引文中,但也在文本上重复:
ScriptList标识使用字形替换的字体中的所有脚本和语言系统。
发布于 2020-08-19 13:17:43
我的猜测是,它检测语言并显示与字体不同的一组字符。
就像一些字体不支持于聚点,而是显示。格鲁吉亚(和其他字体也)支持俄语,并将自动切换他们的字符。
您可以更深入地检查文本编辑器,如MS Word或InDesign,并看到单个字符的外观可能有所不同,也称为象形文字。
https://helpx.adobe.com/incopy/using/glyphs-special-characters.html --您可以在这里查看它,当您向下滚动时,会有一个屏幕截图,当它们在Glyph窗口中打开下拉菜单时。你可以看到西里尔有一个选择。因此RO使用了与EN不同的一组符号。
您可以在佐治亚州查看此页面,并看到它们有语言脚本标记für Cyrillic。https://learn.microsoft.com/en-us/typography/font-list/georgia
https://stackoverflow.com/questions/63487540
复制相似问题