腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在Scala/Java中过滤
中文
标点符号
?
、
、
我试图在Scala/Spark中制作一个与
语言
无关的文本解析器。我使用regex从大量文本中删除
标点符号
。list_of_strings.map(_.replaceAll("""[\p{Punct}]"""))在Java regex中是否有一个“规范”函数可以让我去掉其他
浏览 0
提问于2018-09-11
得票数 2
回答已采纳
2
回答
在
c
++上设置文件颜色
、
、
我正在绘制一个文本文件中的图表,我想一个接一个地设置行的颜色,灰色和白色,但我找不到可以帮助我的函数。我的编译器是windows上的代码块。谁能告诉我这些颜色的数量和相关的功能?谢谢
浏览 3
提问于2013-06-19
得票数 1
回答已采纳
3
回答
从UTF8获取
语言
、
我有几个utf8字符串,需要根据使用的字符找出
语言
。在德语、荷兰语和英语等使用拉丁字母的
语言
之间进行学习并不重要。出现的
语言
是阿拉伯语、朝鲜语、汉语、日语,即具有确定字符集的
语言
。
浏览 3
提问于2014-09-25
得票数 0
2
回答
如何过滤
中文
(仅
中文
)
我想把一些包含一些
标点符号
和全角符号的文本转换成纯
中文
文本。maybe_re = re.compile("xxxxxxxxxxxxxxxxx") #TODO你好这只是一些
中文
文本全角
浏览 1
提问于2011-08-02
得票数 7
回答已采纳
3
回答
关于如何测试应用程序是否支持不同
语言
的建议
我需要检查应用程序是否可以用不同的
语言
处理文件。你对此有什么经验或建议吗?其中一些
语言
是:德语普通话(
中文
)俄语波斯语
浏览 0
提问于2016-09-06
得票数 2
回答已采纳
4
回答
从文件中删除包含非英语(Ascii)字符的行
、
、
、
、
我有一个文本文件,里面有来自不同
语言
的字符,比如(
中文
,拉丁语等) 我想删除所有包含这些非英文字符的行。我希望包含所有英文字符(a-b)、数字(0-9)和所有
标点符号
。
浏览 2
提问于2012-07-20
得票数 15
回答已采纳
1
回答
从utf 8混合文件中分离繁体
中文
字符
、
、
我正在用
C
/
C
++编写一个程序,它接受用户的输入。输入是一个utf-8字符串,可以混合英文和
中文
和一些
标点符号
。 我的程序必须将这些
中文
字符与英文字符分开。如你所知,
中文
字符占用2个字节,而英文字符只占用1个字节。我不能迭代char数组来查找是否存在任何英文字符。你知道怎么解决这个问题吗?
浏览 2
提问于2011-12-30
得票数 0
5
回答
Javascript unicode字符串,
中文
字符,但没有
标点符号
、
、
、
示例:我的
中文
不好。我是意大利人。你知道吗?我只需要保留汉字。有什么暗示吗?
浏览 1
提问于2014-01-14
得票数 18
回答已采纳
1
回答
如何在垂直的CJK文本中对
标点符号
进行居中?
、
、
、
我有一个使用CSS (body { writing-mode: vertical-rl; })垂直显示的CJK (
中文
)文本。不幸的是,
标点符号
在默认情况下不是以中心为中心:句号和逗号对齐到右上角,而不是中间位置。我在Firefox 65.0和Chromium71.0中得到了同样的结果。是否有既定的
标点符号
对中的方法?我觉得我一定是错过了一些显而易见的东西。我的
中文
物理书籍是用中心
标点符号
打印的,但是阅读和MDN文档时,对垂直CJK文本的
标点符号
居中没有任何发现。
浏览 0
提问于2019-02-18
得票数 2
回答已采纳
3
回答
非英语文本的词义差异
、
、
、
如何对人类
语言
文本(
中文
)进行逐字区分? 我在一个git仓库里有一些
中文
的纯文本。这篇文章已经编辑好了,我想看看哪些词被加/删除了。更糟糕的是,正如我所说的,文本是
中文
的。与英语和其他印欧语不同,汉语不使用空格作为分隔符.整个段落,加上
中文
标点符号
,构成一个没有任何空格的统一块。有没有办法在
中文
文本的两个版本之间有一个人类可读的区别?每一个字都有相当于-字差的吗?
浏览 5
提问于2014-10-01
得票数 1
回答已采纳
2
回答
如何删除Python中的
中文
标点符号
、
我有以下几句话,我想删除所有
标点符号
。首页 » 政策法规 » 正文吉林省实施《中华人民共和国老年人权益保障法》若干规定 发布时间: 2008-01-04 我想删除所有的
中文
标点符号
,包括空白处“。我想知道是否有更简单的方法移除
中文
标点符号
?
浏览 1
提问于2016-04-15
得票数 5
2
回答
日语的自动换行算法
、
、
、
、
在我最近构建的一个web应用程序中,当我们的一个用户决定使用它来创建完全用日语创建的东西时,我感到非常惊讶。然而,文本包装得既奇怪又笨拙。显然,浏览器不能很好地处理日语文本的换行,可能是因为它包含的空格很少,因为每个字符组成一个完整的单词。然而,这并不是一个真正安全的假设,因为有些单词是由几个字符组成的,而且将一些字符组分成不同的行也不安全。你将如何处理这个问题?据你
浏览 2
提问于2010-01-19
得票数 7
回答已采纳
2
回答
C
#用混合
语言
将字符串拆分成不同的
语言
块
、
、
我试图解决一个问题,我有一个字符串与混合
语言
作为输入。 编辑:我认为我的“
语言
块”是模糊的。我想要的“
语言
块”是
语言
字符集。 例如,
浏览 4
提问于2017-08-10
得票数 3
回答已采纳
2
回答
用Python中的英文逗号代替汉语
标点符号
、
、
对于
中文
单词:上海,北京、武汉;重庆。欢迎你!你好,我想用逗号代替
中文
标点符号
,我如何在Python中使用regex呢?
浏览 0
提问于2019-07-05
得票数 2
回答已采纳
1
回答
HTML/CSS RTL和垂直rl会导致尾随
标点符号
放置在错误的位置。
、
许多
中文
书是从右到左和垂直写的。我试着用HTML/CSS来布局一些
中文
文本。direction: rtl; }</head> <p class="rtl">但是,我发现如果段落中有尾随
标点符号
,
标点符号
放在最后一行的前面,就像mac
浏览 7
提问于2020-08-25
得票数 0
回答已采纳
2
回答
如何使用正则表达式匹配仅包含
中文
字母的字符串?
、
、
、
、
我想得到一个正则表达式,它只能匹配由
中文
字符组成的字符串,没有英文或任何其他字符。\u4e00-\u9fa5根本不起作用,^x00-xff将使用
标点符号
或其他
语言
字符来匹配这种情况。
浏览 0
提问于2013-03-29
得票数 6
回答已采纳
3
回答
如何在正则表达式中用
标点符号
检测汉字?
、
、
、
有什么方法也可以检测
中文
标点符号
吗?
中文
标点符号
的一些例子(但不是全部)::?、“-()[]
浏览 24
提问于2016-01-06
得票数 7
回答已采纳
1
回答
斯坦福汉语分词器在Python中如何不用
标点符号
返回结果
、
、
、
我试图用Python中的斯坦福分词来分割一个
中文
句子,但是目前的结果中有
标点符号
。我想返回没有
标点符号
的结果,只返回单词。做这件事的最好方法是什么?我试着在谷歌上搜索答案,但什么也没找到。
浏览 1
提问于2015-03-06
得票数 2
回答已采纳
1
回答
十六进制位数不足Regex异常?
、
、
我正在制定一个指标,它将匹配所有的字母(包括
中文
)和一些选定的
标点符号
(也包括
中文
)。我使用
c
#的Regex类来解析它
浏览 0
提问于2018-01-19
得票数 0
回答已采纳
1
回答
str_word_count(),它适用于PHP中的东方
语言
?
、
、
用比str_word_count()更多的
语言
来创建一个计算单词的函数的正确方法是什么?具体来说,我需要支持
中文
、日文和韩文。 有没有更好的方法?我能从头顶上想到一些缺陷:重音字符,使用空格分隔单词的多字节
语言
(我认为是阿拉伯语)。
浏览 3
提问于2014-03-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如果把各编程语言比作各国语言,C语言对应中文?
C语言,C+语言
C语言小白入门《一》——C语言简介
C语言编程之C语言加密字符
GlassWire中文语言设置
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券