腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
分词汉字
、
、
、
如何使用JavaScript将外文字符(如
中文
)
分割
成单独的数组值?( a)你好splitString = text.split(" "); RESULT: ["你好吗"
浏览 4
提问于2015-10-06
得票数 2
回答已采纳
2
回答
使用javascript在(汉语、阿拉伯语、日语、俄语、韩语、荷兰语、印地语、希腊语、乌尔都语)的句号上断开
字符串
、
我正在做语言
分割
项目。我对英语应用了语言
分割
,方法是使用正则表达式断开
字符串
。(“句号”)。现在我想提供以下语言(
中文
,阿拉伯语,日语,俄语,韩语,荷兰语,印地语,希腊语,乌尔都语)的支持。我想在句号上打断上面提到的语言
字符串
。对于
中文
,句号是。(Unicode值U+3002)
字符串
以有效應對各種事態」。他還表示,希望以符合21世紀的方式切實深化美日同盟關係。
浏览 4
提问于2010-10-26
得票数 0
2
回答
如何在Python中拆分多语言行并获得Unicode十六进制值?
、
、
、
我试着在中
分割
这类行 问题是,我不知道如何获得希伯来字母
中文
的Unicode值。
浏览 2
提问于2012-01-06
得票数 0
回答已采纳
2
回答
如何将
字符串
拆分为字符数组?
我如何将文本
分割
成一个数组,如“丟”,“內”,“樓”,“某”?还有别的办法吗?
浏览 0
提问于2023-02-07
得票数 1
回答已采纳
3
回答
有没有好的开源或者免费的
中文
分词算法?
、
、
、
正如问题中所说,我正在寻找一种免费和/或开源的
中文
文本切分算法,我确实理解这是一项非常困难的任务,因为涉及到许多歧义。我知道有谷歌的API,但它是一个黑匣子,也就是说,它正在做什么的信息并不多。
浏览 0
提问于2011-04-29
得票数 28
回答已采纳
2
回答
为什么在这两种情况下,putty内的tmux的
分割
线显示不同的(xxxxx,qqqqqq)?
为什么PuTTY中tmux的
分割
线在这两种情况下显示不同的(xxxxx,qqqqqq)?如果我没有设置PuTTY的任何东西(默认的“使用字体编码”),窗格的分隔线如下所示: 但是它不能正确显示
中文
单词,所以我将PuTTY的Window -> Translation -> Remote然后窗格的
分割
线就会变成这样: 顺便说一句: echo $LANG显示“zh_n.utf-8” 那么,在这种情况下,如何正确显示第一个拆分行的
中文
单词呢?
浏览 6
提问于2013-11-26
得票数 2
1
回答
骆驼:使用组后,UTF-8编码丢失。
、
、
、
我使用camel 2.14.1,并在标记标记中使用group=10000将巨大的xml文件
分割
成
中文
/日语字符。文件是基于分组成功创建的,但
中文
/日文文本代码被转换为垃圾字符。
浏览 1
提问于2016-03-18
得票数 0
2
回答
用PHP实现
中文
MongoDB全文搜索
、
、
我知道MongoDB 2.6默认启用文本搜索功能,但它不支持
中文
,我想问一下,是否有最好的方法来实现
中文
全文search.My环境是Ubuntu12.04+php5.3+MongoDB2.6+Apache2.2
浏览 6
提问于2014-08-05
得票数 1
回答已采纳
1
回答
露天矿巨蟒引起分段断层
、
当我从繁体
中文
转换成简体
中文
的时候。我使用ubuntu并安装opencc 1.0.4 (按源代码)。中尝试过>>> opencc.convert('乾坤一擲')都会导致
分割
错误但是,如果我使用来自system库的opencc [user@hostname]$ opencc -i text.txt&q
浏览 13
提问于2016-12-27
得票数 1
回答已采纳
2
回答
非拉丁语语言的切分规则,如
中文
、日语
、
、
我们可以使用哪种切分规则来切分点(.)表示分隔符以外的内容,或者表示没有任何分隔符的语言,例如-Chinese、日语和韩语提前谢谢你,文殊
浏览 3
提问于2010-01-27
得票数 2
3
回答
建立汉英词典-如何识别单词中的哪些字符?
、
、
我正在尝试用Rails构建一个可以帮助用户阅读
中文
文本的应用程序。如果用户点击一个汉字,他们会得到有关发音和含义的信息。 我使用一个汉英词典的数据库来实现这一点。
浏览 2
提问于2014-12-18
得票数 1
1
回答
在rocksdb中,有什么方法可以知道一个文件在一个级别上的大小吗?
如果达到最大大小,那么在RocksDB
中文
件是如何被
分割
的呢?
浏览 0
提问于2019-04-25
得票数 3
2
回答
将包含汉语、日语或英语的
字符串
拆分成单词
、
、
如何使用regex或任何实用工具类将包含
中文
、日语或英语的
字符串
拆分为单词?由一群來自美國俄亥俄州立大學的研 words = input.split("[ ./()\\[
浏览 0
提问于2016-05-05
得票数 1
1
回答
用自定义源训练
中文
分段器
我想用新的数据训练
中文
片段,我制作了一本字典和一个序列化的树库文本文件。我的
中文
数据集是佛教古籍,很难取代像-sighanCorporaDict这样的资源。安德烈亚斯
浏览 3
提问于2017-05-12
得票数 0
回答已采纳
1
回答
使用regexp查找两个单引号之间的非ascii子
字符串
。
、
测试用例:预期结果:'
中文
'/'[^a-zA-Z0-9\s]+?'/ 只能获得所有非ascii的子
字符串
'
中文
'。但我也想
浏览 2
提问于2014-10-04
得票数 0
回答已采纳
1
回答
如何在Android中定制FTS令牌程序
、
、
就像
中文
一样,它不能被空格或dot.So
分割
,我想要定制标记器。有人能给我点建议吗? 如何在Sqlite中注册托肯器。只是支持
中文
是没用的。
浏览 3
提问于2012-09-12
得票数 6
3
回答
在Vim / netrw中以垂直拆分方式打开文件
、
如果我用vim .打开vim,netrw会提供当前目录
中文
件和目录的一个很好的列表。任何帮助都非常感谢。
浏览 13
提问于2016-04-02
得票数 12
回答已采纳
1
回答
textViewDidChange在
中文
键盘上调用两次
、
、
、
、
shouldChangeTextInRange方法在英文文本中工作良好,但在输入
中文
关键字时不起作用,因此,我使用textDidChange方法获取
中文
文本,而当
中文
文本输入时,textDidChange调用两次,因此我每次都得到两次
字符串
。我该怎么做才能得到
中文
文本?我知道我可以很容易地使用textview.text获得
中文
文本,但是我在textview中使用html
字符串
,所以如果我使用textview.text获得
字符串
,那么我就不能得到html
浏览 0
提问于2016-01-21
得票数 0
1
回答
Android studio资源:繁体
中文
还是简体
中文
?
、
根据谷歌翻译文档:
中文
(简体)是"zh-CN“。
中文
(繁体)是"zh-TW“。但是当我为
中文
创建一个strings.xml资源文件时,它只对“zh”起作用:我的
中文
strings.xml文件应该使用简体
字符串
还是繁体
字符串
?
浏览 21
提问于2017-03-02
得票数 2
回答已采纳
1
回答
如何在php中获得
字符串
的宽度?
例如:"
中文
“的宽度=4我知道在UTF-8编码中,strlen("
中文
") = 6 mb_strlen("
中文
") =2word
中文
浏览 5
提问于2021-02-08
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券