首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ubuntu输入法ibus

人生旅程就是这样,用大把时间迷茫,在几个瞬间成长。——瑞卡斯 IBus 全称 Intelligent Input Bus是下一代输入法框架(或者说“平台”)。...项目现托管于 Google Code - https://code.google.com/p/ibus/ 此项目包含了世界多数语言文字输入需求——由世界多个国家开发者维护。...install gnome-icon-theme 其他同上 找回消失IBus图标: 在终端输入: ibus-daemon -drx 其他语言输入法: 安装 ibus-m17n 包即可。...sudo apt-get install ibus-m17n 这个软件包包含了几乎所有除了英语,中日韩等其他输入法,阿拉伯语,阿姆哈拉,阿萨姆,阿萨帕斯坎诸,奥杰布瓦,白俄罗斯,波斯,...藏语,傣,丹麦,迪维希,俄语,法语,梵语,高棉,格鲁吉亚,古典希腊,古吉拉特,哈萨克,捷克,卡纳达,克里,克罗地亚,克什米尔,老挝,马拉提,马拉雅拉姆孟加拉,缅甸

23410
您找到你想要的搜索结果了吗?
是的
没有找到

干货 | 国际化探索之路-Trip.com如何走进阿拉伯市场

阿拉伯语是仅次于英语和法语之外最多国家使用官方语言,流通于中东、北非、非洲等地区。...然而由于历史、文化原因,还有部分国家语言书写是从右到左(right-to-left _以下简称RTL),阿拉伯语、波斯、希伯来、乌尔都、维吾尔等。...iOS 默认值跟随当前语言 bundle, 英语bundle下为 左对齐, 阿拉伯语bundle 下为右对齐。...Android 默认值跟随Text 语言, 英语Text下为 左对齐,阿拉伯语Text下为右对齐: - 如果Text 设置了 textAlign,则该Text会正常显示,无需适配 - 如果Text没有设置...textAlign,在英语bundle下显示英语,在阿拉伯语bundle下显示阿拉伯语,则无需适配 - 如果Text没有设置textAlign,在英语bundle下显示英语,在阿拉伯语bundle下依然显示英语

4K41

NLP被英语统治?打破成见,英语不应是「自然语言」同义词

反映了NLP系统对当前任务预期输出(例如,语音识别系统高级文本或者对话系统中高标准用户意向标签,Siri、AlexaGoogle Home等)。...只有50种以上资源语言有葡萄牙、意大利、荷兰、标准阿拉伯语和捷克,世界上其余大约7000种语言几乎就没什么资源了。...其它语言,西班牙,有更透明基于电话正字法,还有一些语言只代表辅音(传统希伯来阿拉伯语),或者有代表音节而不是单个声音符号(马拉雅拉姆、韩语日语假名),使用语标式系统(例如中文,...许多语言技术通过在输入语言中对字符串进行映射将这些字符串转换为语法语义表示到外部知识库方式来实现特定于任务目标。...当输入字符串和知识库字段名实体在使用同一种语言时候,那么就可以处理快捷方式了。但这有多少种语言可以这样呢?

86300

Google翻译将离线翻译质量提高了20%

对于一些语言,包括日语、韩语、泰语、波兰和印地,质量提高超过20%。...在一个相关改进,Translate now为10种新语言提供了离线音译支持,包括但不限于:阿拉伯语孟加拉、古吉拉特、卡纳达、马拉地、泰米尔、泰卢固和乌尔都。...以前机器学习方法是通过扫描句子短语来提供翻译,而现在,离线翻译使用NMT一次分析整块文本,从而实现更加自然、语法更合理、上下文更清晰翻译。...谷歌会话人工智能最近在80个国家上线,精通30多种语言,并在英国、印度、法国、德国、日本、荷兰、挪威、韩国和意大利增加了九个新AI生成英语语音变体。...更重要是,一个新改进版本助手也在紧锣密鼓研发。它英文模式离线工作,能以“几乎零”延迟处理语音,提供答案速度也会比上一代快10倍。

1.2K20

自然语言不等于英语,为什么NLPer应当认识到这个问题,以及该怎么做?

这样需求导致了在NLP领域中出现了高资源语言和低资源语言数字鸿沟。 高资源语言种类只有几种,包括英语、汉语、阿拉伯语和法语,或许还可以将德语、葡萄牙、西班牙、芬兰包括进去。...这些语言具有大量可访问文本和语音资源,以及一些注释资源树图资料库(treebank)和评估集。...其他超过50项资源语言只有葡萄牙、意大利、荷兰、标准阿拉伯语和捷克。世界上另外大约7000种其他语言则只有极少资源没有。...西班牙等其他语言,具有基于发音拼写法系统更加透明化,还有一些语言仅代表辅音(例如传统希伯来阿拉伯语具有代表音节而不是单一声音符号(例如马拉雅拉姆,韩语日语假名),或者使用逻辑系统(例如中文...许多语言技术通过将输入语言中字符串映射到外部知识库或者将这些字符串转换为语法语义表示从而实现特定任务目标。当输入字符串和知识库字段名条目使用同一种语言时,处理快捷方式就可用了。

77900

Facebook开源增强版LASER库,包含93种语言工具包

它是首个用单个模型解决多种语言(包括低资源语言,卡拜尔、维吾尔、吴语)同类型库。...Facebook 对 2.23 亿个与英语西班牙对齐公共平行数据进行了系统训练。对于每个批量,Facebook 随机选择一种输入语言并训练系统将句子翻译成英语西班牙。...LASER 可以处理 93 种语言包括主动宾(SVO)顺序语言(英语)、主宾动(SOV)顺序语言(孟加拉和突厥)、动主宾(VSO)顺序语言(塔加拉族和柏柏尔),甚至是动宾主(VOS)顺序语言...(马达加斯加)。...以前方法只会考虑同一语言中前提和假设。 该句子编码器也可被用于挖掘大型单语言文本集合平行数据。Facebook 研究者只需要计算所有语言对之间距离,并选择最近一对。

1.3K10

iOS MachineLearning 系列(11)—— 自然语言识别与文本分析

iOS MachineLearning 系列(11)—— 自然语言识别与单词分析 在上一篇文章,我们介绍了使用NaturalLanguage框架来进行自然语言拆解,可以将一段文本按照单词,句子段落模式进行拆解...语言识别是其他高级自然语言处理任务基础,本篇文章还将介绍NaturalLanguage关于文本分析能力,其能够对文本的人名,地名和组织名进行识别,也可以对词性进行分析,动词,名词。...甚至我们还可以分析文本积极消极程度来推测内容取向,从而帮助开发者开发出更加智能应用。...1 - 语言识别 NLLanguageRecognizer类用来进行语言识别,其可以对输入文本所使用语言进行推断,使用非常简单。...属性即可获取到这段文本所使用最接近语言,例如上面的示例字符串,string1和string2是比较单纯中文和英文,string3是日语,日语很多字是和中文一样,因此对其进行识别可能会出现误差

59010

「多语言图像描述」最强评估基准XM3600来了!涵盖36种语言

每张图像都会提供多个标题,文本内容也会尽可能贴合当地文化,而不只是翻译,比如下面这张汽车图像,西班牙描述中提到了「数字42」,泰语描述包括「敞篷车」等英语描述没有出现元素。...36种语言中,研究人员选择了30种英语以外语言,主要是基于语言在网络内容中所占比例。...另外五种语言原则主要包括资源不足语言,这些语言有许多母语使用者,或者是来自各大洲主要母语,泰卢固、斯瓦希里等,再加上将英语作为基准,一共是36种语言。 图像选择主要基于地理位置。...第一个屏幕显示所有的15张图片及其英文描述,描述由模型自动生成,以一致形式「在做」,通常带有对象属性,「微笑」的人、「红色」汽车等。...PALI模型已经使用 XM3600对图像描述、文本检索和文本检索英文以外模型性能进行了评估。研究人员发现,多语言描述可以让PaLI模型在缩放后性能更强,特别是对于资源较少语言。

78240

文字转语音

学习如何将文字转换为栩栩口头语音介绍音频 API 提供基于我们 TTS(文本到语音)模型语音端点。...快速开始语音端点接受三个关键输入:模型、应转换为音频文本以及用于音频生成语音。...尽管当前语音优化为英语,Whisper 支持以下语言并表现良好:南非荷兰阿拉伯语、亚美尼亚、阿塞拜疆、白俄罗斯、波斯尼亚、保加利亚、加泰罗尼亚、中文、克罗地亚、捷克、丹麦、荷兰...您可以通过提供所选语言输入文本来生成这些语言口头语音。实时音频流传输语音 API 提供了使用分块传输编码进行实时音频流传输支持。这意味着在完整文件生成并可访问之前,音频就可以播放了。...某些因素可能会影响输出音频,大小写语法,但我们对这些因素进行内部测试结果参差不齐。我能否创建自己声音自定义副本?不,这不是我们支持功能。我拥有输出音频文件吗?

18910

Elastic学习之旅 (5) 倒排索引和Analyzer分词

,实现高亮显示) 下图展示了ES一个例子: ESJSON文档每个字段,都有自己倒排索引。...重要概念2:Analyzer 在ES中文本分析是其最常见功能之一,文本分析(Analysis)是把全文转换为一系列单词(term)过程,也叫作分词。...通常用于不需要对输入做分词场景。...:阿拉伯语、亚美尼亚、巴斯克孟加拉、巴西语、保加利亚、加泰罗尼亚、捷克、丹麦、荷兰英语、芬兰、法语、加利西亚、德语、希腊、印地、匈牙利、印度尼西亚、爱尔兰、意大利、拉脱维亚...可以看到,ES支持语言分词器,没有支持中文,这是因为:中文分词存在较大难点,不像英语那么简单。

11810

开发 | Facebook 开源增强版 LASER 库:可实现 93 种语言零样本迁移

NLP 模型从一种语言(英语)到其他许多种语言(包括训练数据极度有限语言)零样本迁移带来了可能。...Facebook 在与英语和西班牙对齐公共平行数据 2.23 亿个句子上训练他们系统,对于每个小批量,他们都随机选择一种输入语言,并训练系统将句子翻译成英语或者西班牙。...融入到 LASER 93 种语言包括主动宾(SVO)顺序语言(英语)、主宾动(SOV)顺序语言(孟加拉和土耳其)、动主宾(VSO)顺序语言(塔加路和柏柏尔),甚至是动宾主(VOS...)顺序语言(马达加斯加)。...该编码器能够泛化到训练期间没有用到过(即便被用作单语言文本语言上,Facebook 研究人员观察到这一编码器在方言以及地域性语言上(阿斯图里亚斯、法罗、弗里西语、卡舒比、北摩鹿加、皮埃蒙特

1.4K30

斯坦福Stanford.NLP.NET:集合多个NLP工具

q=Stanford.NLP 1.Stanford CoreNLP :提供了一组自然语言分析工具,可采用原始英文文本输入,并提供单词基本形式、读音形式、无论它们是公司名还是人名等,以及规范化日期、时间和数字数量...2.Stanford.NLP.NER:是一个 Named Entity Recognizer 实现。命名实体识别(NER)标签在文本序列中代指事物,人、公司名、基因和蛋白质名称。...包括基于 Chinese Treebank 中文解析器,基于 Negra 语料库与解析器,基于 Penn Arabic Treebank 阿拉伯语解析器,以及意大利、保加利亚和葡萄牙。...完整版下载包含三个训练过英语标签器模型,一个阿拉伯语标签器模型,一个汉语标签器模型,和一个德语标签器模型。两种版本都包括相同源代码和其它必需文件。...其它语言则需要更大量标记预处理,通常叫做分割(segmentation)。 The Stanford Word Segmenter(斯坦福词汇分割器)现在支持阿拉伯语和中文。

1.6K80

影响众多编程语言、引发供应链攻击,剑桥大学发布「木马源」漏洞

Unicode ,有以下两种攻击方式: 第一种是通过 Unicode Bidi 算法(CVE-2021-42574),该算法处理从左到右(英语)和从右到左(阿拉伯语和希伯来)脚本显示顺序。...Trojan-Source 攻击 字符重新排序方式 Unicode 标准规定,内存表示顺序称为逻辑顺序,当文本在一行时候,大多数脚本从左往右显示字符(例如英语)。...然而,也有一些脚本(阿拉伯语希伯来)显示文本自然顺序是从右往左。当混合具有不同显示顺序脚本时,必须有一种确定性方法来解决方向冲突。...下列代码 if 条件没有执行,而是被放置在注释部分,程序显示效果起到了欺骗用户作用。 研究人员还展示了如何在 C++ 执行同源文字攻击。...他们使用了两个看起来相似但实际上不同 H,蓝色拉丁 H 和红色西里尔字母Н。当进行编译时,该程序输出文本「Goodbye, World!」。

84310

Facebook增强版LASER开源:零样本迁移学习,支持93种语言

不仅如此,研究者还使用英语西班牙对公共并行数据 2.23 亿条句子进行了系统训练。...对于每个小批量,随机选择一种输入语言并训练模型,使其将句子翻译成英语西班牙一种,而不需要让大多数语言都与目标语言保持一致。...他们逐渐扩展到那些可用并行文本所有语言,并将 93 种语言并入到 LASER 工具包,这些语言包括 subject-verb-object (SVO) order (英语),SOV order...(孟加拉和突厥),VSO order (塔加路和柏柏尔),以及 VOS order (马达加斯加)。...研究表明,只需要计算所有句子对之间距离并选择最接近句子对,就能够提取文本数据数据信息。

93620

资源 | 斯坦福大学发布Stanford.NLP.NET:集合多个NLP工具

Stanford.NLP.Segmenter Stanford.NLP.CoreNLP Stanford CoreNLP Stanford CoreNLP 提供了一组自然语言分析工具,可采用原始英文文本输入...包括基于 Chinese Treebank 中文解析器,基于 Negra 语料库与解析器,基于 Penn Arabic Treebank 阿拉伯语解析器,以及意大利、保加利亚和葡萄牙。...命名实体识别(NER)标签在文本序列中代指事物,人、公司名、基因和蛋白质名称。...完整版下载包含三个训练过英语标签器模型,一个阿拉伯语标签器模型,一个汉语标签器模型,和一个德语标签器模型。两种版本都包括相同源代码和其它必需文件。...注意:它是 GPL 形式,允许免费使用,但不允许被整合到任何形式专有软件,即使是其中一部分,翻译版本。商业应用请联系斯坦福自然语言处理组。 ?

1.4K60

资源 | FAIR & NYU开发XNLI语料库:15种语言(含低资源语言)

XNLI 提出了以下研究问题:在仅具备英语训练数据情况下,我们如何在测试时对任意语言进行预测?...研究者使用文本蕴含标注这些句对,然后将这些句子翻译成 14 种语言:法语、西班牙、德语、希腊、保加利亚、俄语、土耳其阿拉伯语、越南、泰语、中文、印度、斯瓦西里和乌尔都,这就有 11.25...-1.0.zip(17MB,ZIP) XNLI 还可用作一万个句子 15way 平行语料库,来构建评估机器翻译系统。...这些模型往往是在单数据(通常是英语)上训练,无法直接用于其他语言。由于收集每种语言数据不切实际,因此研究者对跨语言理解(XLU)和低资源跨语言迁移兴趣越来越大。...我们发现 XNLI 是一个实际且有难度评估套件,在直接翻译测试数据任务上获得了可用基线模型最优表现。 ? 本文为机器之心编译,转载请联系本公众号获得授权。

1.7K30

Excelize 发布 2.6.0 版本,功能强大 Excel 文档基础库

支持设置工作簿视图模式和显示/隐藏标尺 引入依赖库 NFP (number format parser) 以增加对自定义时间、日期和文本类型数字格式支持,可对包含 19 种语言(南非荷兰孟加拉...、汉语、英语、法语、德语、奥地利、爱尔兰、意大利、俄语、西班牙、泰语、藏语、土耳其、威尔士、沃洛夫、科萨、彝语和祖鲁)本地月份名称和 12 小时制格式数字格式表达式进行解析,相关 issues...与 CodeName 属性,以解除部分情况下向工作簿嵌入 VBA 工程时限制,相关 issue #1148 公式计算引擎支持中缀运算符后包含无参数公式函数计算 支持以文本形式读取布尔型单元格值...,显示隐藏工作表标签属性丢失问题,解决 issue #1160 修复部分情况下嵌套公式计算错误问题,解决 issue #1164 修复部分情况下公式计算结果精度不准确以及在 x86 和 arm64...,内存开销相较于上一版本降低最高约 50%,内存垃圾回收次数降低约 80% 其他 Go Modules 依赖模块更新 单元测试与文档更新 包含简体中文、英语、法语、俄语、日语、韩语、阿拉伯语、德语和西班牙多国语言文档网站更新

1.5K61

Yann LeCun主讲!纽约大学《深度学习》2020课程全部开放

CDS发布了Yann LeCun深度学习(DS-GA 1008)课程所有材料,包括带英文字幕教学视频、书面讲义、课件以及带有PyTorch实现可执行Jupyter Notebooks。...(链接见文末) 课程视频示例 课程涵盖了深度学习和表示学习最新技术,重点包括监督/自监督学习、嵌入方法、度量学习、卷积网络和循环网络,并应用于计算机视觉、自然语言理解和语音识别。...不过,在学习这门课程之前,同学们还需要先学习纽约大学DS-GA 1001数据科学入门一门研究生级别的机器学习课程。 这门为期14周课程从深度学习历史、动机和灵感等主题开始。...值得一提是,这门课程还提供了多种语言版本讲义,包括英语阿拉伯语、西班牙、意大利、日语、韩语、土耳其、中文、法语、波斯、俄语等语言。并且,之后还将添加葡萄牙孟加拉和越南。...翻译工作是由来自全球17个时区470多名志愿者完成

69830

GPT-3 不够 Open,BigScience 构建开放语言模型,规模小 16 倍

除了由开放 AI 研究小组 EleutherAI 创建几个模型之外,很少有经过培训 LLM 可供研究部署到生产中。...英语法 LLM 数量远远超过其他语言培训 LLM,少数西欧语言(特别是德语,法语和西班牙)占据了主导地位。...用英语以外语言训练大型多语言和单模型虽然很少开源,但正变得比以前更常见,部分归功于企业利益。但是,由于公共数据源系统性偏差,非英语模型表现并不总是与英语模型一样好。...此外,阿拉伯语和乌尔都版本电子书大多为图像扫描件、而非纯文本,在使用光学字符识别工具转录过程其精度可能低至 70%。...该项目的贡献者还创建了最大阿拉伯语公共自然语言目录之一,称为Masader,拥有200多个数据集。

82340
领券