首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

C言中你可能不熟悉的头文件(stdlib.h)

C言中你可能不熟悉的头文件(stdlib.h) C Standard General Utilities Library (header) C标准通用工具库(头文件) 此头文件定义了一些通用功能函数...将字符串(char[])转换为double类型数, 即(char) array-> float(函数) atoi 字符串转换为整型(函数) atol 字符串转换为long类型(函数) atoll (c+...+11) 字符串转换为长整型long long类型(函数) strtod 字符串转换为double类型(函数) strtof (c++11) 字符串转换为浮点类型(函数) strtol...字符串转换为long integer类型(函数) strtold (c++11) 字符串转换为long double类型(函数) strtoll (c++11) 字符串转换为long long...注: itoa并不是一个标准的C函数,它是Windows特有的,如果要写跨平台的程序,请用sprintf。

1.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

Facebook开源增强版LASER库,包含93种语言工具包

LASER 的性能和功能亮点 LASER 在 XNLI 语料库 14 种语言中的 13 种语言上获得了零样本跨语言自然语言推理任务的当前最佳准确率结果。...该编码器可以推广到没有被训练过(即使作为单语言文本训练集)的语言中。研究者发现编码器在地区性语言上有良好表现,包括阿斯图里亚斯、法罗、弗里西语、卡舒比、北摩鹿加、皮埃蒙特、施瓦本、索布。...在 14 种目标语言中,模型在 8 种语言上的零数据表现是在应用于英语时性能的 5% 上下区间。这 8 种语言包括与英语亲属关系远的俄语、汉语、越南等。...该获胜系统确实是为此任务设计的,但 Facebook 研究者把德译英的 F1 分数从 85.5 提升到了 96.2,法译英的 F1 分数从 81.5 提升到了 93.9,俄译英从 81.3 改进到 93.3...该方法可用于在使用任意语言对的情况下,挖掘 90 多种语言中的平行数据。这有助于改进众多依赖平行训练数据的的 NLP 应用,包括低资源语言的神经机器翻译。

1.3K10

40种语言、9项推理任务,谷歌发布新的NLP基准测试Xtreme

其中包括一些未被充分研究的语言,例如在印度南部、斯里兰卡和新加坡使用的达罗毗荼语系语言泰米尔,主要在印度南部使用的泰卢固和马拉雅拉姆,以及在非洲使用的尼日尔-刚果语系斯瓦希里和约鲁巴。...Xtreme评估了这些模型的零点跨语言转移性能(zero-shot cross-lingual transfer performance),也就是在其他语言中没有看到任务特定的数据。...对于在其他语言中可以使用标记数据的任务,Xtreme还比较了对语言内数据的微调,并通过获得所有任务的零概率得分最终得出一个综合分数。...其中,BERT对西班牙的准确率为86.9/100,日语则只有49.2/100,要转换成非拉丁文字也十分困难,而所有的模型都很难预测到在英语训练数据中没有看到的远方语言的实体,比如,在印度尼西亚和斯瓦希里上的准确率分别为...Research高级软件工程师Melvin Johnson和DeepMind科学家Sebastian Ruder在一篇博客文章中写道:“我们发现,尽管模型在大多数现有的英语任务中,表现已接近人类,但在许多其他语言中表现尚不足预期

66120

MIT开发新型无监督语言翻译模型,又快又精准

给定一种语言的新单词,然后他们就可以找到另一种语言中匹配的单词和短语。 但是这种翻译数据耗时且难以收集,并且对于全世界使用的7000种语言中的许多语言而言可能根本不存在。...最近,研究人员一直在开发“单”模型,这些模型使两种语言的文本之间进行翻译,但两者之间没有直接的翻译信息。...在实验中,研究人员的模型与最先进的单模型一样准确,有时更准确,重要的是速度更快,而且仅使用一小部分计算能力。...“该模型将两种语言中的单词视为一组向量,并通过基本保留关系将这些向量从一组映射到另一组,”该论文的共同作者,CSAIL研究员Tommi Jaakkola表示,“这种方法可以帮助翻译低资源语言或方言,只要它们有足够的单内容...如果向量都非常接近,它们的分数将接近0,并且它们越远,分数越高。例如,法语和意大利等类似的浪漫语言得分接近1,而汉语与其他主要语言得分在6到9之间。

72540

ACL 2021 | 腾讯AI Lab、港中文杰出论文:用单记忆实现高性能NMT

给定源语言中的输入 x,检索模型首先会根据相关函数 ? ,选择一些来自 Z 的可能有用的句子 ? ,其中 ? 。然后,翻译模型以检索到的集合 ? 和原始输入 x 为条件,使用概率模型 ?...检索模型 检索模型负责从大型单 TM 中为源语句选出最相关的语句。这可能涉及测量源语句和数百万个候选目标语句之间的相关性分数,带来了严重的计算挑战。...为了使从翻译输出到检索模型的梯度流有效,该研究将注意力分数与相关性分数进行了偏置处理,重写了等式(1)如下所示: ? 训练 该研究在负对数似然损失函数 ?...第二个任务是 token 级交叉对齐,其目的是在给定源语句表征的情况下预测目标语言中的 token,反之亦然。该研究使用词袋损失: ? 其中 ?...非参数领域自适应 由下表 4 可得,当仅使用双语数据时,与 non-TM 基线相比,TM 增强模型在数据较少的域中获得更高的 BLEU 分数,但在其他域中的分数略低。

74230

资源 | FAIR & NYU开发XNLI语料库:15种语言(含低资源语言)

行业应用的常规任务可能不包括自然语言推断(natural language inference,NLI),但研究者认为 NLI 是评估跨语言句子表征的良好测试平台,XNLI 的更好方法能够带来更好的跨语言理解...研究者使用文本蕴含标注这些句对,然后将这些句子翻译成 14 种语言:法语、西班牙、德语、希腊、保加利亚、俄语、土耳其、阿拉伯、越南、泰语、中文、印度、斯瓦西里和乌尔都,这就有 11.25...每个 premise 可与 15 种语言中的对应假设相关,一共有超过 150 万组合。 ? 该研究介绍了一个基准,即 XNLI 语料库,它将这些 NLI 语料库扩展到 15 种语言。...XNLI 语料库聚焦于开发数据和测试数据,因此构建它的目的是评估跨语言句子理解,其中模型必须在一种语言中训练,在其他不同的语言中测试。...研究展示了平行数据有助于在多语言中对齐句子编码器,以使使用 English NLI 数据训练的分类器能够正确地分类其他语言的句对。

1.7K30

教研室的故事——Excel公式之“争”

她一直想将学生每次考试的答案和成绩放到Excel工作表中,并由Excel自动算出分数。因为她觉得,算分数,Excel应该最拿手了。...图2 吴老师满意地看着这个刚完成的表,一名同事突然说,这么简单的需求,能不能不使用IF函数,直接比较得出TRUE/FALSE,然后将其转换成1/0。...于是,公式又变成了: =--(C3=C$2) 吴老师心想,“平时看不出来,这位同事在Excel方面还是高手呀!”此时,她突然灵机一动,“能不能使用一个公式就能算出总分呢?”...“那能不能不使用数组公式,就像刚才单独计算每题的分数那样。”显然,吴老师对同事的得意有点不快。 “So easy.”同事没有在意吴老师略带不快的表情,依然眉飞色舞。...还没等吴老师反映过来,同事又抛出了惊人之。 “真有这样的公式……”吴老师有点不相信地看着同事。 同事笑了笑,在吴老师惊奇的眼神注视下,慢慢地开始了表演。

58110

对预训练语言模型中跨语言迁移影响因素的分析

Anchor points Anchor points就是说在不同语言中都会出现的相同字符串,例如 DNA和Paris。...使用更高层的上下文特征的对齐能力比低层的要好 上下文word-level对齐 研究表明,对齐单语言模型(MLM对齐)获得了相对较好的性能,尽管它们的性能不如双语MLM,除了英语法语解析。...单对齐的结果表明,我们可以通过一个简单的线性映射对单BERT模型的上下文进行对齐,并将这种方法用于跨语言迁移。模型在中间层取得了最好的迁移对齐性能,而不是最后一层。...作者使用CKA神经网络相似性指数来研究BERT模型之间的相似性,并表明Transformer的底层比最后层的跨语言相似度更高 所有这些影响在关系更密切的语言中更强,这表明在距离更遥远的语言对中有显著改进的空间...最近文章 为什么回归问题不能用Dropout?

70820

开发 | Facebook 开源增强版 LASER 库:可实现 93 种语言的零样本迁移

句子嵌入通过使用该数据集,可以在多语言相似性搜索上得到很好的结果,即使是在低资源的语言中也是如此。...、斯瓦比亚、索布)的表现也非常强大。...Facebook 的研究人员考虑进行零样本设置,换句话说,就是研究人员在没有微调或者目标语言资源的情况下,在英语上训练 NLI 分类器,然后将它应用到目标语言中。...这个获胜的系统就是专为该任务所设计的,基于这个系统,Facebook 研究人员把德/英的 F1 分数从 85.5 提高到了 96.2、法/英的 F1 分数从 81.5 提升到了 93.9、俄/英从 81.3...这使得研究人员能够基于最终句子嵌入,仅使用英文标注数据就学习一个分类器,并且在不做任何修改的情况下将该分类器迁移到 93 种语言中的任意一种中。

1.4K30

ASCII

http://c.biancheng.net/c/ascii/ 转自C言中文网 ASCII(American Standard Code for Information Interchange,美国信息互换标准代码...后来呢,NUL 被用于C言中,表示字符串的结束,当一个字符串中间出现 NUL 时,就意味着这个是一个字符串的结尾了。...早在 1960s 年代,设计 ASCII 编码的美国人就已经想到了,ASCII 编码不仅仅能用于英文,也要能用于外文字符集,这很重要,定义 Shift In 和 Shift Out 正是考虑到了这点。...最开始,其意为在西里尔和拉丁之间切换。...我们现在习惯于随机访问一些存储介质,比如 RAM、磁盘等,但是在设计 ASCII 编码的那个年代,大部分数据还是顺序的、串行的,而不是随机访问的。

1.4K50

XLM-RoBERTa: 一种多语言预训练模型

尽管社区的单训练模型越来越多,但还有一种似乎不太受关注的替代方法:多语言模型。 在本文中,我们重点介绍XLM-R模型的关键要素,并探讨其在德语中的性能。...它比用来训练其前身的Wiki-100语料库大几个数量级,并且在资源较少的语言中,扩展尤其明显。它比用来训练其前版本的Wiki-100语料库大几个数量级,并且在资源较少的语言中,这种扩大尤其明显。...XLM-RoBERTa Large与GermEval18(分类)的最佳提交分数不相上下。在GermEval14(NER)上,该模型在F1的表现比在Flair的要好2.35%。 ? 评估结果。...这里是GermEval18 的排行榜,这里是Flair报告的分数 这些结果是在不进行大量超参数调整的情况下得出的,我们希望通过进一步调整学习率和batch大小可以改善这些结果。...我们认为,未来最好的模型可以从文本中学习,不仅可以从不同的领域而且可以从不同的语言中学习,这并不是不可思议的。

2.4K20

译|你不知道的CSS国际化

在大多数情况下,你会使用像 zh 这样的两个字母代码来表示中文,但中文(在其他语言中,如阿拉伯)被认为是由许多语言组成的大语言,其中有更多的主语子标记。...有些人可能想知道从右到左的语言,如阿拉伯、希伯来或波斯(仅举几例),以及CSS是否也适用于这些文字。 简而言之,CSS不应该用于双向风格设计。...再有,某些事情在英语等语言中发生的频率较低,但是在很大程度上影响了诸如缅甸这样的文字的美观性。 字体变化 有两类用于访问OpenType功能的CSS属性,即高级属性和低级属性。...它是同一字符,但写法可能不同。 ?...有141个特征标签,从可选的分数到对齐,从可选的Ruby表示法到割零。这些CSS属性与字体文件本身的功能密切相关,因此,外部依赖性取决于你选择的字体。

1.5K10

跨语言嵌入模型的调查

他们通过用居中矩阵C进行维数平均中心来捕捉这种直觉米CmCmC_m: 这就减少了最大化维数协方差的总和,只要3W与上述正交相似: 有趣的是,Faruqui和Dyer(2014)的方法类似于这个目标...因此,为了便于训练,作者最有可能用占位符替换源语言和目标语料库中的翻译对,以确保共同的向量表示,类似于后续模型的过程。...跨语言正则化术语反过来又鼓励经常彼此对齐的单词的表示类似: 其中一个一个A是矩阵捕获对齐分数, 是身份矩阵, 是克罗内克产品,和 是单词 .....双语跳读 Luong等人 将跳跃词扩展到跨语言环境,并使用跳跃词目标作为单和跨语言目标。与其仅仅预测源语言中的周围词语,他们使用源语言中的词语来额外地预测其在目标语言中的对齐词语,如图13所示。...这是通过首先使用每个语料库上的段向量来学习每种语言中文档的单表达来完成的。

6.8K100

C语言常用的知识没多少之C语言的数据类型及变量与常量

C言中有数值和数制之分,在这里就从数值和数制开始讲起。其实数值和数制这四个字就已经包含了本文的标题C语言的数据类型及变量与常量。 为了方便理解数值和数制,先联系一下现实生活中的数。...现实中的数学在数方面分为实数和虚数,而实数又分为整数、小数、分数、正数、负数、自然数等。这些把数根据某些标准分成几类称为数制。...在计算机中,实型是指小数(包括分数)。...所以也不能用双精度实型(double)代替整型(int)。...C言中会不停的使用常量与变量,初学者很容易搞混,最好多查阅和多度一些相关的资料。这样就能够分清什么是常量,什么是变量。

97820

40种语言、9项推理任务,谷歌发布新的NLP基准测试XTREME

针对在其他语言中也有标注数据的任务,作者也比较了模型在这些语言上进行微调后的性能,最终获得了 9 个XTREME任务的zero-shot得分,得出了综合分数。...具体分析包括五个部分: 最佳zero-shot模式分析:如上图所示,这部分主要说明为什么在不同的任务和语言中评估通用的多语言表征非常重要。...与训练前数据大小的相关性:如上图模型性能与各语言中维基百科文章数量的皮尔森相关系数ρ,表明除了结构化预测任务的任务外,多数任务的相关系数都很高。...跨语言的错误:因为对于其他测试集是从英语翻译过来的XNLI和XQuAD,这部分作者分析了这些方法在源语言和目标语言中是否会犯同样类型的错误。...更为具体一些是探讨了英语中正确和错误预测的例子是否在其他语言中被正确预测。结果是在XNLI和XQuAD数据集上有不同答案。

97510

覆盖40种语言:谷歌发布多语言、多任务NLP新基准XTREME

但不足的是,大多数这些方法侧重于在多语言中执行特定任务。...其中一些是 under-studied 的语言,如达罗毗荼语系中的泰米尔(印度南部、斯里兰卡和新加坡)、泰卢固和马拉雅拉姆(主要集中在印度南部)以及尼日尔-刚果语系中的斯瓦希里和约鲁巴(非洲)...不同任务之间的分数不可相比,重点在于同一任务下、不同语系中的相对排名,如图所示,许多高资源语言比如印欧语系,排名一直比较高。相比之下,该模型在其他语种,比如藏语、日语、韩语等语言上的性能排名较低。...研究人员还发现模型也很难迁移到非拉丁语言中。这种情况在 POS 任务上非常明显,其中 mBERT 在西班牙上的 zero-shot 准确率为 86.9%,在日语上仅为 49.2%。...对于实体命名识别,模型预测最为不准确的是与英语差异最大的几种语言——其在印尼和斯瓦西里中的准确度为 58.0 和 66.6,相比之下,葡萄牙和法语为 82.3 和 80.1。

1.1K30

Facebook最新对抗学习研究:无需平行语料库完成无监督机器翻译

我们在两个广泛使用的数据集和两个语言对上对模型进行演示,结果显示,BLEU分数高达32.8,而在在训练期间甚至没有使用一个平行句。...相反,单数据更容易找得到,而且许多具有有限并行数据的语言仍然拥有大量的单数据。 ? 在半监督环境中,我们已经进行了多次尝试,试图利用单数据来提高机器翻译系统的质量。...不幸的是,他们的方法局限性在于只适用于相当短的句子,而且它只是在一个非常简单的环境中得以证明的,包括那些最常见的短句子或者是非常接近的语言中。 ? 图1:原理简笔图,用以指导我们设计目标函数。...其中,x是目标,C(x)是噪声输入,x^是重建。右(翻译):模型被训练用以翻译另一个领域的句子。...该模型是对称的,我们在其他语言中将重复相同的过程。 在本文中,我们研究是否可以训练一个通用的机器翻译系统,而不需要任何形式的监督。我们所做的唯一假设是每种语言都存在一个单语料库。

88850
领券