增加翻译100个文档的限制_如何增加onLongPress的时间限制？_合金翻译的限制:关系的多重性 - 腾讯云开发者社区

领英（LinkedIn）账号的fork中向我提出了这样一个问题：如何微调诸如LLaMA的开源模型。公司正在寻找销售LLM托管和部署解决方案的业务案例，将人工智能和LLM应用于具体的产品。我问他们为什么不使用像ChatGPT这样的非开源模型时，他们没有给出正确的答案。所以我决定写这篇文章来解答如何利用llm解决日常业务问题。

您找到你想要的搜索结果了吗？

是的

没有找到

【干货】Elasticsearch的索引性能优化（3）

当Elasticsearch遇见智能客服机器人

摘要本次分享主要会介绍一下ES是如何帮我们完成NLP的任务的。在做NLP相关任务的时候，ES的相似度算法并不足以支撑用户的搜索，需要使用一些与语义相关的方法进行改进。但是ES的很多特性对我们优化搜索

独家 | 大语言模型教程

形式上，一个仅有解码器的语言模型只是一个条件分布p（xi|x1···xi−1），在已知上下文为x1····xi−1 的情境下，下一个标记xi的概率。该公式假定这一过程为马尔可夫过程，已在许多用例中进行了研究。这一简单的设置使我们能够以自回归的方式逐个生成标记。

说说 router4的exact 属性

这段时间正在研究 react router4 ，发现了其中一个很特别的属性。因为没有系统的看过官方的文档，所以在这里也频繁的踩坑。在网上也看过很多文章，结果还是踩坑。现在终于把坑踩平了，今天就把这个小小的知识点记录下来。加深一下理解。

django 1.8 官方文档翻译：13-1-3 密码管理

密码管理在非必要情况下一般不会重新发明，Django致力于提供一套安全、灵活的工具集来管理用户密码。本文档描述Django存储密码和hash存储方法配置的方式，以及使用hash密码的一些实例。

匿名论文提出奇招！增强大模型长文本能力居然还能这么做

具体办法就是建一个临时Lora模块，让它仅在长文本生成过程中“流式更新”，也就是用先前生成的内容不断作为输入来充当训练数据，以此保证知识被存进模型参数中。

RNN和LSTM弱！爆！了！注意力模型才是王道

大数据文摘作品编译：晚君、笪洁琼、钱天培循环神经网络（RNN），长短期记忆（LSTM），这些红得发紫的神经网络——是时候抛弃它们了！ LSTM和RNN被发明于上世纪80、90年代，于2014年死而复生。接下来的几年里，它们成为了解决序列学习、序列转换（seq2seq）的方式，这也使得语音到文本识别和Siri、Cortana、Google语音助理、Alexa的能力得到惊人的提升。另外，不要忘了机器翻译，包括将文档翻译成不同的语言，或者是神经网络机器翻译还可以将图像翻译为文本，文字到图像和字幕视频等等。

html+css学习笔记008-浮动0清除浮动

Author：Mr.柳上原付出不亚于任何的努力愿我们所有的努力，都不会被生活辜负不忘初心，方得始终我是一个很皮的人明知道不好的事做了会有坏处的事非要去皮一下快三十的人却总是管不住自己的皮性无数次的皮无数次的让别人帮我收尾无数次的继续皮为何总是不会三思而后行 <!DOCTYPE html> <html lang='en'> <head> <meat cha

腾讯在线文档发布：实现QQ、微信多平台多人协作编辑

18日，腾讯宣布推出专注多人协作的在线文档产品—腾讯文档，据介绍，腾讯文档是一款支持随时随地创建、编辑的多人协作式在线文档工具，拥有一键翻译、实时股票函数和浏览权限安全可控等功能，以及打通QQ、微信等

063

html+css学习笔记002-盒子模型

怕的不是我们不懂英文怕的不是我们不懂操作电脑怕的更不是我们不懂基础程序语言

Reformer: 高效的Transformer

理解序列数据 —— 如语言、音乐或视频 —— 是一项具有挑战性的任务，特别是当它依赖于大量的周围环境时。例如，如果一个人或一个物体在视频中消失，很久以后又重新出现，许多模型就会忘记它的样子。在语言领域，长短时记忆(LSTM)神经网络覆盖了足够的上下文来逐句翻译。在这种情况下，上下文窗口（在翻译过程中需要考虑的数据范围），从几十个词到大约 100 个词不等。最新的 Transformer 模型不仅改进了逐句翻译的性能，还可以通过多文档摘要生成整个 Wikipedia 的文章。这是可能的，因为 Transformer 使用的上下文窗口可以扩展到数千个单词。有了这样一个大的上下文窗口，Transformer 可以用于文本以外的应用，包括像素或音符，使其能够用于生成音乐和图像。

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

翻译：于之涵编辑：Leo 出品：AI科技大本营（公众号ID：rgznai100）

如何在 Keras 中从零开始开发一个神经机器翻译系统？

机器翻译是一项具有挑战性的任务，包含一些使用高度复杂的语言知识开发的大型统计模型。神经机器翻译的工作原理是——利用深层神经网络来解决机器翻译问题。在本教程中，你将了解如何开发一个神经机器翻译系统，

012

大模型Scaling Law同样适用于下游任务性能？斯坦福、谷歌最新研究揭秘

大模型的成功很大程度上要归因于 Scaling Law 的存在，这一定律量化了模型性能与训练数据规模、模型架构等设计要素之间的关系，为模型开发、资源分配和选择合适的训练数据提供了宝贵的指导。

重回榜首的BERT改进版开源了，千块V100、160GB纯文本的大模型

BERT 自诞生以来就展现出了卓越的性能，GLUE 排行榜上前几名的模型一度也大多使用 BERT。然而，XLNet 的横空出世，打破了 BERT 的纪录。不过，不久之后，剧情再次出现反转，Facebook 创建的改进版 BERT——RoBERTa，登上了 GLUE 排行榜榜首。

重回榜首的BERT改进版开源了，千块V100、160GB纯文本的大模型

ApacheCN 翻译活动进度公告 2019.3.10

参与方式：https://github.com/apachecn/pytorch-doc-zh/blob/master/CONTRIBUTING.md

WordPress 和 GDPR 以及如何移除后台隐私相关的页面

「GDPR」是 (The European) General Data Protection Regulation 的缩写，翻译成中文是：「通用数据保护条例」，是欧盟议会和欧盟理事会在 2016 年 4 月通过，在 2018 年 5 月开始强制实施的规定。

【译】Solidity 0.6.x更新：继承

与面向对象编程类似，Solidity是一种面向合约的语言，广泛使用继承和多态，并且对于语言的发展至关重要。Solidity开发人员如果不使用这些特性很难分离逻辑及增加代码重用性。

这几个脚本厉害了

之前分享过复活谷歌翻译，后来体验了下腾讯翻译https://transmart.qq.com/zh-CN/index 还挺好用的，有网页版、浏览器插件和客户端，打开网页右键开启翻译就行：

SAP在数字化路上给你挖了哪些坑

2018年4月，SAP将客户从传统授权转向消费模式的过程中迈出了第一步。这一新的数字访问许可旨在澄清SAP对间接访问的立场，即在基于SAP的系统中以机机交互取代人机交互。其战略是将SAP所谓的“数字核心”定位为主要的记录系统，因为企业希望获得高于核心企业资源规划（ERP）中的流程自动化的价值，并同时利用物联网（ IoT）和新兴技术趋势，例如客户体验和机器人流程自动化(RPA)。 SAP已经确定了系统生成记录的文档类型，它将其描述为“通用有价值的业务结果”。包括：按单项产品标准计算的销售额、发票、采购，

程序员如何学习英语

其次，我的英语水平也很一般，所以更多的是谈谈一些失败的经历和思考，俗话说，成功的经验不可复制，失败的经验倒可以让我们少走弯路。

150亿参数大杀器！Facebook开源机器翻译新模型，同传人员或失业

当把中文翻译成法文时，以前最好的多语种模型的方式是把中文翻译成英文，把英文翻译成法文，因为英语的训练数据是最多的。

5分钟NLP：文本分类任务中的数据增强技术

机器学习中的数据增强主要通过人工构建数据，增加训练集的大小使模型达到更好的泛化特性。这是一个在机器学习学科中进行的广泛研究的研究领域。

Multilingual预训练的那些套路

Multilingual是NLP中的研究热点之一，其中的一个研究方向是如何构建多语言预训练语言模型，实现不同语言的在隐空间的对齐，一个模型支持多语种的NLP任务，同时利用数据丰富的语言提升数据较少的语言效果。这篇文章就为大家整理了Multilingual多语言预训练语言模型的套路，包括XLM、XLM-R、ERNIE-M、Unicoder、ALM等5个经典模型，以及这些模型之间的演进关系。

百分点认知智能实验室出品：机器翻译是如何炼成的（下）

在“机器翻译是如何炼成的（上）”的文章中，我们回顾了机器翻译的发展史。在本篇文章中，我们将分享机器翻译系统的理论算法和技术实践，讲解神经机器翻译具体是如何炼成的。读完本文，您将了解：

SFFAI分享 | 田正坤：Seq2Seq模型在语音识别中的应用

随着神经机器翻译的兴起，基于Attention的Seq2Seq模型由于其强大的建模变长序列直接转换问题的能力，也在其他领域获得了极大的关注。语音识别问题本质上也是两个变长序列直接转换的问题，Seq2Seq模型的提出为解决语音识别问题开辟了另一条道路，其优雅的模型结构和强大的性能使得语音识别问题有希望彻底摆脱语言模型和发音词典，真正的进行端到端的联合优化。

@科研党，这大概是最好用的论文阅读神器了，还免费

鱼羊发自凹非寺量子位 | 公众号 QbitAI 这位道友，不知嗑盐途中，你是否也有阅读英文论文效率低下的烦恼？作为一个arXiv天天见的英语渣，本蒟蒻反正是在挖掘论文阅读神器的道路上不能自拔。这不最近，就又被网友们种草了一款桌面翻译软件。浅试一下，翻译PDF的效果是酱婶的：还有逐句对照功能：如果只是想看一眼摘要，随手截屏就OK，同样有中英文对照：妈妈再也不用担心我删回车删到手抽筋（手动狗头）。 △PDF中直接复制出的文本有多余换行，影响翻译效果这样的功能，来自最近更新升级的网易

新一届最强预训练模型上榜，出于BERT而胜于BERT

【导读】预训练方法设计有不同的训练目标，包括语言建模、机器翻译以及遮蔽语言建模等。最近发表的许多论文都使用了微调模型，并预先训练了一些遮蔽语言模型的变体。然而，还有一些较新的方法是通过对多任务微调提高性能，结合实体嵌入，跨度预测和自回归预训练的多种变体。它们通常在更大数据上训练更大的模型来提高性能。本文的目标是通过复制、简化和更好地微调训练BERT，以作为更好理解上述方法的相对性能的参考值。

ApacheCN 翻译活动进度公告 2019.3.24

参与方式：https://github.com/apachecn/seaborn-doc-zh/blob/master/CONTRIBUTING.md

GitHub超3万星：Transformer 3发布，BERT被一分为二

来了来了，它来了！它带着全新的tokenizer API、TensorFlow改进以及增强的文档和教程来了！

从锅炉工到AI专家(11)(END)

语音识别 TensorFlow 1.x中提供了一个语音识别的例子speech_commands，用于识别常用的命令词汇，实现对设备的语音控制。speech_commands是一个很成熟的语音识别原型，有很高的正确率，除了提供python的完整源码，还提供了c/c++的示例程序，方便你移植到嵌入设备及移动设备中去。官方提供了关于这个示例的语音识别教程。不过实际就是一个使用说明，没有对代码和原理做过多解释。这个程序相对前面的例子复杂了很多，整体结构、代码、算法都可以当做范本，我觉得我已经没有资格象前面的

TensorFlow从1到2（十）带注意力机制的神经网络机器翻译

机器翻译和语音识别是最早开展的两项人工智能研究。今天也取得了最显著的商业成果。早先的机器翻译实际脱胎于电子词典，能力更擅长于词或者短语的翻译。那时候的翻译通常会将一句话打断为一系列的片段，随后通过复杂的程序逻辑对每一个片段进行翻译，最终组合在一起。所得到的翻译结果应当说似是而非，最大的问题是可读性和连贯性非常差。实际从机器学习的观点来讲，这种翻译方式，也不符合人类在做语言翻译时所做的动作。其实以神经网络为代表的机器学习，更多的都是在“模仿”人类的行为习惯。一名职业翻译通常是这样做：首先完整听懂要翻译的语句，将语义充分理解，随后把理解到的内容，用目标语言复述出来。而现在的机器翻译，也正是这样做的，谷歌的seq2seq是这一模式的开创者。如果用计算机科学的语言来说，这一过程很像一个编解码过程。原始的语句进入编码器，得到一组用于代表原始语句“内涵”的数组。这些数组中的数字就是原始语句所代表的含义，只是这个含义人类无法读懂，是需要由神经网络模型去理解的。随后解码过程，将“有含义的数字”解码为对应的目标语言。从而完成整个翻译过程。这样的得到的翻译结果，非常流畅，具有更好的可读性。

千层Transformer问世！多语种机器翻译水准刷新多项SOTA

---- 新智元报道编辑：David 拉燕【新智元导读】近日，微软研究院的研究人员搞出了一个1000层的Transformer，在多语种机器翻译任务上刷新多项SOTA 近年来，追求大规模的Transformer模型成为了一种潮流。从一开始的百万级的模型参数，到十亿级，再到万亿级，参数规模极大增加。大规模的模型可以在大量任务中可以有更棒的表现，在小样本和零样本学习的情况下也展现出了出色的能力。尽管参数的数量越来越大，参数的深度却一直在被Transformer训练的不稳定性所局限。2019年，科

如何在 Windows 上使用 ONLYOFFICE 协作编辑文档

【Science】无监督式机器翻译，不需要人类干预和平行文本

编译：弗格森【新智元导读】两篇新的论文表明，神经网络可以在不需要平行文本的情况下学习翻译，这是一个令人惊讶的进步，它将可以让人们可以读懂更多语言的文档。因为神经网络，即一种以人脑为启发的计算机算法，自动的语言翻译取得了长足的进步。但是训练这样的网络需要大量的数据：通过数以百万计逐句对应的翻译来展示人类是如何做到这一点的。现在，两篇新的论文表明，神经网络可以在不需要平行文本的情况下学习翻译，这是一个令人惊讶的进步，它将可以让人们可以读懂更多语言的文档。 “想象一下，你给一个人很多中文书籍和大量的阿拉伯语

ApacheCN 翻译活动进度公告 2019.4.7

[转载]如何在NLP领域第一次做成一件事

自己也写过一篇关于NLP研究领域的个人粗浅的理解与入门学习建议----吾爱NLP(3)—我对NLP的理解与学习建议，今日偶然发现了微软亚研大佬的这篇文章，不仅介绍了NLP相关的各个研究领域以及入门实践的路径，还简单的解读了如何完成一篇学术论文，特此转载希望对各位有帮助。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐