开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

大模型只能够记忆与理解有限的上下文已经成为大模型在真实应用中的能力瓶颈，例如对话式AI系统往往无法记忆你前一天对话的内容，利用大模型构建智能体会产生前后不一致的行为与记忆。

01

20个 CSS 快速提升技巧

css重置库如normalize.css已经被使用很多年了，它们可以为你的网站样式提供一个比较清晰的标准，来确保跨浏览器之间的一致性。

02

您找到你想要的搜索结果了吗？

是的

没有找到

如何提升你的CSS技能，掌握这20个css技巧即可[完整版]

随着前端开发越来越关注效率：通过选择器的使用和简化代码来快速加载渲染。像Less、SCSS这样的预处理器在工作的时候，需要绕的路较长，而直接使用css速度会更快。这里涵盖了20个css技巧来帮助你减少重复规则和复写，在布局中标准化样式流程，不仅可以帮助你高效地创建自己的框架，而且可以解决许多常见的问题。

02

ACL 2021中的25个Transformers模型

读者朋友们，多多笔记更新啦。最近事情比较杂乱（花式懒），所以停更了一段时间，不过也重构和基本完成了之前构思的Transformer教程，目前也正在内测，期待更好的她。

03

让你兴奋不已的13个CSS技巧🤯

快来免费体验ChatGpt plus版本的，我们出的钱体验地址:https://chat.waixingyun.cn 可以加入网站底部技术群，一起找bug，另外新版作图神器已上线 https://cube.waixingyun.cn/home

05

「有效上下文」提升20倍！DeepMind发布ReadAgent框架

基于Transformer的大语言模型（LLM）具有很强的语言理解能力，但LLM一次能够读取的文本量仍然受到极大限制。

01

Transformer中的Positional Encoding

最近我在学习Transformer结构的时候，发现其中的positional encoding很不好理解，尤其是其中的公式，为什么要这样设计，后来上网收集各种资料，方才理解，遂于此写一篇文章进行记录

00

电影搭子来了！贾佳亚团队用2token让大模型津津有味地看GTA6预告片

家人们谁懂，连大模型都学会看好莱坞大片了，播放过亿的GTA6预告片大模型还看得津津有味，实在太卷了！

01

Django:web框架的学习(4:番外篇)

HTML语言的学习 ---- 学习技术的第一层面： what 学习技术的第二层面： how 学习技术的第三层面： why ---- 1：第一层理解本质上一种文本标记语言. 甚至可以说和我们熟悉的Markdown的标记语言有点类似. Markdown标记语言转换成HTML就是和HTML标记语言一样的语法. 目前接触的标记语言 Markdown: 书写文字排版的标记语言 HTML/CSS/JavaScript: HTMl 显示网页信息，CSS 对网页信息进行修饰，JavaSript 对于网页显示

03

【文本检测与识别白皮书-3.2】第二节：基于CTC的无需分割的场景文本识别方法&基于注意力机制的无需分割的场景文本识别方法

时序连接序列(CTC)算法早期由Graves等人(2016)提出，用以训练循环神经网络(Cho 等，2014;Hochreiter 和Schmidhuber，1997)，并直接标记未分割的特征序列。CTC 算法在多个领域均证明了它的优异性能，例如语音识别(Graves 等，2013;Graves 和Jaitly，2014)和联机手写文本识别(Graves等，2009;Graves，2012)。

02

html基本标签(慕课网)

html标签：　　1、<q>标签，短文本引用(quote,引用) 　　　　注解：引用短文本，比如引用古人的一句话，注意引用的文本不需要再加双引号。　　　　　　　<q>标签的真正关键点不是它的默认

05

【布局】493- 工作中遇到的特殊CSS布局

虽然有时确实会让我们花蛮多时间去实现，但从一方面想这也是个机会，让我们更深入了解的浏览器布局方式。

01

HTML基础标签

版权声明：本文为博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。

02

7 Papers & Radios | Transformer自动debug；AI合成舞蹈落地应用

论文 1：DeepDebug: Fixing Python Bugs Using Stack Traces, Backtranslation, and Code Skeletons

05

2-HTML的标签

01

每日学术速递5.27

1.Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models

02

ACL 2022 | 中科院计算所、字节等提出：语音翻译新方法 STEMM——跨模态混合训练缓解模态鸿沟

作者丨房庆凯 1 前言在这个信息全球化的时代，人们能够通过互联网轻松接触到来自世界各地的信息，了解异国他乡的风土人情。然而，语言不通常常成为我们网上冲浪过程中的最大阻碍。幸运的是，近年来迅猛发展的机器翻译技术已经能够在很大程度上帮助人们打破语言屏障，理解各种语言背后的信息。但随着互联网时代信息的呈现方式愈加丰富多样，例如声音、视频、直播等，简单的文本翻译已经不再能够满足人们的日常需求。在这样的背景下，语音翻译技术应运而生。语音翻译，即将一种语言下的语音翻译为另外一种语言下的语音或文字，在当下有着广泛

03

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

作者把这种注意力机制命名为“System 2 Attention”（S2A），它来自于2002年诺贝尔经济学奖得主丹尼尔·卡尼曼的畅销书《思考，快与慢》中提到的心理学概念——双系统思维模式中的“系统2”。

01

两行代码解决大语言模型对话局限！港中文贾佳亚团队联合 MIT 发布超长文本扩展技术

代码和Demo地址：https://github.com/dvlab-research/LongLoRA

02

HTML 入门笔记－初识HTML

基础框架 <!DOCTYPE HTML><html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"><title>标题标签</title></head><body>

了不起的盖茨比

《了不起的盖茨比》为那个奢靡年代的缩影。盖茨比怀揣着对"美国梦"的期翼，投身到那个年代的灯红酒绿之中，却在名利场中看尽世态炎凉，以及浮华背后一切终将逝去的空虚怅惘。1925年《了不起的盖茨比》

05

文本标签「程序员培养之路第二天」

02

46. Django 2.1.7 使用富文本编辑器 tinymce

借助富文本编辑器，网站的编辑人员能够像使用offfice一样编写出漂亮的、所见即所得的页面。此处以tinymce为例，其它富文本编辑器的使用也是类似的。

02

ACL 2019 | 图表示解决长文本关系匹配问题：腾讯提出概念交互图算法

判断两篇文章之间的语义关系对于新闻系统等应用有着重要的意义。例如，通过对新闻文章之间的关系判断，一个新闻应用可以将讲述同样的事件的文章聚类在一起，去除冗余，并形成事件发展的脉络。在图 1 中，「2016 美国总统大选」这一故事的主要信息被组织成一条故事树。其中的每个节点，代表了讲述该故事中同样的一个子事件的文章集。这种文本组织方式，在信息爆炸的时代，能给人们带来极大的便利。

02

好用、强大的大纲编辑器综合评测：Workflowy、 Dynalist 、幕布、 Cloud Outliner 、坚果云大纲笔记、双链笔记、大纲模式软件

最近几年，大纲编辑器作为特殊的编辑器，逐渐被很多用户所知悉。其中，支持将大纲一键转换为思维导图的幕布可能最为有名。

00

ACL 2019 | 图表示解决长文本关系匹配问题：腾讯提出概念交互图算法

本文作者：Bang Liu、Di Niu等文章之间关系匹配是自然语言处理领域的重要问题。传统算法忽略了文本内部语义结构，而深度神经网络目前主要用于句子对之间的匹配。同时由于长文本对计算量需求较大，且目前缺乏训练数据集，因此长文本的匹配问题一直难以解决。对此，来自阿尔伯塔大学和腾讯 PCG 移动浏览器产品部的研究者提出了概念交互图（Concept Interaction Graph）算法，对比现有的文章关系匹配算法有明显的效果提升。该论文已被自然语言处理顶会 ACL 2019 接收，项目代码和数据集已

HTML概要

HTML CSS Javascript 的关系 HTML是网页内容的载体。内容就是网页制作者放在页面上想要让用户浏览的信息，可以包含文字、图片、视频等。 CSS样式是表现。就像网页的外衣。比如，标题字

09

Django 2.1.7 使用富文本编辑器 tinymce

Django 2.1.7 Admin - 注册模型、自定义显示列表字段 Django 2.1.7 上传图片 - Admin后台管理 https://django-tinymce.readthedocs.io/en/latest/

01

达观高翔：智能文档处理IDP关键技术与实践

什么是智能文档处理？针对文本数据处理尤其是纯文本，大家通常会想到使用自然语言处理（Natural language processing，NLP）技术来解决语义理解及分析处理工作。关于自然语言处理技术的研究有很长历史，针对不同层面文本处理和分析有很多技术点，常见技术例如分词与词性标注、命名实体识别、句法结构分析、文本分类、文本摘要等功能。

03

CVPR 2020 | 深度视觉推理2.0：组合式目标指代理解

本文介绍的是CVPR 2020上收录的论文《Cops-Ref: A new Dataset and Task on Compositional Referring Expression Comprehension》（已开源），文章第一作者是香港大学的陈振方同学，这项工作是陈振方同学在澳大利亚阿德莱德大学吴琦老师组访问时所完成。

01

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。

01

大话文本分类

概述文本分类是自然语言处理的重要应用，也可以说是最基础的应用。常见的文本分类应用有：新闻文本分类、信息检索、情感分析、意图判断等。本文主要针对文本分类的方法进行简单总结。 01 — 传统机器学习方法分类问题一般的步骤可以分为特征提取、模型构建、算法寻优、交叉验证等。对于文本而言，如何进行特征提取是一个很重要也很有挑战性的问题。文本的特征是什么，如何量化为数学表达呢。最开始的文本分类是基于规则的，特征就是关键词，例如足球在体育类出现的次数多，就将含有足球这一关键词的文本氛围体育。后来为了便于计算，通过

解决大模型幻觉问题的新方案：探索长文本切割的奥秘

在人工智能领域，大模型有时会产生一个被称为“幻觉问题”的现象。在对话过程中，大模型可能会答非所问，生成与用户输入不符、与先前生成的内容矛盾或与已知世界知识不符的内容。这就是所谓的“幻觉问题”。

01

ChatGPT能写长篇小说了，ETH提出RecurrentGPT实现交互式超长文本生成

机器之心专栏机器之心编辑部如今大型语言模型（如 ChatGPT）风靡全球，其最重要的应用之一就是辅助用户完成各种日常写作，如撰写电子邮件，创作博客文章，都能得到它的有力支持。但是目前包括 ChatGPT 在内的各种大语言模型在长内容创作领域，如小说，剧本，长篇文案等领域却显得力不从心。近期，来自苏黎世联邦理工和波形智能的团队发布了 RecurrentGPT，一种让大语言模型 (如 ChatGPT 等) 能够模拟 RNN/LSTM，通过 Recurrent Prompting 来实现交互式超长文本生成，

02

盘点那些具有特色的写作软件

在软件市场，拥有很多各具特色的编辑器。在最近两年，随着 Notion 和 Roam Research 等工具的发展，原本已经拥挤的笔记软件赛道又出现了不少新的笔记软件。

02

怒超 GPT-4！LONGMEM：提升大语言模型（LLMs）长文本处理能力，最高可达64k

对于长文本处理，大型语言模型(LLMs)仍然存在短板，即使目前最强GPT-4最多也就支持32k个Token。为了能够提升LLM长文本处理水平，今天大家介绍了一种名为LONGMEM的方法架构，该方法将长文本序列分块并利用存储器进行处理且无需对模型进行重训练，最高可支持64k个Token，有效的提高了模型长文本处理能力，相比GPT-4多了一倍。

04

7 papers | Quoc V. Le、何恺明等新论文；用进化算法设计炉石

论文 1：Self-training with Noisy Student improves ImageNet classification

03

微软研究院开源DialoGPT：「你有什么梦想？」「让世界充满机器人」

DialoGPT 是一种用于对话响应生成的可调节式千兆词级神经网络模型，其训练基于 Reddit 数据。该研究成果的源代码已经开源，另外他们也发布了一个大规模预训练模型。

03

微信 OCR（2）：深度序列学习助力文字识别

本文主要介绍了深度序列学习在OCR中的应用，包括CRNN、EDA、Encoder-Decoder、Attention模型等。这些模型在OCR领域取得了显著的成果，可以用于端到端的文本识别。其中，CRNN模型在文本识别任务上表现尤为突出，可以处理不同大小、字体、颜色的文本，并且不需要文本框标注。在实践中，使用Attention OCR模型可以更好地处理含有多个背景干扰的文本，并且可以适应不同排版和字体大小的文本，真正实现了端到端的文本识别。然而，该方法仍存在一些局限性，如识别结果字符内容可能乱序，以及不适用于文字内容较多的图片等。

05

百度NLP | Familia：开源的中文主题模型应用工具包

机器之心专栏作者：百度NLP 本期百度NLP 专栏介绍了百度开源的中文主题模型应用工具包 Familia。在本文中，作者结合 Familia 汇总主题模型在工业界的一些典型应用案例，方便开发者按图索骥，找到适合自己任务的模型以及该模型的应用方式。主题模型是文本挖掘的重要工具，近年来在学术界和工业界都获得了非常多的关注。虽然学术界的研究人员提出了多种多样的主题模型来适应不同的场景，这些工作主要集中在「建模」层面，即设计合理的模型来适配各色各样的数据，而指导主题模型在工业场景「落地」的资源和文

06

AI攒论文指日可待？Transformer生成论文摘要方法已出

译文：「我们提出了一种通过神经摘要为超过数千词的长文本生成抽象摘要的方法。我们先在生成摘要之前执行一个简单的抽取步骤，然后再将其用于在相关信息上调整 transformer 语言模型，之后将其用于生成摘要。我们表明这个抽取步骤能显著提升摘要结果。我们还表明这个方法能得到比之前的使用复制机制的方法更抽象的摘要，同时还能得到更高的 rouge 分数。」

03

贾佳亚团队开源全球首个70B长文本大语言模型，读论文看小说直接ProMax

就在最近，中国香港中文大学贾佳亚团队联合MIT宣布了一项新研究，一举打破如此僵局：

01

[评测]沁恒RISC-V开发板读取内存卡字库显示

再次感谢沁恒官方寄送的这块 CH32V103 开发板，集成了仿真下载器，集成了USB转串口，还兼容了Arduino接口，使用起来很方便。

02

搜狐文本匹配算法大赛方案总结

在自然语言理解中，自然语言推理（Nature Language Inference，NLI）被认为是一个非常基础但重要的研究任务。它要求机器去理解自然语言的深层次语义信息，进而做出合理的推理。更具体的推理任务，则是判断句子关系，即对于给定的两个句子，判断它们含义是否一致。

02

三年磨一剑——微信OCR图片文字提取

导语 | 2021年1月，微信发布了微信8.0，这次更新支持图片文字提取的功能。用户在聊天界面和朋友圈中长按图片就可以提取图片中文字，然后一键转发、复制或收藏。图片文字提取功能基于微信自研OCR技术，本文将介绍微信OCR能力是如何落地文字提取业务的。文章作者：伍敏慧，腾讯WXG研发工程师。一、背景微信8.0上线了图片提取文字的功能，用户在聊天界面和朋友圈中如果想提取图像中的文字，不用再辛苦打字了，只要简单几个步骤，就可以拿到图片中的文字内容，超级方便实用。图1 微信客户端提取图片中的

05

腾讯数平精准推荐 | OCR技术之检测篇

本文将主要介绍数平精准推荐团队的文本检测技术。

多模交互设计时该注意哪些事项？

2.多模态交互过程中，同时考虑操作对象和流程颗粒度的变化和返回逻辑，建议统一以一个用户界面（User Interface）作为参照对象进行管理。

02

揭秘微信「看一看」如何精准挖掘你感兴趣的内容

作者：maricoliao，腾讯 WXG 应用研究员一、背景随着自媒体时代的蓬勃发展，各类自媒体平台每天涌现出海量信息。微信作为最优质的自媒体平台，每天新发表文章数百万篇。汹涌而来的信息，极大地丰富了人们的精神和娱乐生活，但同时也存在着信息繁杂无序、内容同质化、质量参差不齐等问题，而用户最关心的是最新、最热的新闻热点事件。在此背景下，如何快速、准确地挖掘新闻热点内容，帮助用户更快、更好地了解热点事件，并追踪事件的来龙去脉和不同观点，是非常值得深入研究的问题。就此，我们针对微信生态特色，并结合外部媒

02

腾讯数平精准推荐 | OCR技术之检测篇

在过去的数年中，腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据分析及挖掘等领域的技术研发与落地。特别是在广告推荐领域，团队自研的基于深度在线点击率预估算法及全流程实时推荐系统，持续多年在该领域取得显著成绩。而在用户意图和广告理解上，借助于广告图片中的文本识别以及物体识别等技术手段，可以更加有效的加深对广告创意、用户偏好等方面的理解，从而更好的服务于广告推荐业务。 OCR（Optical Character Recognition, 光学字符识别）是指对输入图像进行分析

04

7个使用Firefox的理由

近日，Firefox工程项目副总裁发表言论“你在浏览器上所花的时间，或许比你在床上所花的时间还要久”。诚然，当今社会已经全面进入了网络化，人们越来越离不开网络的支持和服务。正因为人们在网络上所花的时间越来越长，选择一款合适的浏览器也变的至关重要。在网络时代，我们所做最多的动作就是点击、选择和滚动，而正是浏览器帮助我们将一行行的代码转变成为缤纷绚烂的页面。浏览器的表现很大程度上影响你的网络效率和体验。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭