token - 标签 - 腾讯云开发者社区-腾讯云

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

#token

谷歌Gemini时代来了！加固搜索护城河、赋能全家桶，Gemini 1.5 Pro升级至200万token

HyperAI超神经 3天前2024-05-15 18:40:15

今年 2 月，谷歌宣布推出了 Gemini 1.5，其中的 Gemini 1.5 Pro 最高可支持 100 万 token 超长上下文，在 token 数量上...

12910

谷歌这次又“杀疯了”！200万token长文本能力问鼎全球最强，一场大会，AI被提了120次

深度学习与Python 3天前2024-05-15 18:32:47

谷歌的 Josh Woodward 详细介绍了 Gemini 1.5 Pro 和 Flash 的定价。Gemini 1.5 Flash 的价格定为每 100 万...

8610

使用frp的token认证

kongxx 3天前2024-05-15 08:08:55

frp在客户端的连接服务端时支持 token 和 oidc 认证，如果使用 token 认证，需要在服务端和客户端添加如下配置内容。

7010

微软让MoE长出多个头，大幅提升专家激活率

机器之心 4天前2024-05-14 15:48:14

之后，沿 token 维度将新序列中的每个 token 分拆为多个子 token，并根据原始 token 序列并行排布这些子 token，进而构成一个新的特征空...

6110

3倍生成速度还降内存成本，超越Medusa2的高效解码框架终于来了

机器之心 4天前2024-05-14 15:34:41

另一方面，CLLMs表现出了预测正确token的能力，即使在先前有错误token的情况下，也确保token保持不变。

7210

一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

机器之心 4天前2024-05-14 15:30:53

近日，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2，主打训练成本更低、推...

12510

思维链不存在了？纽约大学最新研究：推理步骤可「省略」

新智元 4天前2024-05-14 12:40:01

这篇文章的标题甚至直接用「Let’s think dot by dot」，来对标思维链的「Let’s think step by step」，展现了「省略号」的...

10210

上交| 提出一致性大模型：CLLMs，提升3倍生成速度，降低内存成本！

ShuYini 7天前2024-05-11 12:31:45

另一方面，CLLMs表现出了预测正确token的能力，即使在先前有错误token的情况下，也确保token保持不变。

16210

RSA加密算法获取Token

打铁读书郎 12天前2024-05-06 09:42:49

https://blog.csdn.net/u010048119/article/details/126049523

8310

太优雅了！Rust 200 行代码实现表达式解析

roseduan 18天前2024-04-30 17:24:41

表达式解析、计算是一种基本和常见的任务，例如最常见的算术表达式，计算的方法有很多，比如逆波兰表达式、LL、LR 算法等等。

8610

Rust设计模式：sealed trait 续篇

newbmiao

thoughtworks · 后台开发工程师 (已认证)

20天前2024-04-28 10:07:49

之前写sealed trait时没提他在oauth2-rs中怎么用, 为什么用，这个其实在状态接口设计中很有用，今天展开聊聊。

9210

Rust设计模式：typestate

newbmiao

thoughtworks · 后台开发工程师 (已认证)

20天前2024-04-28 10:07:24

在Oauth2中，一般需要提前配置好auth_url, token_url, introspect_url等，才能调用后续的鉴权相关功能。比如没有token_u...

8710

大模型输出概率 logprobs

数据STUDIO 22天前2024-04-26 09:45:59

输出标记的对数概率表示在给定上下文的情况下，每个标记出现在序列中的可能性。简单来说，对数概率是 log(p)，其中 p 是基于上下文中先前标记的概率。关于 lo...

10510

专治大模型说胡话，精确率100%！华科等提出首个「故障token」检测/分类方法

新智元 29天前2024-04-19 19:22:52

当用户使用大模型时，模型首先会将输入的内容拆分成一个个的词元（token），通过分析这些词元来生成答案，为我们解答疑惑、提供建议、翻译外语、撰写报告······...

11410

5亿个token之后，我们得出关于GPT的七条宝贵经验

机器之心 29天前2024-04-19 17:26:15

最近，初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-billion GPT tokens》...

15410

DeepMind升级Transformer，前向通过FLOPs最多可降一半

机器之心 29天前2024-04-19 17:11:26

Transformer 的重要性无需多言，目前也有很多研究团队致力于改进这种变革性技术，其中一个重要的改进方向是提升 Transformer 的效率，比如让其具...

7810

CVPR 2024 | 多模态大模型幻觉原因找到了！

数据派THU 2024-04-162024-04-16 12:49:13

由于现有多模态大模型的基座取自大语言模型，其因果语言模型的特点使其在浅层时将前文 token 的信息聚合到 summary token，同时在深层时主要利用 s...

31210

大型语言模型（LLMs）面试常见问题解析

科学冷冻工厂 2024-04-152024-04-15 15:34:10

这篇文章[1]是关于大型语言模型（LLMs）的面试问题和答案，旨在帮助读者准备相关职位的面试。

11210

PHP如何创建和管理JWT令牌

Tinywan

沃土股份 · 技术经理 (已认证)

2024-04-152024-04-15 10:55:26

JSON Web令牌（JWT）已成为Web开发中各方之间安全传输信息的流行方法。在本指南中，我们将探索在PHP中创建、验证和解码JWT令牌，而不依赖于外部库。我...

10810

微软&清华 | 提出模型训练新方法：SLM，选择优质Token进行训练，提升训练效率！

ShuYini 2024-04-132024-04-13 20:05:38

基于以上分析，本文提出了一种选择性语言建模(SLM)目标训练的模型：RHO-1，如上图右侧所示，该方法将完整序列输入到模型中，并有选择地删除不需要的Token ...

19710