腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
mathor
专栏作者
举报
447
文章
592187
阅读量
50
订阅数
订阅专栏
申请加入专栏
全部文章(447)
其他(110)
编程算法(77)
神经网络(43)
人工智能(43)
机器学习(36)
深度学习(34)
java(32)
ios(18)
NLP 服务(14)
c++(14)
批量计算(12)
存储(12)
pytorch(12)
alpha(12)
sum(12)
text(11)
serverless(10)
linux(8)
容器(8)
jsp(7)
html(7)
游戏(6)
windows(6)
数据结构(6)
token(6)
语音识别(5)
matlab(5)
语音合成(5)
腾讯云测试服务(5)
http(5)
卷积神经网络(5)
安全(5)
https(5)
embedding(5)
max(5)
size(5)
word2vec(5)
对象存储(4)
python(4)
git(4)
spring(4)
jdk(4)
erp(4)
面向对象编程(4)
数据分析(4)
int(4)
key(4)
nlp(4)
php(3)
css(3)
文件存储(3)
日志服务(3)
网站(3)
网络安全(3)
二叉树(3)
data(3)
google(3)
gpu(3)
hidden(3)
rank(3)
self(3)
tensor(3)
vector(3)
word(3)
编码(3)
数据(3)
bash(2)
node.js(2)
打包(2)
ide(2)
eclipse(2)
github(2)
开源(2)
缓存(2)
shell(2)
正则表达式(2)
gui(2)
numpy(2)
hashmap(2)
数据处理(2)
nat(2)
腾讯云开发者社区(2)
error(2)
layer(2)
mask(2)
model(2)
partial(2)
random(2)
事件(2)
网络(2)
免费套餐(1)
官方文档(1)
数据挖掘(1)
tensorflow(1)
c 语言(1)
.net(1)
r 语言(1)
bootstrap(1)
汇编语言(1)
嵌入式(1)
数据库(1)
oracle(1)
api(1)
tomcat(1)
搜索引擎(1)
bash 指令(1)
云直播(1)
时序数据库 CTSDB(1)
海外加速(1)
机器翻译(1)
企业(1)
运维(1)
黑客(1)
jvm(1)
wordpress(1)
hive(1)
yum(1)
监督学习(1)
线性回归(1)
asp(1)
cdn(1)
kernel(1)
iis(1)
网站建设(1)
特征工程(1)
功能测试(1)
性能测试(1)
黑盒测试(1)
es(1)
汽车(1)
architecture(1)
autoencoder(1)
block(1)
channel(1)
clone(1)
combine(1)
dagger(1)
dataset(1)
device(1)
dfs(1)
distance(1)
distribution(1)
document(1)
echarts(1)
encoding(1)
epoch(1)
equation(1)
excel(1)
fixed(1)
fork(1)
for循环(1)
function(1)
gan(1)
global(1)
hashtable(1)
identity(1)
input(1)
label(1)
lambda(1)
list(1)
load(1)
local(1)
ls(1)
min(1)
mnist(1)
module(1)
nan(1)
normalization(1)
object(1)
pandas(1)
pear(1)
pool(1)
position(1)
precision(1)
prediction(1)
profiling(1)
reshape(1)
rows(1)
sample(1)
search(1)
sequence(1)
sign(1)
spa(1)
src(1)
steam(1)
subset(1)
target(1)
testing(1)
time(1)
torch(1)
txt(1)
virtual(1)
web(1)
window(1)
zero(1)
表格(1)
动态规划(1)
二进制(1)
函数(1)
技巧(1)
解决方案(1)
开发(1)
可视化(1)
论文(1)
数组(1)
搜索(1)
统计(1)
优化(1)
语音(1)
搜索文章
搜索
搜索
关闭
BERT-of-Theseus
文件存储
最近了解到一种称为"BERT-of-Theseus"的BERT模型压缩方法,源自论文《BERT-of-Theseus: Compressing BERT by Progressive Module Replacing》。这是一种以"可替换性"为出发点所构建的模型压缩方案,相比常规的剪枝、蒸馏等手段,它整个流程显得更为优雅、简洁。本文将对该方法做一个简要的介绍,并给出一个简单的Pytorch实现
mathor
2021-06-08
639
0
Neural Machine Translation 论文阅读
机器学习
深度学习
人工智能
机器翻译
文件存储
这是2015年发表在ICLR上的论文,也是NLP中Attention机制的开山之作,Attention机制是为了解决一般的RNN Encoder-Decoder对长句子表现不佳的问题而设计的。从论文题目中我们可以看到,作者希望通过Attention机制将输入句子input和输出句子output进行"对齐"(SMT中也有所谓的词对齐模型)。但是,由于不同语言的句法语法结构千差万别,想将源句子与翻译句子严格的对齐是很困难的,所以这里的对齐实际上是软对齐(soft-alignment),也就是不必将源句子显式分割,因而又被形象地称为注意力机制(Attention Mechanism)
mathor
2020-03-17
728
0
Softmax
文件存储
上图中假设有三个输出,分别是2.0,1.0和0.1,如果将数值转换成概率的话,我们希望概率最大的值作为预测的label。即我们希望将最大值2.0所对应的索引作为相应的label输出,那么如何作为probilities输出呢?
mathor
2019-12-31
525
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档