腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大鹅专栏:大数据到机器学习
从大数据计算到机器学习,你需要了解这些。专注于Hadoop生态 Spark 机器学习 深度学习
专栏成员
举报
127
文章
295655
阅读量
47
订阅数
订阅专栏
申请加入专栏
全部文章(127)
机器学习(35)
深度学习(30)
NLP 服务(26)
编程算法(25)
java(22)
python(19)
https(14)
腾讯云 TI 平台(13)
spark(12)
hadoop(12)
http(11)
hbase(11)
云服务器(9)
机器学习平台(9)
人工智能(8)
网络安全(8)
tensorflow(7)
推荐系统(7)
node.js(6)
数据库(6)
大数据解决方案(6)
大数据(6)
kafka(6)
缓存(5)
html(4)
spring(4)
神经网络(4)
TDSQL MySQL 版(4)
大数据处理套件 TBDS(4)
存储(4)
线性回归(4)
模式识别(4)
数据挖掘(3)
vue.js(3)
云数据库 SQL Server(3)
sql(3)
ide(3)
linux(3)
批量计算(3)
文件存储(3)
消息队列 CKafka 版(3)
弹性 MapReduce(3)
网站(3)
jdk(3)
jvm(3)
数据分析(3)
智能推荐平台(3)
javascript(2)
bash(2)
xml(2)
matlab(2)
bash 指令(2)
知识图谱(2)
容器(2)
serverless(2)
游戏(2)
分布式(2)
强化学习(2)
hive(2)
spring boot(2)
决策树(2)
pytorch(2)
rpc(2)
云数据仓库套件 sparkling(2)
jupyter notebook(2)
对象存储(1)
其他(1)
官方文档(1)
腾讯云gme(1)
c++(1)
scala(1)
bootstrap(1)
css(1)
jquery(1)
云数据库 Redis(1)
flask(1)
打包(1)
api(1)
搜索引擎(1)
中文分词(1)
unix(1)
ubuntu(1)
apache(1)
容器镜像服务(1)
GPU 云服务器(1)
容器服务(1)
NAT 网关(1)
消息队列 CMQ 版(1)
腾讯云ide(1)
文字识别(1)
机器翻译(1)
mongodb(1)
图像处理(1)
yarn(1)
云数据仓库 PostgreSQL(1)
kubernetes(1)
图像识别(1)
卷积神经网络(1)
numpy(1)
面向对象编程(1)
zookeeper(1)
keras(1)
二叉树(1)
aop(1)
socket编程(1)
安全(1)
数据处理(1)
windows(1)
安全漏洞(1)
数据结构(1)
nat(1)
对话机器人(1)
轻量应用服务器(1)
es(1)
Elasticsearch Service(1)
流计算 Oceanus(1)
add(1)
alpha(1)
ci(1)
ddl(1)
lines(1)
list(1)
max(1)
min(1)
sum(1)
递归(1)
链表(1)
搜索文章
搜索
搜索
关闭
GNN系列 综述 GNN GCN GraphSAGE GAT 简单理解 及调优Trick
知识图谱
神经网络
卷积神经网络
机器学习
腾讯云 TI 平台
图(graph)是一种数据结构,图神经网络(Graph Neural Network)应该是深度学习在图结构数据上的一些模型、方法和应用。常见的图结构由节点(node)和边(edge)构成,节点包含了实体(entity)信息,边包含实体间的关系(relation)信息。
大鹅
2022-09-04
2.8K
0
NLP任务之中文拼写 语法纠错 介绍与综述
机器学习
深度学习
NLP 服务
在很多中文NLP相关的落地场景都会涉及到文本纠错的相关技术,例如跟各种形式机器人的语音或者文字对话,或者用手机扫描相关的PDF或者图片,或者跟人聊天时用输入法打字等等,无论是通过ASR识别的语音信息,通过OCR识别得到的图片信息,还是用户真实通过输入法的文字,都有可能出现错误。这些错误会影响文本的可读性,不利于人和机器的理解,如果这些错误不加处理,会传播到后续的环节,影响后续任务的效果。常见的中文错误类型包括以下几种:
大鹅
2022-07-20
4K
1
GNN系列 GCN简述 推导理解 及 DGL 源码解析
知识图谱
深度学习
机器学习
数据挖掘
NLP 服务
深度学习一直都是被几大经典模型给统治着,如CNN、RNN等等,它们无论再CV还是NLP领域都取得了优异的效果,那这个GCN是怎么跑出来的?是因为我们发现了很多CNN、RNN无法解决或者效果不好的问题——图结构的数据。
大鹅
2022-07-17
2.5K
0
腾讯云GPU最佳实践-使用jupyter pycharm远程开发训练
GPU 云服务器
jupyter notebook
深度学习
机器学习
机器学习平台
作为炼丹工程师,GPU毫无疑问会给我们训练模型带来极高的效率提升,但是一般实际开发都是本地编写然后复制代码到GPU机器上面运行,这样效率就会有一定的折损,而且同时维护两套环境可能还会偶尔会有报错。那么为什么我们不直接远程到GPU机器上直接进行开发呢?
大鹅
2022-04-23
3K
0
标签平滑 Label Smoothing 详解及 pytorch tensorflow实现
机器学习
深度学习
图像处理
图像识别
NLP 服务
标签平滑(Label smoothing),像L1、L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地预测标签,改善泛化能力差的问题。
大鹅
2022-01-27
2.4K
3
XGBoost 实现文本分类与sklearn NLP库TfidfVectorizer
机器学习
深度学习
python
java
NLP 服务
在文本分类任务中经常使用XGBoost快速建立baseline,在处理文本数据时需要引入TFIDF将文本转换成基于词频的向量才能输入到XGBoost进行分类。这篇博客将简单阐述XGB进行文本分类的实现与部分原理。
大鹅
2021-12-23
2.6K
1
句法依存分析背景 基本概念 及常用方法
机器学习
腾讯云 TI 平台
机器学习平台
深度学习
NLP 服务
句法结构分析又称短语结构分析(phrase structure parsing),也叫成分句法分析(constituent syntactic parsing),用于获取整个句子的句法结构;
大鹅
2021-12-21
2K
0
ESIM 短文本匹配 模型解读分析
深度学习
机器学习
腾讯云 TI 平台
机器学习平台
NLP 服务
ESIM是一个综合应用了BiLSTM和注意力机制的模型,在文本匹配中效果十分强大.
大鹅
2021-11-12
2K
0
深度学习中的文本分类方法汇总相关代码及调优trick
机器学习
深度学习
NLP 服务
Fasttext是Facebook推出的一个便捷的工具,包含文本分类和词向量训练两个功能。
大鹅
2021-11-06
1.7K
0
NLP任务汇总简介与理解
机器学习
深度学习
文字识别
python
NLP 服务
序列标注(Sequence labeling)是我们在解决NLP问题时经常遇到的基本问题之一。在序列标注中,我们想对一个序列的每一个元素标注一个标签。一般来说,一个序列指的是一个句子,而一个元素指的是句子中的一个词。比如信息提取问题可以认为是一个序列标注问题,如提取出会议时间、地点等。
大鹅
2021-10-06
3.9K
0
GPT/GPT2/DialoGPT 详解对比与应用-文本生成与对话
机器学习
深度学习
人工智能
tensorflow
NLP 服务
GPT 的全名:Generative Pre-Training,其论文标题是 Improving Language Understanding by Generative Pre-Training。
大鹅
2021-09-15
8.8K
0
基于GPT2制作一个chatbot
机器学习
腾讯云 TI 平台
NLP 服务
想必大家都有经历,处于多种原因有个很好的朋友不再跟你聊天了,那么可不可以用他的微信聊天记录来大致还原一下这个人的聊天习惯语气甚至是喜欢发的表情包等等呢?
大鹅
2021-09-14
2.1K
0
机器学习 深度学习中激活函数sigmoid relu tanh gelu等汇总整理
机器学习
深度学习
推荐系统
智能推荐平台
人工智能
这篇博客主要总结一下常用的激活函数公式及优劣势,包括sigmoid relu tanh gelu
大鹅
2021-09-12
2.5K
0
wide & deep 模型与优化器理解 代码实战
机器学习
腾讯云 TI 平台
深度学习
智能推荐平台
推荐系统
wide & deep模型是Google在2016年发布的一类用于分类和回归的模型。该模型应用到了Google Play的应用推荐中,有效的增加了Google Play的软件安装量。目前wide & deep模型已经开源,并且在TensorFlow上提供了高级API。
大鹅
2021-09-12
2.6K
2
深度学习常用优化器汇总整理
机器学习
腾讯云 TI 平台
机器学习平台
人工智能
云服务器
为机器学习项目选择好的优化器不是一项容易的任务。流行的深度学习库(如 PyTorch 或 TensorFLow)提供了多种优化器选择,它们各有优缺点。并且,选择不合适的优化器可能会对机器学习项目产生很大的负面影响。这使得选择优化器成为构建、测试和部署机器学习模型过程中的关键一环。
大鹅
2021-09-05
2.1K
0
NLP烤面筋
人工智能
机器学习
NLP 服务
https://l1nwatch.gitbook.io/interview_exercise/stackoverflow-about-python/python-zhong-guan-jian-zi-yield-you-shi-mo-zuo-yong
大鹅
2021-09-01
1.3K
4
深度学习NLP从RNN LSTM GRU seq2seq到Attention分类及解析
机器学习
腾讯云 TI 平台
深度学习
人工智能
NLP 服务
上一篇博客讲了Transformers里面的self-attention,在NLP领域中其实attentionseq2seq的时候就有广泛应用了。这篇文章主要总结一下从从RNN LSTM GRU seq2seq 到attention的种类及应用,方便大家理解整体发展与attention机制。
大鹅
2021-08-31
1.6K
0
Transformer (Attention is all you need) 详解
机器学习平台
机器学习
深度学习
云服务器
NLP 服务
在之前的博客中有简单讲到Transformer,这篇博客将会专门详细的一起看看内部的计算与实现。
大鹅
2021-08-26
2.5K
1
NLP BERT GPT等模型中 tokenizer 类别说明详解
机器学习
机器学习平台
深度学习
中文分词
NLP 服务
在使用GPT BERT模型输入词语常常会先进行tokenize ,tokenize具体目标与粒度是什么呢?tokenize也有许多类别及优缺点,这篇文章总结一下各个方法及实际案例。
大鹅
2021-08-20
17.5K
0
BERT系列RoBERTa ALBERT ERINE详解与使用学习笔记
机器学习
机器学习平台
深度学习
模式识别
NLP 服务
继上一篇博客,这篇主要讲一下BERT以及BERT衍生的模型,如RoBERTa ALBERT ERINE等模型的改进与优化效果。
大鹅
2021-08-19
5.5K
4
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档