学习
实践
活动
工具
TVP
写文章

大鹅专栏:大数据到机器学习

从大数据计算到机器学习,你需要了解这些。专注于Hadoop生态 Spark 机器学习 深度学习
127 篇文章
114.1K 次阅读
43 人订阅
举报

全部文章

大鹅

GNN系列 综述 GNN GCN GraphSAGE GAT 简单理解 及调优Trick

图(graph)是一种数据结构,图神经网络(Graph Neural Network)应该是深度学习在图结构数据上的一些模型、方法和应用。常见的图结构由节点(n...

34242
大鹅

【玩转 Cloud Studio】使用Cloud Studio 进行python开发最佳实践

作为一个Python开发,经常需要把各种pip lib安装到自己的电脑上,导致自己的电脑存储占用越来越多而且越来越卡。如果我们有一个物美价廉的远程开发平台,每个...

456102
大鹅

NLP任务之中文拼写 语法纠错 介绍与综述

在很多中文NLP相关的落地场景都会涉及到文本纠错的相关技术,例如跟各种形式机器人的语音或者文字对话,或者用手机扫描相关的PDF或者图片,或者跟人聊天时用输入法打...

959113
大鹅

GNN系列 GCN简述 推导理解 及 DGL 源码解析

深度学习一直都是被几大经典模型给统治着,如CNN、RNN等等,它们无论再CV还是NLP领域都取得了优异的效果,那这个GCN是怎么跑出来的?是因为我们发现了很多C...

35161
大鹅

腾讯云GPU最佳实践-使用jupyter pycharm远程开发训练

作为炼丹工程师,GPU毫无疑问会给我们训练模型带来极高的效率提升,但是一般实际开发都是本地编写然后复制代码到GPU机器上面运行,这样效率就会有一定的折损,而且同...

57662
大鹅

【玩转Lighthouse】使用轻量云服务器搭建jupyter服务器

https://cloud.tencent.com/product/lighthouse?from=10680

37461
大鹅

标签平滑 Label Smoothing 详解及 pytorch tensorflow实现

标签平滑(Label smoothing),像L1、L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地...

86094
大鹅

XGBoost 实现文本分类与sklearn NLP库TfidfVectorizer

在文本分类任务中经常使用XGBoost快速建立baseline,在处理文本数据时需要引入TFIDF将文本转换成基于词频的向量才能输入到XGBoost进行分类。这...

89671
大鹅

句法依存分析背景 基本概念 及常用方法

句法结构分析又称短语结构分析(phrase structure parsing),也叫成分句法分析(constituent syntactic parsing)...

61341
大鹅

【技术种草】CKafka调优笔记 消费堆积 服务CPU未跑满应该如何解决?

Proxy服务负责消费CKafka消息并解析,并分发消息至不同的CKafka topic。近期发现Proxy服务消费CKafka有消息堆积,且服务所在CVM C...

389142
大鹅

ESIM 短文本匹配 模型解读分析

ESIM是一个综合应用了BiLSTM和注意力机制的模型,在文本匹配中效果十分强大.

1K52
大鹅

深度学习中的文本分类方法汇总相关代码及调优trick

Fasttext是Facebook推出的一个便捷的工具,包含文本分类和词向量训练两个功能。

71882
大鹅

NLP任务汇总简介与理解

序列标注(Sequence labeling)是我们在解决NLP问题时经常遇到的基本问题之一。在序列标注中,我们想对一个序列的每一个元素标注一个标签。一般来说,...

1.3K53
大鹅

GPT/GPT2/DialoGPT 详解对比与应用-文本生成与对话

GPT 的全名:Generative Pre-Training,其论文标题是 Improving Language Understanding by Gener...

3.5K132
大鹅

基于GPT2制作一个chatbot

想必大家都有经历,处于多种原因有个很好的朋友不再跟你聊天了,那么可不可以用他的微信聊天记录来大致还原一下这个人的聊天习惯语气甚至是喜欢发的表情包等等呢?

75462
大鹅

机器学习 深度学习中激活函数sigmoid relu tanh gelu等汇总整理

这篇博客主要总结一下常用的激活函数公式及优劣势,包括sigmoid relu tanh gelu

62341
大鹅

wide & deep 模型与优化器理解 代码实战

wide & deep模型是Google在2016年发布的一类用于分类和回归的模型。该模型应用到了Google Play的应用推荐中,有效的增加了Google ...

1.2K113
大鹅

深度学习常用优化器汇总整理

为机器学习项目选择好的优化器不是一项容易的任务。流行的深度学习库(如 PyTorch 或 TensorFLow)提供了多种优化器选择,它们各有优缺点。并且,选择...

82331
大鹅

NLP烤面筋

https://l1nwatch.gitbook.io/interview_exercise/stackoverflow-about-python/python...

629114
大鹅

深度学习NLP从RNN LSTM GRU seq2seq到Attention分类及解析

上一篇博客讲了Transformers里面的self-attention,在NLP领域中其实attentionseq2seq的时候就有广泛应用了。这篇文章主要总...

723123

扫码关注腾讯云开发者

领取腾讯云代金券