腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大鹅专栏:大数据到机器学习
从大数据计算到机器学习,你需要了解这些。专注于Hadoop生态 Spark 机器学习 深度学习
专栏成员
举报
127
文章
296166
阅读量
47
订阅数
订阅专栏
申请加入专栏
全部文章(127)
机器学习(35)
深度学习(30)
NLP 服务(26)
编程算法(25)
java(22)
python(19)
https(14)
腾讯云 TI 平台(13)
spark(12)
hadoop(12)
http(11)
hbase(11)
云服务器(9)
机器学习平台(9)
人工智能(8)
网络安全(8)
tensorflow(7)
推荐系统(7)
node.js(6)
数据库(6)
大数据解决方案(6)
大数据(6)
kafka(6)
缓存(5)
html(4)
spring(4)
神经网络(4)
TDSQL MySQL 版(4)
大数据处理套件 TBDS(4)
存储(4)
线性回归(4)
模式识别(4)
数据挖掘(3)
vue.js(3)
云数据库 SQL Server(3)
sql(3)
ide(3)
linux(3)
批量计算(3)
文件存储(3)
消息队列 CKafka 版(3)
弹性 MapReduce(3)
网站(3)
jdk(3)
jvm(3)
数据分析(3)
智能推荐平台(3)
javascript(2)
bash(2)
xml(2)
matlab(2)
bash 指令(2)
知识图谱(2)
容器(2)
serverless(2)
游戏(2)
分布式(2)
强化学习(2)
hive(2)
spring boot(2)
决策树(2)
pytorch(2)
rpc(2)
云数据仓库套件 sparkling(2)
jupyter notebook(2)
对象存储(1)
其他(1)
官方文档(1)
腾讯云gme(1)
c++(1)
scala(1)
bootstrap(1)
css(1)
jquery(1)
云数据库 Redis(1)
flask(1)
打包(1)
api(1)
搜索引擎(1)
中文分词(1)
unix(1)
ubuntu(1)
apache(1)
容器镜像服务(1)
GPU 云服务器(1)
容器服务(1)
NAT 网关(1)
消息队列 CMQ 版(1)
腾讯云ide(1)
文字识别(1)
机器翻译(1)
mongodb(1)
图像处理(1)
yarn(1)
云数据仓库 PostgreSQL(1)
kubernetes(1)
图像识别(1)
卷积神经网络(1)
numpy(1)
面向对象编程(1)
zookeeper(1)
keras(1)
二叉树(1)
aop(1)
socket编程(1)
安全(1)
数据处理(1)
windows(1)
安全漏洞(1)
数据结构(1)
nat(1)
对话机器人(1)
轻量应用服务器(1)
es(1)
Elasticsearch Service(1)
流计算 Oceanus(1)
add(1)
alpha(1)
ci(1)
ddl(1)
lines(1)
list(1)
max(1)
min(1)
sum(1)
递归(1)
链表(1)
搜索文章
搜索
搜索
关闭
【玩转 Cloud Studio】使用Cloud Studio 进行python开发最佳实践
vue.js
python
腾讯云ide
flask
数据挖掘
作为一个Python开发,经常需要把各种pip lib安装到自己的电脑上,导致自己的电脑存储占用越来越多而且越来越卡。如果我们有一个物美价廉的远程开发平台,每个月还有1000分钟(2C4G)免费额度的远程开发平台,可以把lib都安装上去在上面进行开发工作,那不是美滋滋?Cloud Studio就应运而生啦。每个月1000分钟,换算成小时就是41个小时,非常够用了。
大鹅
2022-08-22
2K
8
【玩转Lighthouse】使用轻量云服务器搭建jupyter服务器
网站
python
jupyter notebook
轻量应用服务器
背景 Jupyter Notebook简介 Jupyter Notebook是一款开源的Web应用,类似于Web笔记本,我们可以使用它编写代码、公式、Markdown解释性文本和绘图,并且可以把创建好的文档进行分享。 Jupyter Notebook最为方便的功能在于其可以实时运行代码,并且返回代码段的运行结果,支持可视化、IDE等能力,大大提高了模型搭建和分析的效率。 目前已经广泛应用于数据处理、数据模拟、统计建模、机器学习等重要领域。 image.png 结合轻量云服务器的优点,我们可以实现快速开发
大鹅
2022-04-20
2.5K
1
XGBoost 实现文本分类与sklearn NLP库TfidfVectorizer
机器学习
深度学习
python
java
NLP 服务
在文本分类任务中经常使用XGBoost快速建立baseline,在处理文本数据时需要引入TFIDF将文本转换成基于词频的向量才能输入到XGBoost进行分类。这篇博客将简单阐述XGB进行文本分类的实现与部分原理。
大鹅
2021-12-23
2.6K
1
NLP任务汇总简介与理解
机器学习
深度学习
文字识别
python
NLP 服务
序列标注(Sequence labeling)是我们在解决NLP问题时经常遇到的基本问题之一。在序列标注中,我们想对一个序列的每一个元素标注一个标签。一般来说,一个序列指的是一个句子,而一个元素指的是句子中的一个词。比如信息提取问题可以认为是一个序列标注问题,如提取出会议时间、地点等。
大鹅
2021-10-06
3.9K
0
使用transformer BERT预训练模型进行文本分类 及Fine-tuning
深度学习
python
tensorflow
pytorch
NLP 服务
Bert 全称为 Bidirectional Encoder Representations from Transformers(Bert)。和 ELMo 不同,BERT 通过在所有层联合调节左右两个上下文来预训练深层双向表示,此外还通过组装长句作为输入增强了对长程语义的理解。Bert 可以被微调以广泛用于各类任务,仅需额外添加一个输出层,无需进行针对任务的模型结构调整,就在文本分类,语义理解等一些任务上取得了 state-of-the-art 的成绩。
大鹅
2021-07-30
4K
0
使用transformer BERT预训练模型进行文本分类 及Fine-tuning
深度学习
python
tensorflow
pytorch
NLP 服务
Bert 全称为 Bidirectional Encoder Representations from Transformers(Bert)。和 ELMo 不同,BERT 通过在所有层联合调节左右两个上下文来预训练深层双向表示,此外还通过组装长句作为输入增强了对长程语义的理解。Bert 可以被微调以广泛用于各类任务,仅需额外添加一个输出层,无需进行针对任务的模型结构调整,就在文本分类,语义理解等一些任务上取得了 state-of-the-art 的成绩。
大鹅
2021-07-30
9.5K
0
Snorkel 学习笔记 简介与入门 LF TF SF Labeling Functions Transformation Function Slicing Function 示例
https
网络安全
腾讯云gme
css
python
弱监督(Weak Supervision)可以让我们低成本的利用领域专家的知识来程序化的标注上百万级别的 数据样本,从而帮助我们解决人工智能时代的数据瓶颈问题。更确切地说,这是一个帮助将领域专家的知识编码到AI系统中的框架,专家知识注入的方式可以采用手写的推理规则或者远程监督。
大鹅
2021-06-16
1.1K
0
Spark RDD / Dataset 相关操作及对比汇总笔记
javascript
https
网络安全
spark
python
本篇博客将会汇总记录大部分的Spark RDD / Dataset的常用操作以及一些容易混淆的操作对比。
大鹅
2021-06-16
1K
0
扇形染色问题 Python解法
python
将一个圆形等分成N个小扇形,将这些扇形标记为1,2,3,…,N。现在使用M种颜色对每个扇形进行涂色,每个扇形涂一种颜色,且相邻的扇形颜色不同。
大鹅
2021-06-16
1.2K
0
Tensorflow(GPU) 在Win10+Cuda8.0环境下安装以及Cudnn包配置 图文详细教程
tensorflow
python
numpy
深度学习
原本安装好之后并不会有以上四个环境变量,有两个需要自己加上。 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\libnvvp 附配置环境变量教程 最后在cmd里输入 echo %path% 就能查看你的是否添加进环境变量了
大鹅
2021-06-15
1.3K
0
HIN 异构信息网络(Heterogeneous Information Network)
http
html
python
信息网络可以用一个有向图G = (V, E) 来表示,其中V代表 Object,E代表 Edge。并且用映射函数 ϕ : V → A 来表示每一个object v ∈ V 属于object类型集合A: ϕ(v) ∈ A,用映射函数ψ : E → R.表示每条边 e ∈ E 属于边的类型集合R: ψ(e) ∈ R。如下图1所示:
大鹅
2021-06-15
1.3K
0
多任务学习模型MMoE详解 Multi-gate Mixture-of-Experts 与代码实现
智能推荐平台
机器学习
腾讯云 TI 平台
python
云服务器
在线上推荐预测任务时往往需要预测用户的多个行为,如关注、点赞、停留时间等,从而调整策略进行权衡。其中涉及到多任务学习,本篇将会大概整理一些常用的模型如MMoE, ESMM, SNR方便理解与学习。
大鹅
2021-06-09
10.1K
0
Linux 常用命令 vim常用命令 速查
云服务器
linux
bash
bash 指令
python
在进行系统维护时,经常会出现内存使用量惊人,而又不知道是哪一个进程占用了大量进程的情况。除了可以使用top命令查看内存使用情况之外,还可以使用下面的命令:
大鹅
2021-06-03
3.6K
0
jupyter notebook 服务安装与启动
腾讯云 TI 平台
python
机器学习
深度学习
人工智能
执行后会生成配置文件, ~/.jupyter/jupyter_notebook_config.py
大鹅
2021-06-02
2.1K
0
NLP实战 使用gensim与自己语料训练word2vec fasttext模型词向量及使用
机器学习
深度学习
模式识别
python
NLP 服务
本博客主要记录使用自己的语料库与Python gensim库训练word2vec fastext等模型获得相关词向量,以及训练好的词向量模型基本用法。
大鹅
2021-03-08
4.2K
0
NLP之从word2vec到ELMO GPT再到BERT与attention transformer过程笔记与详解
机器学习
深度学习
python
模式识别
NLP 服务
在NLP自然语言处理学习或者发展过程中,在13年word2vec word embedding后,人们发现一个单词通过Word Embedding表示,很容易找到语义相近的单词,但单一词向量表示,不可避免一词多义问题。于是迎来Google的ELMO transformer BERT等动态表征模型,BERT模型更是刷新了GLUE benchmark的11项测试任务最高记录。
大鹅
2021-02-21
3.1K
0
DNN深度学习模型 机器学习模型 特征筛选 各个特征重要度排序
机器学习
深度学习
python
模式识别
NLP 服务
在机器学习或者深度学习模型训练完成后,通常我们需要对输入特征进行重要度排序及筛选,好去找到一些重要度没这么高的特征,将其排除以提高模型收敛速度及准确率。
大鹅
2021-01-30
7.8K
0
【云+社区年度征文】tensorflow2 tfrecorddataset+estimator 训练预测加载全流程概述
tensorflow
机器学习
推荐系统
深度学习
python
本文主要记录切换项目至TF2.0+后使用TFRecordDataset保存训练数据与使用estimator建模及后续的模型或者checkpoint加载使用预测的一些基本方法及踩过的坑。
大鹅
2020-12-20
1.4K
0
【云+社区年度征文】tensorflow 2.0 Estimator Keras读取saved model并预测
python
机器学习
神经网络
tensorflow
keras
使用tensorflow2.0以上版本框架用Keras或者Estimator方式保存模型有两种方式加载模型并预测。
大鹅
2020-12-07
798
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档