腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大鹅专栏:大数据到机器学习
从大数据计算到机器学习,你需要了解这些。专注于Hadoop生态 Spark 机器学习 深度学习
专栏成员
举报
127
文章
296225
阅读量
47
订阅数
订阅专栏
申请加入专栏
全部文章(127)
机器学习(35)
深度学习(30)
NLP 服务(26)
编程算法(25)
java(22)
python(19)
https(14)
腾讯云 TI 平台(13)
spark(12)
hadoop(12)
http(11)
hbase(11)
云服务器(9)
机器学习平台(9)
人工智能(8)
网络安全(8)
tensorflow(7)
推荐系统(7)
node.js(6)
数据库(6)
大数据解决方案(6)
大数据(6)
kafka(6)
缓存(5)
html(4)
spring(4)
神经网络(4)
TDSQL MySQL 版(4)
大数据处理套件 TBDS(4)
存储(4)
线性回归(4)
模式识别(4)
数据挖掘(3)
vue.js(3)
云数据库 SQL Server(3)
sql(3)
ide(3)
linux(3)
批量计算(3)
文件存储(3)
消息队列 CKafka 版(3)
弹性 MapReduce(3)
网站(3)
jdk(3)
jvm(3)
数据分析(3)
智能推荐平台(3)
javascript(2)
bash(2)
xml(2)
matlab(2)
bash 指令(2)
知识图谱(2)
容器(2)
serverless(2)
游戏(2)
分布式(2)
强化学习(2)
hive(2)
spring boot(2)
决策树(2)
pytorch(2)
rpc(2)
云数据仓库套件 sparkling(2)
jupyter notebook(2)
对象存储(1)
其他(1)
官方文档(1)
腾讯云gme(1)
c++(1)
scala(1)
bootstrap(1)
css(1)
jquery(1)
云数据库 Redis(1)
flask(1)
打包(1)
api(1)
搜索引擎(1)
中文分词(1)
unix(1)
ubuntu(1)
apache(1)
容器镜像服务(1)
GPU 云服务器(1)
容器服务(1)
NAT 网关(1)
消息队列 CMQ 版(1)
腾讯云ide(1)
文字识别(1)
机器翻译(1)
mongodb(1)
图像处理(1)
yarn(1)
云数据仓库 PostgreSQL(1)
kubernetes(1)
图像识别(1)
卷积神经网络(1)
numpy(1)
面向对象编程(1)
zookeeper(1)
keras(1)
二叉树(1)
aop(1)
socket编程(1)
安全(1)
数据处理(1)
windows(1)
安全漏洞(1)
数据结构(1)
nat(1)
对话机器人(1)
轻量应用服务器(1)
es(1)
Elasticsearch Service(1)
流计算 Oceanus(1)
add(1)
alpha(1)
ci(1)
ddl(1)
lines(1)
list(1)
max(1)
min(1)
sum(1)
递归(1)
链表(1)
搜索文章
搜索
搜索
关闭
XGBoost 实现文本分类与sklearn NLP库TfidfVectorizer
机器学习
深度学习
python
java
NLP 服务
在文本分类任务中经常使用XGBoost快速建立baseline,在处理文本数据时需要引入TFIDF将文本转换成基于词频的向量才能输入到XGBoost进行分类。这篇博客将简单阐述XGB进行文本分类的实现与部分原理。
大鹅
2021-12-23
2.6K
1
高吞吐实时事务数仓方案调研 flink kudu+impala hbase等
弹性 MapReduce
hbase
流计算 Oceanus
java
云服务器
腾讯云数据仓库PostgreSql TDSQL,PingCAP的TiDB,阿里的OceanBase,华为云DWS,都是HTAP的业内常用数仓,可以一站式解决需求。
大鹅
2021-08-03
4.2K
4
Java volatile 关键字解释 用法原理 并发编程特性
编程算法
缓存
java
有时仅仅为了读写一个或者两个实例域就使用同步的话,显得开销过大,volatile关键字为实例域的同步访问提供了免锁的机制。如果声明一个域为volatile,那么编译器和虚拟机就知道该域是可能被另一个线程并发更新的。再讲到volatile关键字之前我们需要了解一下内存模型的相关概念以及并发编程中的三个特性:原子性,可见性和有序性。
大鹅
2021-06-16
413
0
Java 虚拟机中内存区域介绍 JDK8区别 对象创建 学习笔记
jdk
jvm
编程算法
java
在之前的JVM介绍中简略讲述了JVM介绍与内存层次结构,这篇博客主要记录内存区域、对象创建流程及JDK8中的更新。
大鹅
2021-06-16
414
0
Java JVM 内存泄露 基本概念 解析及排查处理办法
java
编程算法
jvm
JAVA是垃圾回收语言的一种,开发者无需特意管理内存分配。但是JAVA中还是存在着许多内存泄露的可能性,如果不好好处理内存泄露,会导致APP内存单元无法释放被浪费掉,最终导致内存全部占据堆栈(heap)挤爆进而程序崩溃。
大鹅
2021-06-16
1.2K
0
JVM 概述,层次结构 以及 GC工作原理 笔记
jvm
java
存储
Java 虚拟机 Java 虚拟机(Java virtual machine,JVM)是运行 Java 程序必不可少的机制。JVM实现了Java语言最重要的特征:即平台无关性。原理:编译后的 Java 程序指令并不直接在硬件系统的 CPU 上执行,而是由 JVM 执行。JVM屏蔽了与具体平台相关的信息,使Java语言编译程序只需要生成在JVM上运行的目标字节码(.class),就可以在多种平台上不加修改地运行。Java 虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。因此实现java平台无关性。它是 Java 程序能在多平台间进行无缝移植的可靠保证,同时也是 Java 程序的安全检验引擎(还进行安全检查)。
大鹅
2021-06-16
595
0
Java final, static, this, super 关键字总结
c++
编程算法
java
this.employees.length:访问类Manager的当前实例的变量。
大鹅
2021-06-16
496
0
Java 多线程与线程池 Thread弊端与Executor存在问题 及解决方法
编程算法
java
nat
NAT 网关
https
那么有没有一种办法使得线程可以复用,就是执行完一个任务,并不被销毁,而是可以继续执行其他的任务?
大鹅
2021-06-16
1.8K
0
Java Serializable 序列化学习笔记 及transient关键字 及 serialVersionUID 作用
文件存储
java
html
https
网络安全
Java 提供了一种对象序列化的机制,该机制中,一个对象可以被表示为一个字节序列,该字节序列包括该对象的数据、有关对象的类型的信息和存储在对象中数据的类型。
大鹅
2021-06-16
456
0
Spark中RDD 持久化操作 cache与persist区别
文件存储
scala
缓存
java
spark
在进行RDD操作的时候,我们需要在接下来多个行动中重用同一个RDD,这个时候我们就可以将RDD缓存起来,可以很大程度的节省计算和程序运行时间。
大鹅
2021-06-15
840
0
Java 中 ArrayList,LinkedList和Vector主要区别与概述
编程算法
网站
http
java
ArrayList和LinkedList在性能上各有优缺点,都有各自所适用的地方,总的说来可以描述如下:
大鹅
2021-06-15
2.1K
0
JVM GC 垃圾回收 详细介绍 学习笔记速查
云服务器
java
http
api
云数据库 SQL Server
当需要排查各种内存溢出问题、当垃圾收集成为系统达到更高并发的瓶颈时,我们就需要对这些“自动化”的技术实施必要的监控和调节。
大鹅
2021-06-03
953
0
Java 线程调优 JDK常用命令行工具 Jstack & Arthas使用笔记 查找耗时线程
java
云服务器
数据库
ide
云数据库 SQL Server
jps(JVM Process Status) 命令类似 UNIX 的 ps 命令。
大鹅
2021-06-02
2.9K
0
Java连接HBase的正确方法及Connection创建步骤与详解
java
hbase
hadoop
HBASE的连接不像其他传统关系型数据库连接需要维护连接池。HBASE连接若使用错误则会导致随时间推移程序创建的TCP连接过多,导致HBASE连接失败。
大鹅
2020-10-29
7.8K
0
Hbase 基础 Rowkey CF 架构 概述 预分区及Rowkey设计 学习笔记
java
hbase
hadoop
HBase类似于数据库的存储层,HBase适用于结构化存储,并且为列式分布式数据库。
大鹅
2020-10-29
1.2K
0
Hadoop HBASE集群运维相关笔记 及hdfs参数设置调优等
java
hadoop
hbase
本篇博客将持续更新一些遇到过的Hadoop大数据集群的问题,包括HBASE HDFS的常见问题及相关的解决方案
大鹅
2020-10-29
977
0
Spark RDD / Dataset 相关操作及对比汇总笔记
大数据解决方案
java
spark
云数据仓库套件 sparkling
本篇博客将会汇总记录大部分的Spark RDD / Dataset的常用操作以及一些容易混淆的操作对比。
大鹅
2020-10-29
1.7K
0
Spark Streaming(DStreaming) VS Spark Structured Streaming 区别比较 优劣势
java
spark
大数据解决方案
## Spark Streaming(DStreaming) VS Spark Structured Streaming 区别比较 优劣势
大鹅
2020-10-29
2.1K
0
Spark Structured Streaming 使用总结
大数据解决方案
java
spark
hadoop
在大数据时代中我们迫切需要实时应用解决源源不断涌入的数据,然而建立这么一个应用需要解决多个问题:
大鹅
2020-10-29
9K
0
Spark Structured Streaming + Kafka使用笔记
java
大数据解决方案
这篇博客将会记录Structured Streaming + Kafka的一些基本使用(Java 版)
大鹅
2020-10-29
3.4K
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档