腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
hadoop学习笔记
专栏成员
举报
176
文章
190488
阅读量
28
订阅数
订阅专栏
申请加入专栏
全部文章(176)
编程算法(38)
java(34)
大数据(29)
其他(24)
NLP 服务(22)
hadoop(22)
中文分词(19)
开源(17)
python(14)
jar(12)
git(10)
分布式(9)
github(8)
http(7)
机器学习(6)
sql(6)
linux(6)
缓存(6)
txt(6)
神经网络(5)
c++(4)
html(4)
api(4)
apache(4)
spring(4)
spark(4)
jvm(4)
面向对象编程(4)
Elasticsearch Service(4)
node.js(3)
xml(3)
maven(3)
analyzer(3)
深度学习(3)
人工智能(3)
大数据解决方案(3)
存储(3)
数据处理(3)
dictionary(3)
数据库(2)
云数据库 SQL Server(2)
nosql(2)
ide(2)
eclipse(2)
tomcat(2)
搜索引擎(2)
mapreduce(2)
网站(2)
政务云专区(2)
运维(2)
压力测试(2)
数据可视化(2)
数据结构(2)
https(2)
hbase(2)
code(2)
data(2)
jieba(2)
text(2)
登录(2)
对象存储(1)
负载均衡(1)
腾讯云gme(1)
区块链(1)
自动驾驶(1)
数据挖掘(1)
bash(1)
css(1)
android(1)
云数据库 Redis(1)
打包(1)
全文检索(1)
lucene/solr(1)
nginx(1)
bash 指令(1)
容器镜像服务(1)
文件存储(1)
TDSQL MySQL 版(1)
腾讯云测试服务(1)
电商(1)
数据安全(1)
容器(1)
互联网金融(1)
爬虫(1)
无人驾驶(1)
hive(1)
spring boot(1)
hashmap(1)
监督学习(1)
cdn(1)
kernel(1)
gradle(1)
spring cloud(1)
anaconda(1)
数据分析(1)
windows(1)
系统架构(1)
微服务(1)
nat(1)
腾讯云开发者社区(1)
云计算(1)
虚拟化(1)
es(1)
智能推荐平台(1)
load(1)
naivebayes(1)
properties(1)
python3(1)
root(1)
工具(1)
搜索文章
搜索
搜索
关闭
hadoop和spark的区别
spark
hadoop
mapreduce
分布式
大数据
学习hadoop已经有很长一段时间了,好像是二三月份的时候朋友给了一个国产Hadoop发行版下载地址,因为还是在学习阶段就下载了一个三节点的学习版玩一下。在研究、学习hadoop的朋友可以去找一下看看(发行版DKhadoop,去大快的网站上应该可以下载到的。)
IT小白龙
2018-11-30
834
0
MapReduce实现与自定义词典文件基于hanLP的中文分词详解
jar
mapreduce
maven
java
文本分类任务的第1步,就是对语料进行分词。在单机模式下,可以选择python jieba分词,使用起来较方便。但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则hanLP更加胜任。
IT小白龙
2018-10-15
762
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档