腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器学习AI算法工程
机器学习,深度学习,大数据 ,公众号:datayx
专栏成员
举报
1348
文章
2599343
阅读量
335
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
编程算法(317)
机器学习(302)
深度学习(240)
神经网络(231)
python(216)
其他(193)
人工智能(161)
数据挖掘(130)
数据分析(125)
https(105)
大数据(88)
网络安全(76)
r 语言(75)
爬虫(58)
NLP 服务(57)
数据库(46)
卷积神经网络(43)
开源(42)
决策树(42)
图像识别(41)
模型(41)
tensorflow(38)
github(38)
特征工程(38)
数据(36)
图像处理(26)
线性回归(25)
api(21)
http(21)
数据处理(21)
git(20)
腾讯云测试服务(20)
推荐系统(20)
pytorch(20)
sql(18)
keras(18)
存储(13)
算法(13)
html(12)
linux(11)
scikit-learn(11)
微信(11)
java(10)
云数据库 SQL Server(10)
网站(10)
nlp(10)
json(9)
知识图谱(9)
数据可视化(9)
批量计算(8)
文字识别(8)
数据结构(8)
sas(8)
论文(8)
网络(8)
分布式(7)
自动化(7)
hadoop(7)
numpy(7)
监督学习(7)
tcp/ip(7)
scrapy(7)
性能(7)
人脸识别(6)
搜索引擎(6)
云直播(6)
游戏(6)
kernel(6)
函数(6)
ide(5)
中文分词(5)
模式识别(5)
安全(5)
机器人(5)
学习方法(5)
测试(5)
优化(5)
.net(4)
bootstrap(4)
css(4)
matlab(4)
spring(4)
文件存储(4)
云数据库 MongoDB(4)
gui(4)
迁移学习(4)
小程序(4)
编码(4)
工程师(4)
基础(4)
配置(4)
自动驾驶(3)
c++(3)
php(3)
bash(3)
xml(3)
jquery(3)
qt(3)
硬件开发(3)
flask(3)
打包(3)
bash 指令(3)
容器(3)
无人驾驶(3)
正则表达式(3)
sql server(3)
opencv(3)
selenium(3)
anaconda(3)
腾讯云开发者社区(3)
分类算法(3)
mask(3)
架构(3)
设计(3)
微信公众号(3)
javascript(2)
node.js(2)
android(2)
oracle(2)
mapreduce(2)
访问管理(2)
mongodb(2)
电商(2)
金融(2)
医疗(2)
shell(2)
spark(2)
html5(2)
强化学习(2)
面向对象编程(2)
unity(2)
二叉树(2)
windows(2)
nat(2)
聚类算法(2)
chatgpt(2)
data(2)
detection(2)
embedding(2)
excel(2)
yolo(2)
博客(2)
程序员(2)
工具(2)
后端(2)
可视化(2)
框架(2)
内存(2)
事件(2)
视频(2)
效率(2)
异常(2)
硬件(2)
自然语言处理(2)
费用中心(1)
语音识别(1)
官方文档(1)
ios(1)
go(1)
scala(1)
嵌入式(1)
云数据库 Redis(1)
django(1)
ruby on rails(1)
eclipse(1)
tomcat(1)
apache(1)
容器镜像服务(1)
日志服务(1)
短视频(1)
命令行工具(1)
声纹识别(1)
渲染(1)
xslt & xpath(1)
缓存(1)
hive(1)
seo(1)
自动化测试(1)
单元测试(1)
flash(1)
架构设计(1)
网站建设(1)
canvas(1)
信息流(1)
jupyter notebook(1)
迁移(1)
联邦学习(1)
隐私计算(1)
智能推荐平台(1)
图像搜索(1)
图像分析(1)
汽车(1)
add(1)
backbone(1)
block(1)
blur(1)
config(1)
edge(1)
entity(1)
epoch(1)
eval(1)
file(1)
gpt(1)
image(1)
instance(1)
it(1)
layer(1)
list(1)
lstm(1)
module(1)
normalization(1)
pandas(1)
partition(1)
patch(1)
precision(1)
prompt(1)
range(1)
scale(1)
self(1)
sharing(1)
split(1)
state(1)
svm(1)
tensor(1)
this(1)
token(1)
txt(1)
yaml(1)
遍历(1)
变量(1)
表格(1)
布局(1)
部署(1)
插件(1)
产品(1)
对象(1)
服务(1)
服务器(1)
工作(1)
华为(1)
计算机视觉(1)
监控(1)
教程(1)
解决方案(1)
镜像(1)
开发(1)
连接(1)
路由(1)
面试(1)
软件(1)
摄像头(1)
实践(1)
数学(1)
同步(1)
统计(1)
微信小程序(1)
系统(1)
音频(1)
原理(1)
源码(1)
指针(1)
终端(1)
PCB(1)
LLM(1)
搜索文章
搜索
搜索
关闭
python与Spark结合,PySpark的机器学习环境搭建和模型开发
hadoop
mapreduce
https
网络安全
Spark提供了一个更快、更通用的数据处理平台。和Hadoop相比,Spark可以让你的程序在内存中运行时速度提升100倍,或者在磁盘上运行时速度提升10倍。去年,在100 TB Daytona GraySort比赛中,Spark战胜了Hadoop,它只使用了十分之一的机器,但运行速度提升了3倍。Spark也已经成为针对 PB 级别数据排序的最快的开源引擎。
机器学习AI算法工程
2019-10-28
1.4K
0
大数据工程师薪资在什么水平?
大数据
数据库
hadoop
新一轮毕业季即将到来,就业问题又将成为讨论的热点,今年会是大学生们就业的春天吗?据权威数据显示,2015年全国普通高校毕业生人数达到749万,2016年全国普通高校毕业生人数达到765万,2017年的毕业生总人数再创新高,达到700万。大学生们面临的就业形势依然严峻,就业的春天不会来临。 那么毕业生们应该怎么做呢?我们先来分析下就业形势。 在全国仅34%企业招聘活动保持稳定的现状下,每年毕业的大学生人数正在不断的上涨,一个岗位可能存在上百的竞争者。 在这样残酷的就业环境下,求职者更应该找好自己的方向。土木
机器学习AI算法工程
2018-03-15
3K
0
Python+Hadoop 从DBLP数据库中挖掘经常一起写作的合作者
python
hadoop
数据挖掘
任务描述: 本文的写作目的是从DBLP数据库中找到经常一起写作的合作者。熟悉数据挖掘中频繁项挖掘的经典算法(FP-Growth)并作出改进和优化。实验代码用Python写的,分别在本地(Win8)和Hadoop集群(条件有限,虚拟机上跑的,3个节点)上实现。(下载本文所涉及全部代码https://github.com/findmyway/DBLP-Coauthor) 任务分解: 从DBLP数据集中提取作者信息 建立索引作者ID并对文件编码 分析数据的规模 构建FP-Tree并从FP-Tree得到频繁
机器学习AI算法工程
2018-03-13
1.7K
0
运用Spark进行交通数据案例分析:大型活动大规模人群的检测与疏散
spark
数据分析
大数据
hadoop
作者: 科赛网 汪梦梦 邓以勒 今天主要是以一个数据分析者的角度来与大家分享如何使用spark进行大数据分析。 我将分以下4部分为大家进行介绍。首先介绍spark的相关背景,包括基本概念以及spa
机器学习AI算法工程
2018-03-13
2.2K
0
手把手教你成功搭建Hadoop-2.2集群
hadoop
作者:白宁超 成都信息工程大学硕士 原文:http://www.cnblogs.com/baiboy/p/4639474.html hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得。以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问题。但是网上一些文档大多互相抄袭,里面错误百出。笔者结合自学书籍视频等资料,完成这一套配置资料。实验结果和过程经过反复测试无误后方整理出来的。配置过程中,初学者若有实验环境,可以在真机环境下完成,若无条件,可补习下
机器学习AI算法工程
2018-03-13
1.3K
0
海量Web日志分析 用Hadoop提取KPI统计指标
hadoop
Web日志包含着网站最重要的信息,通过日志分析,我们可以知道网站的访问量,哪个网页访问人数最多,哪个网页最有价值等。一般中型的网站(10W的PV以上),每天会产生1G以上Web日志文件。大型或超大型的网站,可能每小时就会产生10G的数据量。 对于日志的这种规模的数据,用Hadoop进行日志分析,是最适合不过的了。 目录 Web日志分析概述 需求分析:KPI指标设计 算法模型:Hadoop并行算法 架构设计:日志KPI系统架构 程序开发1:用Maven构建Hadoop项目 1. Web日志分析概述 Web日志
机器学习AI算法工程
2018-03-13
2K
0
基于Hadoop 的分布式网络爬虫技术
hadoop
分布式
爬虫
一、网络爬虫原理 Web网络爬虫系统的功能是下载网页数据,为搜索引擎系统提供数据来源。很多大型的网络搜索引擎系统都被称为基于 Web数据采集的搜索引擎系统,比如 Google、Baidu。由此可见 Web 网络爬虫系统在搜索引擎中的重要性。网页中除了包含供用户阅读的文字信息外,还包含一些超链接信息。Web网络爬虫系统正是通过网页中的超连接信息不断获得网络上的其它网页。正是因为这种采集过程像一个爬虫或者蜘蛛在网络上漫游,所以它才被称为网络爬虫系统或者网络蜘蛛系统,在英文中称为 Spider或者Crawler。
机器学习AI算法工程
2018-03-13
3K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档