腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器学习AI算法工程
机器学习,深度学习,大数据 ,公众号:datayx
专栏作者
举报
1330
文章
2440923
阅读量
326
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
编程算法(317)
机器学习(301)
深度学习(240)
神经网络(231)
python(216)
其他(193)
人工智能(161)
数据挖掘(130)
数据分析(125)
https(104)
大数据(88)
网络安全(76)
r 语言(75)
爬虫(58)
NLP 服务(57)
数据库(46)
卷积神经网络(43)
决策树(42)
图像识别(41)
tensorflow(38)
github(38)
开源(38)
特征工程(37)
模型(27)
图像处理(25)
线性回归(25)
数据(24)
api(21)
http(21)
git(20)
腾讯云测试服务(20)
推荐系统(20)
数据处理(20)
sql(18)
keras(18)
pytorch(17)
存储(13)
html(12)
算法(12)
linux(11)
scikit-learn(11)
微信(11)
java(10)
云数据库 SQL Server(10)
json(9)
知识图谱(9)
网站(9)
数据可视化(9)
批量计算(8)
文字识别(8)
数据结构(8)
sas(8)
网络(8)
分布式(7)
自动化(7)
hadoop(7)
numpy(7)
监督学习(7)
tcp/ip(7)
scrapy(7)
人脸识别(6)
搜索引擎(6)
云直播(6)
游戏(6)
kernel(6)
ide(5)
中文分词(5)
模式识别(5)
安全(5)
机器人(5)
学习方法(5)
nlp(5)
函数(5)
.net(4)
bootstrap(4)
css(4)
matlab(4)
spring(4)
文件存储(4)
云数据库 MongoDB(4)
gui(4)
迁移学习(4)
小程序(4)
工程师(4)
基础(4)
论文(4)
自动驾驶(3)
c++(3)
php(3)
bash(3)
xml(3)
jquery(3)
qt(3)
硬件开发(3)
flask(3)
bash 指令(3)
容器(3)
无人驾驶(3)
正则表达式(3)
sql server(3)
opencv(3)
selenium(3)
anaconda(3)
腾讯云开发者社区(3)
分类算法(3)
mask(3)
编码(3)
微信公众号(3)
性能(3)
优化(3)
javascript(2)
node.js(2)
android(2)
oracle(2)
mapreduce(2)
访问管理(2)
mongodb(2)
电商(2)
金融(2)
shell(2)
spark(2)
html5(2)
强化学习(2)
面向对象编程(2)
unity(2)
二叉树(2)
windows(2)
nat(2)
聚类算法(2)
chatgpt(2)
data(2)
detection(2)
embedding(2)
excel(2)
博客(2)
程序员(2)
后端(2)
可视化(2)
配置(2)
事件(2)
视频(2)
费用中心(1)
语音识别(1)
官方文档(1)
ios(1)
go(1)
scala(1)
嵌入式(1)
云数据库 Redis(1)
django(1)
ruby on rails(1)
打包(1)
eclipse(1)
tomcat(1)
apache(1)
容器镜像服务(1)
日志服务(1)
短视频(1)
命令行工具(1)
声纹识别(1)
医疗(1)
渲染(1)
xslt & xpath(1)
缓存(1)
hive(1)
seo(1)
自动化测试(1)
单元测试(1)
flash(1)
架构设计(1)
网站建设(1)
canvas(1)
信息流(1)
jupyter notebook(1)
迁移(1)
联邦学习(1)
隐私计算(1)
智能推荐平台(1)
图像搜索(1)
图像分析(1)
汽车(1)
add(1)
backbone(1)
block(1)
blur(1)
config(1)
edge(1)
entity(1)
epoch(1)
eval(1)
file(1)
image(1)
instance(1)
it(1)
layer(1)
list(1)
lstm(1)
module(1)
normalization(1)
pandas(1)
partition(1)
patch(1)
prompt(1)
range(1)
scale(1)
self(1)
sharing(1)
split(1)
state(1)
svm(1)
tensor(1)
this(1)
token(1)
txt(1)
yaml(1)
yolo(1)
遍历(1)
布局(1)
测试(1)
插件(1)
产品(1)
对象(1)
工具(1)
工作(1)
华为(1)
计算机视觉(1)
架构(1)
监控(1)
教程(1)
解决方案(1)
框架(1)
连接(1)
路由(1)
面试(1)
软件(1)
设计(1)
摄像头(1)
实践(1)
数学(1)
同步(1)
微信小程序(1)
系统(1)
效率(1)
异常(1)
音频(1)
硬件(1)
原理(1)
源码(1)
指针(1)
自然语言处理(1)
PCB(1)
LLM(1)
搜索文章
搜索
搜索
关闭
TensorFlow 2 项目进阶实战,比官方文档还强
tensorflow
keras
分布式
记得 TensorFlow 2.0 刚发布时,一票开发者都在疯狂吐槽:官方文档不好找,bug 没有及时修复和更新等等。尽管上线这么久,仍有大量开发者不愿从 1.x 升级,或从别的框架迁移过来。 事实上,TensorFlow 2 不仅继承了 Keras 快速上手和易于使用的特性,还扩展了原有 Keras 所不支持的分布式训练,并整合了 TF 生态的其他组件(如 TF Serving、TF Lite、TF Hub、TFX 等),能有效提升生产环境的稳定性和可维护性。 所以,掌握 TensorFlow 2 是一
机器学习AI算法工程
2022-03-21
684
0
如何产生好的词向量?
NLP 服务
神经网络
分布式
词向量、词嵌入(word vector,word embedding)也称分布式表示(distributed representation),想必任何一个做NLP的研究者都不陌生。如今词向量已经被广泛应用于各自NLP任务中,研究者们也提出了不少产生词向量的模型并开发成实用的工具供大家使用。在使用这些工具产生词向量时,不同的训练数据,参数,模型等都会对产生的词向量有所影响,那么如何产生好的词向量对于工程来说很重要。中科院自动化所的来斯惟博士对此进行了详细的研究。本篇也是我阅读来博士发表的论文《How to
机器学习AI算法工程
2019-10-28
1.3K
0
京东商品和评论的分布式爬虫
爬虫
tcp/ip
分布式
搜索引擎
scrapy
众所周知,爬虫比较难爬取的就是动态生成的网页,因为需要解析 JS, 其中比较典型的 例子就是淘宝,天猫,京东,QQ 空间等。所以在我爬取京东网站的时候,首先需要确 定的就是爬取策略。因为我想要爬取的是商品的信息以及相应的评论,并没有爬取特定 的商品的需求。所以在分析京东的网页的 url 的时候, 决定使用类似全站爬取的策略。 分析如图:
机器学习AI算法工程
2019-10-28
1.5K
0
Scrapy分布式、去重增量爬虫的开发与设计
爬虫
tcp/ip
分布式
云数据库 Redis
scrapy
分布式采用主从结构设置一个Master服务器和多个Slave服务器,Master端管理Redis数据库和分发下载任务,Slave部署Scrapy爬虫提取网页和解析提取数据,最后将解析的数据存储在同一个MongoDb数据库中。分布式爬虫架构如图所示。
机器学习AI算法工程
2019-10-28
1.7K
0
功能比Scrapy强,却使用最方便的Gerapy分布式爬虫管理框架
scrapy
分布式
爬虫
从 Scrapy 的部署、启动到监控、日志查看,我们只需要鼠标键盘点几下就可以完成,那岂不是美滋滋?更或者说,连 Scrapy 代码都可以帮你自动生成,那岂不是爽爆了? 有需求就有动力,没错,Gerapy 就是为此而生的,GitHub:https://github.com/Gerapy/Gerapy。 安装 Gerapy 是一款分布式爬虫管理框架,支持 Python 3,基于 Scrapy、Scrapyd、Scrapyd-Client、Scrapy-Redis、Scrapyd-API、Scrapy-Spla
机器学习AI算法工程
2018-03-15
3K
0
基于Hadoop 的分布式网络爬虫技术
hadoop
分布式
爬虫
一、网络爬虫原理 Web网络爬虫系统的功能是下载网页数据,为搜索引擎系统提供数据来源。很多大型的网络搜索引擎系统都被称为基于 Web数据采集的搜索引擎系统,比如 Google、Baidu。由此可见 Web 网络爬虫系统在搜索引擎中的重要性。网页中除了包含供用户阅读的文字信息外,还包含一些超链接信息。Web网络爬虫系统正是通过网页中的超连接信息不断获得网络上的其它网页。正是因为这种采集过程像一个爬虫或者蜘蛛在网络上漫游,所以它才被称为网络爬虫系统或者网络蜘蛛系统,在英文中称为 Spider或者Crawler。
机器学习AI算法工程
2018-03-13
2.9K
0
分布式机器学习的故事
分布式
机器学习
大数据
编程算法
存储
一个新时代 起源 分布式机器学习是随着“大数据”概念兴起的。在有大数据之前,有很多研究工作为了让机器学习算法更快,而利多多个处理器。这类工作通常称为“并行计算”或者“并行机器学习”,其核心目标是把计算任务拆解成多个小的任务,分配到多个处理器上做计算。分布式计算或者分布式机器学习除了要把计算任务分布到多个处理器上,更重要的是把数据(包括训练数据以及中间结果)分布开来。因为在大数据时代,一台机器的硬盘往往装不下全部数据,或者即使装下了,也会受限于机器的I/O通道的带宽,以至于访问速度很慢。为了更大的存储容量、吞
机器学习AI算法工程
2018-03-12
1.4K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档