house.zhang

文章/答案/技术大牛

发布

LV2

发表了文章 2022-03-312022-03-31 16:36:40

PySpark任务依赖第三方python包的解决方案

在使用大数据spark做计算时，scala开发门槛比较高，一般多会去使用Spark Sql 和PySpark，而PySpark进行个性化开发时，需要引入第三方p...

house.zhang 2022-03-312022-03-31 16:39:34

大数据、大数据处理套件 TBDS

提出了问题 2022-03-302022-03-30 10:03:49

云社区soso？

2回答

发表了文章 2022-03-282022-03-28 14:29:02

基于Pytorch多机分布式训练的实现

由Uber公司的开发的Horovod架构，是一个集成了多个深度学习的统一平台，提供分布式训练效率的同事，让深度学习分布式训练变得更方便。

house.zhang 2022-03-282022-03-28 15:46:06

分布式、pytorch

发表了文章 2022-03-242022-03-24 16:35:54

大数据AI Notebook产品介绍和对比

大数据数据需要查询分析可视化工具,AI数据挖掘和探索也需要相关可视化编辑工具，开源产品主要有两个一个是Zeppelin notebook 一个是jupyter ...

house.zhang 2022-03-242022-03-24 16:35:54

jupyter notebook

发表了文章 2022-03-232022-03-23 16:06:28

大数据Ambari自定义服务详细介绍

四年多前，入职一家大厂大数据部门主要工作就是从ambari集成大数据组件服务开始做起，当时需要把机器学习平台集成到大数据平台，当时把ambari进行了大量的修改...

house.zhang 2022-03-302022-03-30 10:24:21

大数据处理套件 TBDS

发表了文章 2022-03-112022-03-11 14:27:25

关于大数据Flink内存管理的原理与实现

最近几年国内大数据apache开源社区计算框架最火的莫过于Flink，得益于阿里在后面的推动以及各大互联网大厂的参与，flink业已成为流式计算事实上的标准。一...

house.zhang 2022-03-112022-03-11 14:27:25

大数据

发表了文章 2022-03-082022-03-08 20:01:53

浅谈AI机器学习及实践总结

机器学习是一种从数据生成规则、发现模型，来帮助我们预测、判断、分组和解决问题的技术。(机器学习是一种从数据中生产函数，而不是程序员直接编写函数的技术)

house.zhang 2022-03-082022-03-08 20:01:53

机器学习、大数据

发表了文章 2022-03-022022-03-02 08:59:44

在线学习FTRL介绍及基于Flink实现在线学习流程

目前互联网已经进入了AI驱动业务发展的阶段，传统的机器学习开发流程基本是以下步骤：数据收集->特征工程->模型训练->模型评估-> 并在线上使用训练的有效模型进...

house.zhang 2022-03-022022-03-02 09:00:02

flink

发表了文章 2022-03-022022-03-02 08:51:49

Flink on K8s 企业生产化实践

为了解决公司模型&特征迭代的系统性问题，提升算法开发与迭代效率，部门立项了特征平台项目。特征平台旨在解决数据存储分散、口径重复、提取复杂、链路过长等问题，在大数...

house.zhang 2022-03-022022-03-02 08:52:52

flink、大数据解决方案

发表了文章 2021-12-272021-12-27 12:45:14

Java Hive UDTF 将WKT格式的Geomotry转换成GeoJSON

WKT(Well-known text)是一种文本标记语言，用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。它的二进制表示方式，亦即WKB(well...

house.zhang 2021-12-272021-12-27 12:45:14

tcp/ip

发表了文章 2021-12-022021-12-02 16:14:21

机器学习起步-数据收集及预处理常见的流程

数据是机器学习的燃料，数据预处理就是为机器学习模型提供好燃料，数据好，模型才能跑得更带劲。。

house.zhang 2021-12-022021-12-02 16:14:21

机器学习、数据处理、深度学习

发表了文章 2021-12-012021-12-01 12:02:15

三分钟了解下机器学习

house.zhang 2021-12-012021-12-01 12:06:59

机器学习、人工智能、深度学习

发表了文章 2021-12-012021-12-01 12:00:31

jupyter notebook安装部署及实战组合漏斗图绘制

大多数互联网企业都提供有类似Notebook类的产品，采用交互式的方式进行数据分析、数据建模及数据可视化。主要实现大多都是基于jupyter 、Zeppelin...

house.zhang 2021-12-012021-12-01 12:00:31

jupyter notebook

发表了文章 2021-11-252021-11-25 09:47:59

三分钟了解下机器学习

house.zhang 2021-11-252021-11-25 09:50:07

机器学习、腾讯云 TI 平台

发表了文章 2021-10-282021-10-28 22:04:36

构建可靠、可扩展与可维护的应用系统

当前的应用系统，通常数据量比较大、数据复杂度比较高以及数据快速多变，可以把这样的系统称之为数据密集型系统，数据密集型系统通常基于不同的模块组件进行构建，根据不同...

house.zhang 2021-10-282021-10-28 22:04:36

分布式

发表了文章 2021-10-122021-10-12 14:31:11

线上ES集群提高读写能力的大致方案

业务在使用ES集群读取ES数据，如果同时向ES集群写任务时，会遇到RT涨的情况，会出现一些抖动，尤其是在计算框架大量增加并发度像ES集群写的情况下会出现抖动，目...

house.zhang 2021-10-122021-10-12 14:31:10

Elasticsearch Service

发表了文章 2021-09-152021-09-15 21:38:18

多次装K8S集群后整理的一键安装脚本及配置说明

去年从腾讯出来，换了家企业，涉及到一些安装运维工作，其中大数据AI产品需要落地，在大厂腾都有现成的可以用，来到这都没有K8S集群，后面需要借助k8s落地，就需要...

house.zhang 2022-03-282022-03-28 14:18:07

容器服务、运维、云计算、容器

预约了直播 2021-09-052021-09-05 17:01:17

技术创作101训练营--「技术创作101训练营」—技术视频

2021-09-18回顾中

报名了沙龙 2021-09-052021-09-05 17:01:17

技术创作101训练营--「技术创作101训练营」—技术视频

2021-09-18回顾中

订阅了专栏 2021-09-052021-09-05 17:01:17

腾讯云技术沙龙

143 文章6.9K 订阅数

12 下一页

个人简介

货拉拉 | 资深大数据开发工程师
多年大数据AI产品开发经验
大数据 kubernetes
成都理工大学 | 计算机应用
暂未填写个人网址
广东省 | 深圳市
加入社区时间：2018-04-02

个人成就

获得 71 次赞同
文章被阅读 40.3K 次
文章获得 8 次首页推荐

关注了：3关注者：269

house.zhang

PySpark任务依赖第三方python包的解决方案

云社区soso？

基于Pytorch多机分布式训练的实现

大数据AI Notebook产品介绍和对比

大数据Ambari自定义服务详细介绍

关于大数据Flink内存管理的原理与实现

浅谈AI机器学习及实践总结

在线学习FTRL介绍及基于Flink实现在线学习流程

Flink on K8s 企业生产化实践

Java Hive UDTF 将WKT格式的Geomotry转换成GeoJSON

机器学习起步-数据收集及预处理常见的流程

三分钟了解下机器学习

jupyter notebook安装部署及实战组合漏斗图绘制

三分钟了解下机器学习

构建可靠、可扩展与可维护的应用系统

线上ES集群提高读写能力的大致方案

多次装K8S集群后整理的一键安装脚本及配置说明

技术创作101训练营--「技术创作101训练营」—技术视频

技术创作101训练营--「技术创作101训练营」—技术视频

腾讯云技术沙龙

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐