木野归郎

文章/答案/技术大牛

发布

LV0

发表了文章 2023-02-252023-02-25 18:50:18

精简版 — Hive开发常用操作

直接使用cross join关联只会分配一个reduce，导致耗时严重，因此我们可以将小表扩充一列，并且复制n倍，然后进行left join操作。这样扩充几倍，...

木野归郎 2023-02-252023-02-25 18:50:18

hive、mapreduce

发表了文章 2023-02-252023-02-25 18:49:53

灵魂拷问JVM，你被干趴了吗

jvm将.class类文件信息加载到内存并解析成对应的class对象的过程，注意：jvm并不是一开始就把所有的类加载进内存中，只是在第一次遇到某个需要运行的类才...

木野归郎 2023-02-252023-02-25 18:49:53

jvm、编程算法、java、jar

发表了文章 2023-02-252023-02-25 18:49:36

什么是数据湖？

数据存储是人类千百年来都在应用并且探索的主题。在原始社会，人类用树枝和石头来记录数据。后来，人类制造了铁器，用铁器在石头上刻画一些象形文字来记录数据，而此时，语...

木野归郎 2023-02-252023-02-25 18:49:36

数据湖、大数据、数据处理、编程算法、存储

发表了文章 2023-02-252023-02-25 18:49:11

《hive编程指南》读书笔记：模式设计

按天划分表就是一种模式，每天一张表的方式在数据库领域是反模式的一种方式，按天划分的表建议使用分区表，hive通过where子句中的表达式来选择查询所需要的指定的...

木野归郎 2023-02-252023-02-25 18:49:11

存储、hive、jvm、文件存储

发表了文章 2023-02-252023-02-25 18:48:50

（学习之路）Hive数据倾斜解决办法

hive是基于大数据开发的一组用于数据仓库的api，其主要功能是将HQL(HIVE SQL)转换成MapReduce执行。所以对hive的优化几乎等于对MapR...

木野归郎 2023-02-252023-02-25 18:48:50

hive、mapreduce、文件存储

发表了文章 2023-02-252023-02-25 18:40:09

《大数据之路》读书笔记：维度设计

维度是维度建模的基础和灵魂。在维度建模中，将度量称为“事实”，将环境描述称为“维度”，维度是用于分析事实所需要的多样环境。

木野归郎 2023-02-252023-02-25 18:40:09

存储、编程算法

发表了文章 2022-04-142022-04-14 21:01:51

安装 | 企业版CDH服务器集群配置(详细)

此方案为暂定方案，有可能会变更。如果直接使用CDH会更加方便，但是如果进行自行配置，需要做实验。

木野归郎 2022-04-142022-04-14 21:01:51

云数据库 SQL Server、centos、windows、yum、专用宿主机

发表了文章 2022-04-142022-04-14 21:01:12

【推荐】Spark知识点

客户那边需要快速出一个版本，开发的这块使用到的之前没怎么用过，比如用oozie调度spark程序时候，你可能在你本地调试代码没有问题，上传到集群上之后，运行就出...

木野归郎 2022-04-142022-04-14 21:01:12

spark、java、linux、yarn、node.js

发表了文章 2022-02-252022-02-25 10:15:05

Java中四种遍历Map的方式

Map中采用Entry内部类来表示一个映射项，映射项包含Key和Value (我们总说键值对键值对, 每一个键值对也就是一个Entry)

木野归郎 2022-02-252022-02-25 10:15:05

编程算法、java

发表了文章 2022-02-252022-02-25 10:14:43

安装 Anaconda 的正确姿势（带图)

Win10下Anaconda、TensotFlow安装和Pycharm配置详细教程

木野归郎 2022-02-252022-02-25 10:14:43

python、ide、tensorflow

发表了文章 2022-02-252022-02-25 10:14:00

学了又忘又学的 LSTM RNN（二）

在上一篇文章学了又忘又学的RNN（一）中回顾了什么是RNN，以及RNN和普通神经网络有什么不一样

木野归郎 2022-02-252022-02-25 10:13:59

文件存储、机器学习、深度学习、人工智能

发表了文章 2022-02-252022-02-25 10:13:30

学了又忘又学的 RNN（一）

任务也涉及到NLP领域方面的知识，关于这个领域我就不做过多的介绍了，我也是个小白，现在连脚趾头都还没有迈过门槛

木野归郎 2022-02-252022-02-25 10:13:30

深度学习、机器学习、人工智能、神经网络

发表了文章 2022-02-252022-02-25 10:13:04

一文看懂机器学习指标（二）

这几天跑的模型是以论文摘要，说的再详细一些就是对摘要进行标记，然后用标记后的数据在模型中训练

木野归郎 2022-02-252022-02-25 10:13:04

机器学习

发表了文章 2022-02-252022-02-25 10:12:33

一文看懂机器学习指标（一）

这几天在训练一个模型，模型结果中涉及到一些参数，不太理解什么意思，就差了一些资料

木野归郎 2022-02-252022-02-25 10:12:33

precision

发表了文章 2022-02-252022-02-25 10:11:44

数据分析中常见的存储方式

CSV（逗号分隔值）是一种纯文本文件格式，用于存储表格数据（例如电子表格或数据库）

木野归郎 2022-02-252022-02-25 10:11:44

存储、json、编程算法、hadoop、numpy

发表了文章 2022-02-252022-02-25 10:11:06

简单聊聊分布式系统架构

架构解决的问题：结构拆分，就是把大的问题拆解成小的系统，然后把小的系统拆分成若干个层去实现。

木野归郎 2022-02-252022-02-25 10:11:06

运维、负载均衡、spring、文件存储、负载均衡缓存

发表了文章 2022-02-252022-02-25 10:10:34

力扣-反转链表

问题描述定义一个函数，输入一个链表的头节点，反转该链表并输出反转后链表的头节点。示例：输入: 1->2->3->4->5->NULL 输出: 5->4->...

木野归郎 2022-02-252022-02-25 10:10:34

编程算法

发表了文章 2022-02-252022-02-25 10:10:09

一篇文章让你理解Java继承那些事

继承是面向对象最显著的一个特性。继承是从已有的类中派生出新的类，新的类能吸收已有类的数据属性和行为，并能扩展新的能力。

木野归郎 2022-02-252022-02-25 10:10:09

面向对象编程、java

发表了文章 2022-02-252022-02-25 10:08:59

金九银十，金三银四（下）

MySQL日志主要包括查询日志、慢查询日志、事务日志、错误日志、二进制日志等。其中比较重要的是 bin log（二进制日志）和 redo log（重做日志）和 ...

木野归郎 2022-02-252022-02-25 10:08:59

缓存、数据库、sql、云数据库 SQL Server

发表了文章 2022-02-252022-02-25 10:08:25

金九银十，金三银四（上）

所谓金九银十，金三银四，眼看十月份最后一天已经快要结束了，当初那个充满斗志，充满梦想的你在哪里？

木野归郎 2022-02-252022-02-25 10:08:25

全文检索、编程算法、mvc、mvcc、数据结构

12 3 4 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-06-11

个人成就

获得 176 次赞同
文章被阅读 104.1K 次

关注了：1关注者：20