首页
学习
活动
专区
工具
TVP
发布

大鹅专栏:大数据到机器学习

从大数据计算到机器学习,你需要了解这些。专注于Hadoop生态 Spark 机器学习 深度学习
专栏作者
127
文章
265445
阅读量
46
订阅数
数据库底层数据结构 B树B+树LSM树 详解对比与总结
我们熟知常用数据库MySQL MongoDB HBase等底层存储都用了各种树结构,如B树LSM树,不过为什么要用这些结构呢?
大鹅
2021-06-16
3.2K0
Java volatile 关键字解释 用法原理 并发编程特性
有时仅仅为了读写一个或者两个实例域就使用同步的话,显得开销过大,volatile关键字为实例域的同步访问提供了免锁的机制。如果声明一个域为volatile,那么编译器和虚拟机就知道该域是可能被另一个线程并发更新的。再讲到volatile关键字之前我们需要了解一下内存模型的相关概念以及并发编程中的三个特性:原子性,可见性和有序性。
大鹅
2021-06-16
3780
Java 虚拟机中内存区域介绍 JDK8区别 对象创建 学习笔记
在之前的JVM介绍中简略讲述了JVM介绍与内存层次结构,这篇博客主要记录内存区域、对象创建流程及JDK8中的更新。
大鹅
2021-06-16
3540
Java JVM 内存泄露 基本概念 解析及排查处理办法
JAVA是垃圾回收语言的一种,开发者无需特意管理内存分配。但是JAVA中还是存在着许多内存泄露的可能性,如果不好好处理内存泄露,会导致APP内存单元无法释放被浪费掉,最终导致内存全部占据堆栈(heap)挤爆进而程序崩溃。
大鹅
2021-06-16
1.1K0
控制反转 依赖注入 基本概念 与 Spring IOC 源码学习
1996年,Michael Mattson在一篇有关探讨面向对象框架的文章中,首先提出了IOC 这个概念。IOC是Inversion of Control的缩写,多数书籍翻译成“控制反转”,还有些书籍翻译成为“控制反向”或者“控制倒置”。IOC理论提出的观点大体是这样的:借助于“第三方”实现具有依赖关系的对象之间的解耦。
大鹅
2021-06-16
6750
Spark Structrued Streaming 及 DStreaming 调优笔记
项目中用的是Spark Structrued Streaming ,也就是Spark 2.0的新版Streaming,看官方文档也说过性能及实时性会比之前的Dstreaming好点,但是相关的资料相比Dstreaming实在是少很多,现在调优阶段很多都要参考Dstreaming的文章以及经验。
大鹅
2021-06-16
1.3K0
MongoDB 常用操作笔记 find ,count, 大于小于不等, select distinct, groupby,索引
本博客将列举一些常用的MongoDB操作,方便平时使用时快速查询,如find, count, 大于小于不等, select distinct, groupby等
大鹅
2021-06-16
3.6K0
Java final, static, this, super 关键字总结
this.employees.length:访问类Manager的当前实例的变量。
大鹅
2021-06-16
4780
Java 多线程与线程池 Thread弊端与Executor存在问题 及解决方法
那么有没有一种办法使得线程可以复用,就是执行完一个任务,并不被销毁,而是可以继续执行其他的任务?
大鹅
2021-06-16
1.6K0
Spring Boot 创建及使用多线程
Spring是通过任务执行器(TaskExecutor)来实现多线程和并发编程,使用ThreadPoolTaskExecutor来创建一个基于线城池的TaskExecutor。在使用线程池的大多数情况下都是异步非阻塞的。我们配置注解@EnableAsync可以开启异步任务。然后在实际执行的方法上配置注解@Async上声明是异步任务。
大鹅
2021-06-16
2.8K0
SVD奇异值分解 中特征值与奇异值的数学理解与意义
更像是矩阵分解多一点,没有涉及到SVD的数学意义,这篇博客大概会写一些数学SVD的数学理解,以及SVD在PCA和推荐算法上面的应用。
大鹅
2021-06-16
1.8K0
逆序数对(inversion)个数统计 python解法与时间复杂度推导
be a list of n distinct input integers. We call the pair (i, j) an inversion if i < j and
大鹅
2021-06-16
1.5K0
LR(Logistic Regression) 逻辑回归模型 进行二分类或多分类 及梯度下降学习参数
逻辑回归(Logistic Regression, LR)是传统机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。它的起源非常复杂,可以看参考引用1。具体应用实践可以看这里。
大鹅
2021-06-16
9800
AdaBoost (Adaptive Boosting) 自适应增强 简单理解算法与matlab实现
AdaBoost学习算法用于提高简单学习算法的分类性能。它通过组合一组弱分类函数(具有较高分类错误的弱分类器)来形成更强的分类器。最后的强分类器采用弱分类器加阈值的加权组合的形式。
大鹅
2021-06-16
5570
Java 中 ArrayList,LinkedList和Vector主要区别与概述
ArrayList和LinkedList在性能上各有优缺点,都有各自所适用的地方,总的说来可以描述如下:
大鹅
2021-06-15
1.9K0
LeetCode 139. Word Break 动态规划DP Python解法
Given a non-empty string s and a dictionary wordDict containing a list of non-empty words, determine if s can be segmented into a space-separated sequence of one or more dictionary words. You may assume the dictionary does not contain duplicate words.
大鹅
2021-06-15
6090
Leetcode 78. Subsets Python DFS 深度优先搜索解法
Given a set of distinct integers, nums, return all possible subsets (the power set). 给定一个数据集合,求该集合的所有子集。 Note: The solution set must not contain duplicate subsets.
大鹅
2021-06-15
4780
LeetCode 22. Generate Parentheses 生成括号 Python 回溯解法
Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses. 给定n对括号,写一个函数来生成成对的括号的所有组合。
大鹅
2021-06-15
7140
LeetCode 322. Coin Change Python 动态规划/BFS解法
You are given coins of different denominations and a total amount of money amount. Write a function to compute the fewest number of coins that you need to make up that amount. If that amount of money cannot be made up by any combination of the coins, return -1.You may assume that you have an infinite number of each kind of coin.
大鹅
2021-06-15
4770
LeetCode 5. Longest Palindromic Substring 最长回文子串 Python 四种解法(Manacher 动态规划)
通过枚举字符串子串的中心而不是起点,向两边同时扩散,依然是逐一判断子串的回文性。这种优化算法比之前第一种算法在最坏的情况下(即只有一种字符的字符串)效率会有很大程度的上升。
大鹅
2021-06-15
6410
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档