首页
学习
活动
专区
工具
TVP
发布

数据森麟

专栏作者
341
文章
408083
阅读量
39
订阅数
我常用的15个数据源网站
前面介绍过实用的效率小工具,真的帮了我很多忙,这次给小伙伴们再种草一些数据源网站。
数据森麟
2022-10-31
8890
大数据扫黄,是怎样发现你的?
简单来说,“AI 鉴黄”就是通过深度神经网络,按照各种描述特征来提取图像中的关键点,比如是否出现皮肤裸露等等,将色情图片与正常图片进行分类。
数据森麟
2022-10-31
5740
初识大数据与Hadoop
在大数据时代,基于大数据技术的职位更有钱途,因此成为很多人的职业首选。在大数据技术中,大家常常听到 Hadoop,很多刚开始接触的人会问,什么是 Hadoop?它有什么作用?下面笔者就跟大家唠叨唠叨。
数据森麟
2021-03-09
4710
数据分析工具篇——MapReduce结构
前面我们介绍了HDFS,作为HDFS的第一代上层架构,我们必须讲解一下hadoop的MapReduce结构,可以说这一结构促进了大数据的兴起。
数据森麟
2021-01-25
7700
数据分析工具篇——HDFS原理解读
前面我们用几篇文章的时间整理了一下小数据集的情况下数据分析的常用工具,主要是为了梳理分析过程中的主线条,但是,随着数据的增加,pandas这样的数据结构只会越来越慢,取而代之的是hadoop和spark这种大数据环境下的分析工具,接下来几篇我们会从大数据的角度,分析pyspark、SQL的常用技巧和优化方法,本文的重点是讲解HDFS的结构和存储逻辑,大数据的存储主要是以文件的形式,HDFS是一个不二选择,所以,这篇文章我们讲解一下HDFS的结构,接下来的文章我们讲解hadoop和spark,最后讲解pyspark和SQL的技巧和优化。
数据森麟
2021-01-25
5010
聊聊APP数据分析的那些思路
有一个朋友跟我说,他之前呆过的一家互联网公司,抗风险能力很弱,整个运营部门all in在新增上,完全不考虑留存和活跃等指标。2017年的日新增用户数单从应用市场靠ASO来的都能做到日均3W,还没有算上其他渠道。但是留存特别低,7日活跃留存率只能维持在10%左右。后来,公司新来了一个产品经理,这个产品经理看到公司的问题,他逐步完善整个公司的数据体系。后来,运营数据指标体系慢慢清晰了,公司的用户增长也步入健康的增长状态,比当时all in新增的利润要可持续得多。他感叹说,数据分析好的话,完全能够实现可持续性的利润增长,深感数据分析的重要性。我也是完全认同他的观点,数据分析的价值潜力很大。今天,结合我多年的APP数据分析经验,给大家讲解一些APP数据分析的思路。记住,只聊思路,不聊实操,希望对一些对APP数据分析感兴趣的伙伴有所帮助。
数据森麟
2021-01-08
1K0
真的,不要迷信数据分析。
最近有同学问了我一个很致命的问题:数据分析真的有必要做吗?为什么感觉都是伪需求?怎么确定数据分析结论是真的?
数据森麟
2020-05-27
4070
统计思维如何帮助大数据应用从人工走向智能?(上)
2018年8月9日(上周四),笔者和金融科技业务部的几位算法同事有幸参加了哥伦比亚大学全球中心举办的人工智能系列论坛。本次论坛邀请了哥伦比亚大学数据科学研究所副所长、哥伦比亚大学统计学郑甜教授(也是笔者在哥大Master期间的Advisor),分享哥大经典的统计思维研究及其对大数据分析、人工智能应用的启发。
数据森麟
2019-09-27
6070
【数据挖掘&机器学习篇】
随着互联网大数据行业的日渐兴盛,越来越多的人投身其中,也有很多的朋友对此有着浓厚的兴趣,想要投身其中。从本期开始我们将分四期带大家走进互联网大数据行业,分别了解数据挖掘&机器学习、数据分析、算法&深度学习、数据产品经理这四个不同的与大数据相关的职位。
数据森麟
2019-09-27
3860
实用流量数据分析指南
粽子节了嘛,突然想吃粽子了,咋办,买粽子呗!现在情景转换一下,假设你是某饮食网的数据分析师,现在某粽子界大亨想拿钱砸你老板(打广告)。
数据森麟
2019-09-27
1.2K0
“直男变暖男”—— 当推荐系统遇上知识图谱
作为一个文科生,深知文化娱乐、旅游休闲、市场营销等领域正在迎接推荐算法的洗礼,传统的分析、内容生产,势必会发生改变。因此笔者一直关注技术领域,斥巨资(狗头保命
数据森麟
2019-09-27
8370
走进数据的历史
数据是当今的热词。很多人的理解中,数据就是数字,其实不然,数据的范畴要大得多,包括数字、语言、文字、图像、视频,甚至是人类活动的行为都可以被认为是数据。数据本身是客观存在的,但是他的范畴是随着社会发展不断演进的。例如在计算机出现以前,文字和语言并不被认为是数据,而现在文字和语言,已是翻译,电子通讯等重要领域的核心数据。
数据森麟
2019-09-27
5210
漫画:大数据的九大应用场景
随着科技的发展,大数据的应用越来越广。AI人工智能是大数据的应用,而大数据也是AI人工智能的燃料,二者相辅相成。
数据森麟
2019-09-27
1.3K0
用户画像,该怎么分析?
有同学问:陈老师,我领导让我做用户画像分析,可是我做了一大堆数据,却被批:也没分析什么东西啊?该咋办?今天系统解答一下。
数据森麟
2019-09-27
2K0
数据团队思考:数据人的通用技能要求
最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据人该具备哪些通用的技能。
数据森麟
2019-09-27
3650
对用户画像标签体系的一点思考。
最近入手了一个用户画像的项目,这里面真的“坑”满多的,你肯定很想问,不就是用户画像嘛,会这么烦吗?现在可能就需要拆分成几个问题来做这个项目。
数据森麟
2019-09-27
1.9K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档