展开

关键词

思索

栏目简介: 这里记录着小编对于的一些思考和反想, 希望对家有所帮助,也希望各位佬出来指点一二,探讨如何在领域更好的。 一、思索和一 :什么是 二、思索的目的和思路 思索 本文主要享一些常见但,微家在面对一筹莫展但时候有可以提供一些另类的思路 ,我们先回顾下之前文章 什么是: 什么是呢 就是在所有行为留下但记录就是, 怎么理解呢 那还是要你去深入思考但含义以及他背后的故事 的思路: 从总到,抽丝剥茧的寻找问题的根源 ,对定义进行量化来衡量行为,对进行可视化,常规化管理 为了实现实现上面对逻辑我们讲讲一些基本对。 那么在这里需要做的是什么呢 1、把逻辑化,所有的 逻辑和思路都需要字化才标后面都对比和对标。 2、那现有都化都结果和之前都结果做对比。

22530

Hadoop

一、Hadoop的业务 是不能传统的计算技术处理的集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。 目前主流的三布式计算系统别为:Hadoop、Spark和Strom: Hadoop当前管理标准之一,运在当前很多商业系统。可以轻松地集成结构化、半结构化甚至非结构化集。 Hadoop适于海量、离线和负责场景如下: 场景1:,如京东海量日志,京东商品推荐,京东户行为 场景2:离线计算,(异构计算+布式计算)天文计算 场景3:海量存储 ,如京东的存储集群 基于京麦业务三个实场景 京麦 京麦流量 京麦订单 都属于离线,决定采Hadoop作为京麦类产品的计算引擎,后续会根业务的发展,会增加Storm等流式计算的计算引擎 使不熟悉mapreduce 的户很便的利SQL 语言查询,汇总,。而mapreduce开发人员可以把己写的mapper 和reducer 作为插件来支持Hive 做更复杂的

505100
  • 广告
    关闭

    云数据仓库ClickHouse首购10元特惠

    适用于业务初期的行为分析、经营策略等分析查询场景,首购限时10元,快来抢购吧!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    在这里还是要推荐下我自己建的学习交流群:716581014,群里都是学开发的,如果你正在学习 ,小编欢迎你加入,家都是软件开发党,不定期享干货(只有软件开发相关的),包括我自己整理的一份 2018最新的进阶资料和高级开发教程,欢迎进阶中和进想深入的小伙伴加入。 13、基于户生命周期的体系 image.png 基于户生命周期的体系 户生命周期各阶段对的关键指标: image.png 14、ABC ABC(Activity …… 16、麦肯锡七步 麦肯锡七步又称“七步”是麦肯锡公司根他们做过的量案例,总结出的一套对商业机遇的。 P (Plan) 计划:针和目标的确定,以及整体规划的制定; D (Do) 执行:根已知的信息,设计具体的案和计划布局并执行; C (Check) 检查:总结执行计划的结果,清执行中的过

    79251

    家好,我是爱学习的小xiong熊妹。 今天继续跟享:。这个也非常简单实,即可以弥补矩阵的缺陷,又是群,商品ABC的基础,很实哦。 此时还可以“二四六八十”则,即计算个体平均值的差异,然后: 比平均值高的,根平均值的2倍、4倍、6倍、8倍、10倍,层 比平均值低的,根平均值的1/2、1/4层 这样的层,能有效区远远高于平均值的个体 此时对的做是:如果A1是稳定成长的,则看这么培养其他人;如果A纯粹运气好,则采浪淘沙的战术,多搞新人进来,期望冒出头一个新A1 可见:是其他的前哨站,做好了层,能引发更多思考和进一步 有很多讲的文章会提到,比如于商品的,叫ABC类,户的,叫层,于业务的,叫二八则。本质都是一回事。 有很多,一口吃不成个胖子,小熊妹会从一个指标到两个指标、三个指标、N个指标,逐步为家展示,敬请期待哦。 作者:小熊妹。界新人,喜欢挖掘。

    25920

    :漏斗

    家好,我是爱学习的小xiong熊妹。 今天继续跟享的是九系列。今天介绍的是漏斗,漏斗是一种基础的,处理多个指标问题的,有很多场景。 反上,参这四个步骤的人,是越来越少的。此时可以一个漏斗,形象的表示这种关系(如下图) 这就是漏斗的直观体验。 很多人误以为漏斗是互联网专,其实是因为传统企业的流程很少有记录而已。 漏斗不解决这种中间加入的问题,需要另一个户行为地图来解决。 有了以上三个保证,就能正确的统计出漏斗了。 所以,世界上没有完美的,每种都有自己的适范围,小伙伴们在做的时候,一定要选择合适的哦。 作者:小熊妹。界新人,喜欢挖掘。

    20100

    :结构

    家好,我是爱学习的小xiong熊妹。 今天继续跟小伙伴们享九系列——结构。结构是一种很简单的,也是是否入门的重要标志。 一般没入门的人,对的掌握就到此为止了。并且没入门的人,会给结构起很多高上的名字,类似:拆解/拆 一类。 一、何为“结构”? 一般把构成整体的各个部叫:结构。 甚至有人直接宣布:就是拆解……好吧,这是很错误的。 四、结构的不足 结构是一种:知其然,不知其所以然的。只适于发现问题,不能解答问题。 单靠结构就解答不了了。 从本质上看,结构只是一个或几个类维度,对一个指标做拆解和类对比。因此是种很初级的。比如矩阵,就能利两个指标做,又比结构更进了一步。 界新人,喜欢挖掘。

    10300

    :相关

    家好,我是爱学习的小xiong熊妹。 今天继续更新九系列。在工作中,我们经常会问: 下雨和业绩下降有多关系? 销售上涨和新品上市有多关系? 营销投入业绩产出有多关系? 比如做户增长,注册的新涨,但付费转化率持续幅度下跌,这就说明获客效率在下降,可能是目标户已耗尽,也有可能是渠道在造假,也有可能是获客有误,总之要深入(如下图) 四、间接相关关系 间接相关关系,有2种常,一种是散点图,可以直接做散点图,发现相关关系(如下图所示) 另一种是计算相关系。 五、相关的不足之处 世界上没有完美的,相关有两不足之处。 不足一:相关不等于因果。 两个指标相关关系,本质上只是一条公式计算出来的结果,至于两个指标为啥相关? 一个店是不是旗舰,取决于位置、装修、宣传等诸多因素,不能粗暴的开店面积、员工人等指标来代替。 想这种非量化特征指标之间的关系,需要到另一种:标签。以后再享哦。

    11700

    思索和

    栏目简介: 这里记录着小编对于的一些思考和反思, 希望对家有所帮助,也希望各位佬出来指点一二,探讨如何在领域更好的。 一、思索和一 :什么是 二、思索的目的和思路 三、思索 我从最开始的去探讨了什么是的目的思路, (对比和对标) 我想描述下我对的另外一些看 那么这里我们从这里就可以知道我们认知里最重要的一个逻辑去给物件类。 那其实在里,我们对最清晰的认知也是对进行划类别,别贴上标签。 那么下一步就是我们如何找到这中间的关系呢 1、相关相关性 事物中逻辑关系强 必然存在相关性,那就可以针对事物之间进行相关系 2、事物的发展逻辑 我们可以去观察事物的发展向 ,进行归纳总结对的逻辑关系 3、因果关系 从因果维度我们可以去探寻部事件的真相 4、关联关系 事情如果存在关联性,那内在肯定存在一些逻辑关系, 其实只要在维度证明其实相关的

    11310

    及 相关工具

    越来越多的涉及到,这些的属性,包括量,速度,多样性等等都是呈现了不断增长的复杂性,所以,领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。 基于此,理论有哪些呢? ? 具体的处理其实有很多,但是根长时间的实践,笔者总结了一个基本的处理流程,并且这个流程该能够对家理顺的处理有所帮助。 统计 / 统计主要利布式库,或者布式计算集群来对存储于其内的海量进行普通的类汇总等,以满足常见的需求,在这面,一些实时性需求会到 EMC 的 GreenPlum 挖掘 前面统计和过程不同的是,挖掘一般没有什么预先设定好的主题,主要是在现有上面进行基于各种算的计算,从而起到预测的效果,从而实现一些高级别的需求。

    1.1K80

    :MECE

    家好,我是爱学习的小xiong熊妹。 今天继续享九系列。上一篇说到,当我们要的问题,受到太多因素的影响的时候,经常会不知道从哪里下手。 好在,天气预报软件能给出具体的气象信息,包括温度、湿度、降雨量等等,可供使。 这里有两种深入相关,收集降雨量指标,之后寻找降雨量指标客流之间关系。 后续再慢慢跟享,如何MECE构建复杂的逻辑。 五、MECE不足之处 MECE不足之处,在于并非所有影响因素,都能直接观察到。举个简单的例子:户为什么会流失? 不过这些测试类,并不是直接从中解读出含义,而是先设计实验再看结果,因此没有和九归为一类,小伙伴们还想看的话,下一部来更新《8个故事,看懂测试》敬请期待哦。 作者:小熊妹。 界新人,喜欢挖掘。

    18600

    导论 Chapter04 |

    一、介绍 什么是就是利机器学习等算、挖掘信息的一个过程。 ? 机器学习是的核心 机器学习就是让计算机从量的中学习相关的规律,然后利学习来的规律对未知进行预测的。 ? 1、机器学习发展历程 ? 2、机器学习的类 ? 3.1、K近邻算流程 确定K的小和相似度的计算 从训练样本中挑选k个测试样本最相似的样本 根k个训练样本的类别,通过投票的式来确定测试样本的类别 ? 7维降为3维 6.1、PCA的基本思想 主成(PCA)是一种有效的降维 构成原始特征的一系列线性组合形成低维的特征,以去除相关的相关性,并使降维后的程度地保持原始高维地信息 6.3、特点 优点: 计算效率高 便于理解低维 缺点: 构建的主成特征没有明确的含义 三、的工具介绍 1、工具 基于Python的Scikit-learn库 基于Hadoop

    38941

    之:标签

    家好,我是爱学习的小xiong熊妹。 今天继续介绍九系列。上一篇我们提到,如果想找两个指标之间相关关系,可以相关。但很多时候,我们想找的关系,不能指标来表达。 社区店/私域流量/刮风下雨,很难一个指标来衡量。但这些因素,又确实会对企业经营产生影响,该怎么呢?这就需要采:标签 一、什么是标签 标签是有明确含义的,概括性的描述。 二、什么是标签 标签,特指打标签的式,把难以量化的因素转化为标签,进而该因素其他事情的关系。像开头举例的社区店/私域/下雨,都是标签的具体家都觉得:下雨会影响门店业绩。那么怎么呢?按照五步,可以针对该省份门店,做如下图: 那么可以得出结论:下雨对业绩影响不,这就做完了。 但这和家的直观感受非常不一样! 因此单靠一两个标签的简单对比,是无清楚的,这时候需要先建立逻辑,再做。这就需要到MECE。下一篇再享哦。喜欢的话,记得转发+点赞+在看三连,支持一下小熊妹哦。

    16300

    最常的四

    最常的四 挖掘领域中,最常的四种别是: 描述型、诊断型、指令型和预测型 描述型 描述型:发生了什么?这是最常见的。 在业务中,这种师提供了重要指标和业务的衡量。 例如,每月的营收和损失账单。师可以通过这些账单,获取量的客户。了解客户的地理信息,就是“描述型之一。 利可视化工具,能够有效的增强描述型所提供的信息。 诊断型 诊断型:为什么会发生?描述性的下一步就是诊断型。 指令模型基于对“发生了什么”、“为什么会发生”和“可能发生什么”的,来帮助户决定该采取什么措施。 预测模型通常会使各种可变来实现预测。成员的多样化预测结果密切相关。 在充满不确定性的环境下,预测能够帮助做出更好的决定。预测模型也是很多领域正在使的重要

    36830

    资料享:零售

    最近得空整理了一份关于零售的资料,包括了基本的知识讲解、知识点案例,以及各种好玩的落地实操资料,具体的资料: ? 包括零售的基本概述、销售目标制定追踪、顾客、商品、网店运营、财务,以及这些处理的基本和节奏。 一、零售概述: ? ? ? ? ? ? 2、顾客 ? ? ? ? ? ? 3、商品: ? ? ? ? ? 4、网店运营: ? ? ? 五、财务 ? ? ? ? ?

    47420

    技术创新平台

    ,系统地介绍了技术创新平台的总体技术框架,详细了我国共性技术存在的不足和解决思路,并阐述了创新平台中四支撑平台的设计思路向,最后对技术国家工程实验室未来的发展向和重点工作进行了介绍 本文将系统地我国的五共性技术的瓶颈和解决思路,介绍系统开发平台、系统测试评估平台、可视化展示平台、重示范系统集成平台四支撑平台的设计,并对技术国家工程实验室未来的发展向和重点工作进行展望 可见,在中,预处理质量控制技术、支撑理论挖掘技术、可视技术、智能知识管理决策支持技术构成了的五共性技术。 3 支撑平台 针对上述技术,技术创新平台将搭建相的支撑平台,支持和系统的研发落地。 创新平台围绕科学理论体系、计算系统理论等重基础研究进行前瞻布局,开展科学研究,引导和鼓励在的理论、及关键技术等面展开探索。

    58620

    ——论概述

    一、什么是论 我们把一些跟相关的营销、管理等理论统称为论,它是对一个项目的整体工作起到指导作的思路模型。 二、的区别 论主要从宏观角度指导我们怎样进行,更像一个规划图或者说施工图,告诉我们项目整体的框架、从哪几个面进行、各面包含什么内容和指标,先什么 而是指对具体的信息和进行怎样的处理,采什么样的,它是整个项目中的一个较为关键的环节,是从微观角度指导我们怎样进行。 我们就以一个简易的盖房子施工流程为例来看一看有着什么样的区别,先一张图表来比较一下它们的关系: ? 论就好比建筑施工图,为我们指引向,好比建筑施工技术,它为我们完成提供技术保障支持。

    52622

    可以使什么 有什么场景

    是一种通过对整理,结合,并对背后所反映的情况进行归纳总结的一种。那么在这其中相关常见于专业人士的使和统计,对于普通人来说依然存在不少疑惑。 那么今天就通过相关资料来进行的初步了解。 image.png 可以通过什么进行 是一种常见运于各个企业,个体户之中的一种。通过的整合来进行现象。 系统是一种较为简便的相关,通过建立相关的程序,提供蓝本,然后软件就会根使者提供的蓝本自行收集信息并加以,其优点在于效率高,处理速度快。 有什么场景 可以于所有需要相关的场所,小到菜贩子的销售额,到国家之间的贸易,这种都是可以让人们更好地了解并统计当下发生的事情并对事情的发展作出判断。 而不同的各有优劣,至于如何选择两者,则需要使者结合自身场景来进行判断了。

    36940

    咖说

    咖说.jpg 1.1 为什么说可视化本身就是 可视化就是把枯燥的图形化的式展示出来,从而能够更好地理解背后的含义。 地图就是将事物根发生的地理位置信息将事物标识在地图上的一类。通过在地图上进行标识,可以直观地看到事物在地图上的布情况,从而直观地观测事物在地图上的布特征,热力图是地图最典型的。 地图就是将事物根发生的地理位置信息将事物标识在地图上的一类。通过在地图上进行标识,可以直观地看到事物在地图上的布情况,从而直观地观测事物在地图上的布特征,热力图是地图最典型的。 4.联结Connecting 联结也是一个强,通过间的关联,可以把户的关联组合在一起,衍生出新的想。 以上是集下常可视化的,每一类都有很多种可视化的表达式,根个人喜好或者审美的不同,设计出来的可视化也会有所差异。这些是基本的集的展示,比较容易理解。

    27120

    最常的四种

    本文主要讲述挖掘领域中,最常的四种:描述型、诊断型、预测型和指令型。 其实我想告诉他们的是,挖掘领域最重要的能力是:能够将转化为非专业人士也能够清楚理解的有意义的见解。 使一些工具来帮助家更好的理解在挖掘价值面的重要性,是十有必要的。 在业务中,这种师提供了重要指标和业务的衡量。 例如,每月的营收和损失账单。师可以通过这些账单,获取量的客户。了解客户的地理信息,就是“描述型之一。 预测模型通常会使各种可变来实现预测。成员的多样化预测结果密切相关。 在充满不确定性的环境下,预测能够帮助做出更好的决定。预测模型也是很多领域正在使的重要。 结论 最后需要说明,每一种都对业务具有很的帮助,同时也的各个面。

    4510

    相关产品

    • 品牌经营管家

      品牌经营管家

      腾讯品牌经营管家(BMA)是基于网络数据感知、大数据分析、AI 技术,构建覆盖数据获取引擎、数据分析中台到上层应用的全链路产品,通过大数据情报服务为企业品牌经营行为保驾护航。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券