首页
学习
活动
专区
工具
TVP
发布

机器学习养成记

专栏成员
153
文章
218715
阅读量
43
订阅数
CatBoost(一):与同类算法的差异对比
导读:在机器学习领域,处理类别型特征一直是个棘手的问题。传统的GBDT算法在这一领域的表现并不尽如人意,直到CatBoost的出现。今天,我们就来聊聊CatBoost是如何优雅地解决这一难题的,以及它在实际应用中的强大之处。
三猫
2024-07-30
1330
用Python绘制词云:让数据可视化变得生动有趣
导读:你是否曾想过,如何将一堆枯燥的数据转化为一幅幅引人入胜的视觉艺术品?词云,作为一种流行的数据可视化技术,能够将文本数据中的关键词以不同大小和颜色呈现,直观地展示信息的密度和重要性。在本文中,我们将探索如何使用Python——一种强大而灵活的编程语言——来绘制出既美观又富有洞察力的词云图。
三猫
2024-06-26
2970
模型解释器——Global Surrogate Models介绍
导读:Global Surrogate Models 是一种模型解释方法,旨在通过一个可解释的模型来近似黑盒模型在整个输入特征范围内的预测结果。这种方法的核心思想是使用一个全局替代模型来揭示黑盒模型的决策过程和行为模式。
三猫
2024-04-10
1750
模型解释器——SHAP算法介绍
导读:在人工智能领域,模型的可解释性一直是研究者和工程师们关注的焦点。随着机器学习模型在各个领域的广泛应用,如何理解模型的决策过程成为了一个重要课题。SHAP(SHapley Additive exPlanations)算法作为一种新兴的模型解释技术,为我们提供了一种全新的视角来理解复杂的机器学习模型。
三猫
2024-04-10
1.3K0
商业分析python实战(二):电影智能推荐
本例通过943名用户对1664部电影的评分数据,构建协同过滤模型,进而推荐电影供用户观看。通过本例,可以了解协同过滤算法在电子商务智能推荐领域的应用方法,帮助用户更加便捷的获取想要的信息,进而提升用户体验、促进推荐转化。
三猫
2023-08-31
2330
商业分析python实战(一):企业所得税预测
考虑数据的可得性和与实际情况的关联性,选取2004年-2015年某企业相关维度的数据,具体字段名及说明如下表:
三猫
2023-08-31
2920
模型解释器——LIME算法介绍
导读:随着深度学习算法应用越来越广泛,大家不再满足于只得到模型的预测结果,而是希望更好的了解结果产生的原因。构建能让用户理解并信任的模型越来越重要。本文将介绍一种作为复杂模型事后解释器的算法——LIME,并以乳腺癌诊断为例,对XGboost模型结果进行解释。
三猫
2023-08-31
7180
动态时间规整(DTW)算法介绍
导读:通常我们比较两个序列的相似性,可以通过直接点对点计算距离的方式实现。但是当两个序列长度不相等时,原有的方法就变得不适用,比如两个人对同一个词语发音不同,导致阅读同一词语的时长不同,因此就要对序列进行延伸或压缩才能比较两段语音是否阅读的是同一个词语。本期介绍的DTW就是解决这类问题的常用算法。
三猫
2022-11-29
4K0
NLP基础:NNLM模型代码示例
导读:在NLP基础:NNLM模型介绍中,已经介绍了NNLM模型原理,通过对网上已发布的代码进行完善并标注,进行模型代码示例展示。
三猫
2022-11-25
3630
数据可视化好书推荐
越来越多行业和职业都在使用数据、绘制数据图表,但大家在工作中是否遇到这样的问题:精心绘制的图表不能吸引读者的关注、不能让读者对核心观点有明确的解读。这些,都是因为我们还不清楚如何正确的用数据讲故事。在《用数据讲故事》这本书中,作者总结了一套将数据合理可视化并讲故事的体系方法,本文小编的将结合自己的学习应用,为大家介绍书中核心内容。
三猫
2022-08-31
6790
数据分析利器之归因分析
导读:归因分析是用于确定如何将转化功劳分配给各转化路径,从而结合单次的转化成本对后续的投放策略进行优化,本次我们就来介绍一下归因分析的几种常用方法。
三猫
2022-08-31
1.1K0
NLP基础:NNLM模型介绍
导读:在NLP中,语言模型用来判断一句话是否是正常人说的,广泛应用于信息检索、机器翻译、语音识别等重要任务中。传统的语言模型主要基于统计方法(如:NLP基础:N-Gram模型),虽然可解释性强、易于理解,但存在泛化能力差等问题。随着深度学习技术的发展,相关技术也应用到语言模型中,如NNLM模型。本文就将对NNLM展开介绍。
三猫
2022-08-31
1.1K0
图表≠有效的信息表达——好书推荐《用数据讲故事》
越来越多行业和职业都在使用数据、绘制数据图表,但大家在工作中是否遇到这样的问题:精心绘制的图表不能吸引读者的关注、不能让读者对核心观点有明确的解读。这些,都是因为我们还不清楚如何正确的用数据讲故事。在《用数据讲故事》这本书中,作者总结了一套将数据合理可视化并讲故事的体系方法,本文小编的将结合自己的学习应用,为大家介绍书中核心内容。
三猫
2022-04-18
6910
数据分析利器之帕累托法则(二八法则)
导读:帕累托于1906年提出了关于意大利社会财富分配的研究结论:20%的人口掌握了80%的社会财富。朱兰博士在管理学中采纳了该思想,认为在任何情况下,事物的主要结果只取决于一小部分因素,并正式提出帕累托法则。经过大量的试验检验后,该法则被证明在大部分情况下都是正确的,帕累托法则逐渐也成为数据分析中的常用方法。本期将对帕累托法则进行介绍,
三猫
2022-04-18
2.2K0
数据分析利器之AARRR模型
导读:随着互联网时代的发展,用户运营策略也在更新迭代。其中AARRR就是当下炙手可热的用户运营模型之一,本期将对AARRR模型进行介绍。更多数据分析干货可点击数据分析方法论(干货)。
三猫
2022-03-15
1.5K0
数据分析利器之漏斗分析
导读:漏斗分析能够评估某一过程从起点到终点各个阶段的转化情况,从而发掘问题环节并进行针对性优化,是日常分析中最常用且最容易理解的分析方法之一。本文将围绕漏斗分析的定义、实现方法等重点知识展开介绍,更多数据分析干货可点击数据分析方法论(干货)。
三猫
2022-03-15
5000
数据分析利器之相关性分析
导读:相关性分析在量化分析、行业分析、机器学习等领域都有着普遍的应用,本文将围绕相关性分析的定义、相关性系数等重点知识展开介绍,更多数据分析干货可点击数据分析方法论(干货)。
三猫
2022-03-15
1.3K0
数据分析利器之公式拆解法
导读:在数据分析方法论(干货)中介绍了数据分析的整体方法论,本期就其中提到的公式拆解法(简称公式法)进行介绍。
三猫
2022-03-15
1K0
数据分析之对比分析
导读:在数据分析方法论(干货)中介绍了数据分析的整体方法论,其中,对比分析是最基础、最常用的方法之一,本期就围绕对比分析的定义、原则、对象和方法进行介绍。
三猫
2022-01-11
6410
数据分析方法论(干货)
导读:数据分析逐步成为很多职业的必备技能,也成为大家求职过程中的加分项。随着数据分析方法体系的逐步完善,学习数据分析门槛也逐步降低,本篇就从分析框架角度,带大家揭开数据分析的面纱。
三猫
2022-01-11
3340
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档