首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
877605
阅读量
105
订阅数
风控实战:用Python实现vintage报表
大家好,我是东哥。本篇继续分享风控的内容,关于如何用python实现vintage报表及可视化图的实战。
Python数据科学
2023-12-26
2400
数据挖掘实战:聚类分群实现精准营销
本实战案例介绍如何通过无监督的聚类算法对银行客户进行分群。所谓物以类聚,人以群分,有相似属性、行为特征等的客户就可以聚合为一类人群。在信贷风控中,聚类分群多应用于没有Y标签的场景,如反欺诈、客户画像等。
Python数据科学
2023-12-13
2020
pandas 行列转换的 2 个常用技巧!
工作中,比如用户画像的数据中也会遇到,客户使用的app类型就会以这种长列表的形式或者以逗号隔开的字符串形式展现出来。
Python数据科学
2023-08-29
1320
Kaggle ICR 赛题 LightGBM基础思路
Kaggle ICR比赛现在在进行中,这个比赛是一个典型的数据挖掘比赛,很适合入门学习。本文将介绍现在ICR基础的解决方案。
Python数据科学
2023-08-29
1980
baseline来啦!第三届厦门国际银行数创金融杯金融营销建模大赛
厦门国际银行数创金融杯已经举办第三届了,是专门针对金融机构痛点专门设立的金融风控竞赛。很多初学者不知道如何快速入门数据挖掘,其实最好的方式就是自己动手做一遍竞赛,这其中有业务理解,也有技术技巧上的提升,对于个人进步都是一次难得的机会。
Python数据科学
2022-03-11
7240
特征选择:8 种常见的特征过滤法
特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高过数据挖掘算法本身。
Python数据科学
2021-07-16
8.4K0
干货 | 整理一份详细的数据预处理方法
作者:lswbjtu https://zhuanlan.zhihu.com/p/51131210
Python数据科学
2019-11-12
1.1K0
推荐收藏 | 100个数据分析常用指标和术语
有个朋友是金融行业产品经理,最近在对已有的站内用户做分层与标签分类,需要对用户进行聚类分析。一般从事数据分析行业的朋友对这类词并不陌生,但是像市场运营人员就会把这类些名词概念搞混,导致结果不准确。数据分析相关概念多且杂,容易搞混。为了便于大家区分,今天小编就来盘点一下数据分析常用的术语解释。建议大家收藏起来方便查看。
Python数据科学
2019-10-10
7250
大数据 SQL Boy 脱坑指南
不可否认的是 SQL 是一个伟大的发明,它让增删改查的操作更加地便捷化,而且 SQL 的学习成本相对其他编程语言来说较低,被逼到会写 SQL 的运营和产品我都见过不少。。。
Python数据科学
2019-10-10
9840
数据仓库、数据湖、数据中台终于有人说清楚了,建议收藏!
随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI)、数据仓库、数据湖、数据中台等,这些概念特别容易混淆,本文对这些名词术语及内涵进行系统的解析,便于读者对数据平台相关的概念有全面的认识。
Python数据科学
2019-09-26
21.6K0
从概念到应用,终于有人把数据挖掘讲明白了
导读:数据采集和存储技术的迅速发展,加之数据生成与传播的便捷性,致使数据爆炸性增长,最终形成了当前的大数据时代。围绕这些数据集进行可行的深入分析,对几乎所有社会领域的决策都变得越来越重要:商业和工业、科学和工程、医药和生物技术以及政府和个人。
Python数据科学
2019-09-10
5010
向Excel说再见,神级编辑器统一表格与Python
很多开发者说自从有了 Python/Pandas,Excel 都不怎么用了,用它来处理与可视化表格非常快速。但是这样还是有一大缺陷,操作不是可视化的表格,因此对技能要求更高一点。近日,开发者构建了名为 Grid studio 的开源项目,它是一个基于网页的表格应用,完全结合了 Python 和 Excel 的优势。
Python数据科学
2019-08-08
8360
Kaggle "$70000奖金池" 竞赛经历分享 — Home Credit 房屋信贷违约风险(一)
推荐导读:本文来源于知识星球中一位星友的投稿,主要分享前不久刚结束的一个Kaggle竞赛 “Home Credit Default Risk” 房屋借贷的违约预测分析。
Python数据科学
2019-07-22
2K0
谈谈当前商业数据分析师现状
众所周知,数据分析师有两个发展方向,一个是商业数据分析师,一个就是数据挖掘工程师。
Python数据科学
2019-06-20
2.2K0
【机器学习笔记】:从零开始学会逻辑回归(一)
逻辑回归是一个非常经典,也是很常用的模型。之前和大家分享过它的重要性:5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
Python数据科学
2018-12-17
6560
【SQL刷题系列】:leetcode177 Nth Highest Salary
【SQL刷题系列】:leetcode183 Customers Who Never Order
Python数据科学
2018-11-30
8220
【SQL刷题系列】:leetcode180 Consecutive Numbers
【SQL刷题系列】:leetcode183 Customers Who Never Order
Python数据科学
2018-11-23
7100
【SQL刷题系列】:leetcode183 Customers Who Never Order
假设一个网站包含两个表: Customers和Orders。写出一个SQL查询语句找出所有没有任何订单的顾客。
Python数据科学
2018-11-07
5310
如何用Python递归地思考问题?
递归是一个很经典的算法,在实际中应用广泛,也是面试中常常会提到的问题。本文就递归算法介绍如何在Python中实现递归的思想,以及递归在Python中使用时的一些注意事项,希望能够对使用Python的朋友提供一些帮助。
Python数据科学
2018-10-18
2K0
【SQL刷题系列】:leetcode178 Rank Scores
编写一个 SQL查询来对分数排名。如果两个分数相同,那么两个分数应该有同样的排名。但也请注意,如果平分,那么下一个名次应该是下一个连续的整数值。换句话说,名次之间没有“间隔”。
Python数据科学
2018-10-18
1.3K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档