首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1016638
阅读量
170
订阅数
【DS】Doc2Vec和Logistic回归的多类文本分类
Doc2vec是一个NLP工具,用于将文档表示为向量,是word2vec方法的推广。 为了理解doc2vec,最好理解word2vec方法。但是,完整的数学细节超出了本文的范围。如果您是word2vec和doc2vec的新手,以下资源可以帮助您入门:
陆勤_数据人网
2018-12-18
2.1K0
【算法】从头开始编写任何机器学习算法的6个步骤:感知器案例研究
有些算法比其他算法更复杂,所以从一些简单的算法开始,从一些非常简单的算法开始,比如单层感知器。
陆勤_数据人网
2018-12-04
1.1K0
【智能】如何成为数据科学家:权威指南
你好!我是Jose Portilla,Udemy的讲师,有超过25万名学生注册了各种各样的课程,包括Python的数据科学和机器学习、R编程的数据科学、Python的大数据等等。
陆勤_数据人网
2018-11-08
5740
【Python Tip】Anaconda套件下如何把scikit-learn包更新到0.20版本?
因为使用sklearn.compose下的函数make_column_transformer,发现它是在scikit-learn包的0.20版本里面,如何在Anaconda套件下进行更新呢?
陆勤_数据人网
2018-10-26
1.5K0
【智能】数据科学管道初学者指南
曾几何时,有一个名叫Data的男孩。 在他的一生中,他总是试图了解他的目的是什么。 我有什么价值观? 我可以对这个世界产生什么影响? 数据来自哪里? 看到你和数据之间的任何相似之处? 这些问题始终在他的脑海中,幸运的是,凭借纯粹的运气,Data终于遇到了一个解决方案,并经历了一次巨大的变革。
陆勤_数据人网
2018-10-26
5390
【应用】信用评分卡:模型验证
我认为欣赏和享受琐事的最佳方式是旅行。当我说琐碎的时候,它包括门把手,海报,信箱,涂鸦以及我们从未在我们自己的城市中转过头来做的一切。上周我与妻子一起在佛罗伦萨和托斯卡纳旅行时经历了同样的经历。我认为一个人的意识水平和好奇心在旅行时会增加很多倍。在佛罗伦萨,我们住在Fiorenza,它可爱并有早餐。早餐很好,人们甚至更好。在那里,我们遇到了这个来自英国的友好家庭,一个名叫Owen的婴儿和他7岁的妹妹Kyra。欧文和凯拉在吃早餐时玩捉迷藏。凯拉反复躲在同一把椅子后面,跳出来向她的弟弟透露自己。欧文在这个过程中每次都感到惊喜。所有人都天生好奇。然而,随着年龄的增长和熟悉事物,他们会失去它。这种现象可能是我们永远不会为自己城市中的琐事而烦恼的原因。
陆勤_数据人网
2018-10-08
9010
【应用】信用评分卡:预测分析的业务整合
克里斯托弗·哥伦布 - 我在生命的各个阶段因各种原因而崇拜这个男人。七岁时,我很尊敬他,因为他的错误得到了掌声并成为了历史的一部分 - 哥伦布把美洲原住民错当成了印第安人,因为他认为他已经登陆亚洲而不是美洲。虽然我的错误被红色墨水圈起来并且被授予零,但我觉得那是不公平的 - 哦哥伦布,你这个幸运的混蛋!十七岁的时候,我很尊敬他,因为他是一个反叛者,因为他违背了对这个星球的普遍看法,并朝着相反的方向航行 - 哦哥伦布,你是不守规矩的!现在我觉得我对他的了解要好一点,我崇拜他,因为他设定了其他人可以遵循的方向。他不是第一个从欧洲到达美洲的人,尽管他不知道这一点。在他之前有其他人提到这一壮举。然而,他是那个使欧洲对美国敏感的人。目前,美洲的主要人口来自欧洲。很多人必须遵循哥伦布提出的指示 - 哦哥伦布,你的领导!
陆勤_数据人网
2018-10-08
5240
【应用】信用评分卡:高级分析
当一位年轻的商业分析师向我们讲述他最近回家的事件时,充满分析师的房间爆发出一阵响亮的笑声。 一位遥远的阿姨询问了他的新职业。 他的回答 - 我正在进行建模。 她兴高采烈地问道 - 它只是在坡道上还是我会在电视上看到你? 开玩笑,这让我想知道建模或模型这个词的根源。 什么是模型?
陆勤_数据人网
2018-10-08
5310
【应用】信用评分卡:逻辑回归
几年前,我和妻子在英格兰和苏格兰度过了几个星期的假期。就在登上英国航空公司的飞机之前,一名空姐告诉我们,我们已升级为商务舱。快乐!度假真是一个美好的开始。一旦我们登上飞机,我们又获得了另一个诱人的提议,可以进一步升级到头等舱。然而,这一次,有一个问题 - 只有一个座位可用。当然,这是一种耻辱,我们无法接受这个提议。在提供头等舱优惠之前,商务舱座位非常棒 - 顺便说一下,所有免费升级。这是行为经济学家描述为相对论和锚定的情况 - 用简单的英语比较。锚定或比较是企业定价策略的根源,也是所有人类悲伤的根源。然而,最终度假心情接管了,我们彻底享受了商务舱。人类在适应最终情况方面非常擅长并享受它。在最困难的情况下,你会发现一些最快乐的面孔。以下是亨利米勒的一句话:“我没有钱,没有资源,没有希望。我是最幸福的人“。人类的行为充满了异常 - 充满了谜题。以下是加强本论文的一个例子。
陆勤_数据人网
2018-10-08
8170
【应用】信用评分卡 : 变量选择
下面的故事可以追溯到我开始从物理到商业的转变。我在周五晚上的派对上遇到了这位投资银行家。喝完几品脱啤酒后,他的情绪变得有些阴沉,他告诉我他是如何讨厌他的工作。然而,他有一个计划知道工作到45岁退休。然后他会做一切让他开心的事情。我很困惑,那么一个人怎么能从一种情感(幸福)中摆脱这么多年,并在以后重新发现?我想知道幸福的秘诀 - 玫瑰上的雨滴和小猫上的胡须。一个人的幸福是一件棘手的事情;然而,我将在后面的关于逻辑回归的文章中尝试解决这个问题。现在,让我们尝试探索国家如何衡量其人民的集体福利。我将利用这一人口福祉主题来探索分析记分卡开发中的一个有趣话题:变量选择。
陆勤_数据人网
2018-10-08
7320
【应用】信用评分卡:分类问题
我必须说,当三岁以上的女孩Amishi宣布,她只是与我妻子的朋友而不是我交往时,我感到震惊。 分手的原因是我是男孩,女孩只能是女孩的朋友。 她从幼儿园的朋友那里学到了这种社会规范。 我还记得她几个月前在她的泳装和雨伞中为我塑造的方式。 她甚至意识到男孩女孩的差异,现在只是她学会了这个奇怪的社会规范。 这里的要点是,幼儿可以毫不费力地区分性别。 大自然为我们提供了一个内置的方程式,通过高度的精确性来进行性别分类。 想象一下类似的机制来区分好的和坏的借款人。 你在谈论每个银行家的梦想。
陆勤_数据人网
2018-10-08
5790
【应用】信用评分:端到端的开发过程
合理的“现在购买,稍后付款”是许多金融和零售公司为了增加客户群而向其客户提供的诱人服务。 但是,双方在进行信贷决策时需要了解风险。 贷款人和客户都很重要,即客户能够履行信贷义务,并在贷款期限结束时偿还购买欠款。 贷款人需要能够评估每个客户的违约风险,从而贷款人可以决定向谁提供服务。
陆勤_数据人网
2018-07-30
5370
【应用】 信用评分:第4部分 - 变量选择
“以少胜多”是信用智能的主要理念,信用风险模型是实现这一目标的手段。 通过使用自动化流程并专注于关键信息,信用决策可以在几秒钟内完成 - 并且最终可以通过使决策流程更快而降低运营成本。 更少的问题和快速的信贷决策最终会提高客户满意度。 对于贷方来说,这意味着扩大客户群,吸纳风险较小的客户并增加利润。
陆勤_数据人网
2018-07-30
7030
【应用】信用评分:第6部分 - 分割和拒绝推断
多少个评分卡? 标准是什么? 最佳做法是什么? - 是我们试图在评分卡开发早期回答的常见问题,从识别和证明评分卡数量的过程开始 - 称为分割。
陆勤_数据人网
2018-07-30
1.4K0
【算法】朴素贝叶斯法
朴素贝叶斯是一种简单但是非常强大的线性分类器,它在垃圾邮件分类,疾病诊断中都取得了很大的成功。
陆勤_数据人网
2018-07-30
3160
【数据】作为数据科学家应该学习的第一件事
根据30年的商业经验,下面的列表是我认为首先应该在数据科学课中讲授的(非全面的)内容选择。 这是我文章的后续内容为什么Logistic回归应该最后讲解。
陆勤_数据人网
2018-07-30
3240
【算法】机器学习算法的优点和缺点
从Logistic回归开始,然后尝试Tree Ensembles和/或Neural Networks。 奥卡姆的剃刀原理:使用最简单的算法,可以满足您的需求,并且只有在严格需要的情况下才用更复杂的算法。 根据我自己的经验,只有神经网络和梯度增强决策树(GBDT)正在工业中广泛使用。 我目睹Logistic回归和随机森林被弃用不止一次(这意味着它们是好的开始)。 从来没有人听说有人在公司中讨论SVM。
陆勤_数据人网
2018-07-30
1.9K0
【应用】信用评分:第8部分 - 信用风险策略
“行动是所有成功的基本钥匙(Pablo Picasso)。”Gartner的分析价值 escalator识别四种不同类型的分析 -** 描述性,诊断性,预测性和规定性** - 按难度和商业价值排序。规定性分析是最复杂的级别,但提供最大的价值,是该escalator的顶部。通过回答关键问题,“我们如何实现这一目标?” ,规定性分析以行动形式提供了商业成功的秘诀。在信用风险领域,这个问题的答案可以在信用风险策略中找到。
陆勤_数据人网
2018-07-30
8850
【数据】银行大数据
银行业日常产生大量数据。 为了区别于竞争对手,银行正在采用大数据分析作为其核心战略的一部分。 分析将成为银行关键的游戏变革者。 在这张信息图中,我们探讨了银行在业务中采用分析的方面。
陆勤_数据人网
2018-07-30
1.7K0
【应用】 信用评分:第7部分 - 信用风险模型的进一步考虑
以满足科学模型开发的主要标志 - 严谨性,可测试性,可复制性和精确性以及可信度 - 考虑模型验证以及如何处理不平衡数据非常重要。 本文概述了可用于满足这些标志的高级验证框架,并简要介绍了处理不平衡数据时常用的方法。
陆勤_数据人网
2018-07-30
6240
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档