首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1010641
阅读量
170
订阅数
金融科技:技术栈
数据库技术,泛指熟练使用SQL技术,不仅是各种关系型数据库的SQL,还有各种大数据平台的SQL,例如Hive-SQL、Spark-SQL等。 对于SQL技术这块,我们重点要掌握增删改查的四种操作,以及与编程语言的交互。 通过SQL技术,我们可以有效完成如下工作:
陆勤_数据人网
2022-01-20
9650
Python数据分析和可视化,提升Python和数据应用能力(可供下载)
我刚开始学习Python的时候,找了一本Python书籍,一边阅读,一遍抄写书中代码,并且对代码进行不同的“折腾”,充分地发挥自己的想象力,多问几个这段代码可以用来做什么,可以解决什么问题。
陆勤_数据人网
2020-08-13
4990
数据清洗(data cleaning)的重要性
之前经常和临床试验数据打交道,无论是来自手动录入的数据还是取自数据库的数据,在完成数据获取这一步后,感觉有80%甚至90%的时间和精力会用在做数据清洗(data cleaning)这一环节,即“增”“删”“查”“改”,通过data cleaning要让我们的数据成为可以进入模型的状态,也是就是清洁的数据(tidy data/clean data),过不了这一关,后面的建模就无法实现。
陆勤_数据人网
2020-06-28
1.9K0
PCA in Python
利用sklearn库的PCA函数对数据集做PCA,进行PCA之前,对数据集做scale处理。
陆勤_数据人网
2019-12-31
9590
【应用】从业务数据分析到机器学习应用的一次经历
本文通过一次完整的项目经历,从业务数据的分析开始,到产品优化建议,再到通过机器学习进行进一步的处理进行了比较完成的提炼。 腾讯电脑管家作为一款目前最流行的pc端软件之一,如何提升市场份额同时提升用户体验是我们一直在探索和考虑的问题。业务数据分析方面主要是考虑产品优化的建议;机器学习方面,特征构造、模型选型、ABtest等都有比较充分的描述和说明。希望能够对大家在数据分析的工作能有一定的启发,如有不足之处还望大家多指教。
陆勤_数据人网
2018-07-30
3690
【应用】Python做文本挖掘的情感极性分析
「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。
陆勤_数据人网
2018-07-30
1.6K0
【FinTech】金融服务业3种方式利用数据推动创新
企业每秒钟都会产生数据,而其中的一些数据可以帮助企业制定有关商业活动的数据支持决策,而其中大部分数据库将位于数据仓库中,永远不会再出现。 但是一些公司已经成为数据的主人,并且找到了使用数据的方法,不仅仅是为了创新,而是在其行业中创造变革。
陆勤_数据人网
2018-07-30
3930
【FinTech】Fintech机器学习,所有你必须知道的
金融世界处理统计数据和定量数字,使其成为机器学习(ML)的完美领域。 这种工程科学已经应用于医疗,旅游,媒体和零售等不同领域。
陆勤_数据人网
2018-07-30
7530
【数据】银行业9大数据科学应用案例
在银行业中使用数据科学不仅仅是一种趋势,它已成为保持竞争的必要条件。 银行必须认识到,大数据技术可以帮助他们有效地集中资源,做出更明智的决策并提高绩效。
陆勤_数据人网
2018-07-30
3.4K0
【数据】数据科学家喜欢Jupyter Notebook的10个原因
在过去的二十年中,Python越来越多地用于科学计算和数据分析。 今天,Python的主要优势以及它如此受欢迎的主要原因之一是它将科学计算功能带给了许多研究领域和行业中使用的通用语言。 这使得从研究到
陆勤_数据人网
2018-04-18
1.4K0
【职业】您为什么要成为数据科学家?
小编邀请您,先思考: 1 你认为数据科学家是做什么的? 2 你打算成为一名数据科学家吗? “为什么要成为数据科学?”,这是一个高频问题,答案也非常多。 有的说大势所趋,有的说薪水可观,有的说很有乐趣。
陆勤_数据人网
2018-04-18
1.5K0
【数据】即使不会爬虫技术,也能轻松获取的重要数据
小编邀请您,先思考: 1 对于具体的业务问题,如何做好数据准备? 很多做数据分析的同学,对数据的获取有一个误区,觉得在互联网上获取数据,必须通过爬虫进行爬取。殊不知,有些必须知道的数据,即使不会爬虫的技能,也可以轻松获取。 根据这些数据类型的不同,我把它们划分为实时数据、趋势数据以及关联数据,这里,我们先来了解一下,互联网上,有哪些基于地理位置信息的实时数据。 一、实时数据 实时数据,顾名思义,是事物当前状态的数据。更好的,经过整合的实时数据,可以为我们尽早地处理问题,提供最佳的契机。 那么,互联网上,有
陆勤_数据人网
2018-04-18
5K0
【算法】相似度计算方法原理及实现
小编邀请您,先思考: 1 相似度如何计算? 2 相似度有什么应用? 温馨提示:加入圈子或者商务合作,请加微信:luqin360 在数据分析和数据挖掘以及搜索引擎中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。常见的比如数据分析中比如相关分析,数据挖掘中的分类聚类(K-Means等)算法,搜索引擎进行物品推荐时。 相似度就是比较两个事物的相似性。一般通过计算事物的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。比如两种水果,将从颜色,大小,维生素含量等特征进行比较相似性。
陆勤_数据人网
2018-04-18
2K0
【数据】数据驱动决策的13种思维
小编邀请您,先思考: 1 如何让数据驱动决策? “数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上! 1. 信度与效度思维 这部分也许是全文最难理解的部分,但
陆勤_数据人网
2018-03-27
7070
【技能】数据科学家所需技能
小编邀请您,先思考: 1 您认为数据科学家需要具备哪些技能? 2 您擅长那些技能? 数据科学家所需具体技能,罗列如下: 1 数据分析技能 数据清洗 运用合适的统计知识和方法来分析数据 运用机器学习算
陆勤_数据人网
2018-02-28
6710
如何建立数据驱动文化
是什么驱使企业建立成功的数据驱动文化?未必是数据本身。这是次要的。技术本身排在第三位。数据驱动决策才是第一位的。 在向实施数据运维的数据驱动企业转变时,最重要也是最困难的是向数据心态的文化转变。这种转
陆勤_数据人网
2018-02-28
1.5K0
简明数据科学(3):你信吗?猜猜看哪!
原文:Data Science Simplified Part 3: Hypothesis Testing 翻译:大头 校对:Kaiser 著名的匈牙利裔美籍物理学家爱德华·泰勒曾经说过一段话: 真相
陆勤_数据人网
2018-02-28
6850
互联网金融风控7个问题
风控,大家心目中的风控是什么?我们先来点传统的解释 首先了解两个概念:风险管理和风险控制。 风险管理:是指如何在项目或者企业在一定的风险的环境里,把风险减至最低的管理过程。 它的基本程序包括风险识别、风险估测、风险评价、风险控制和风险管理效果评价等环节。 风险控制:是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或者减少风险事件发生时造成的损失。所以其实风险控制是风险管理中的一个环节。 下面是对前期在群内收集到的问题的解答。 1. 目前最常用的风控模型是哪些? 风控模型:常用于担保公司
陆勤_数据人网
2018-02-28
2.7K0
数据驱动运营案例
作者:腾讯大数据 全文共 6212 字,阅读需要 12 分钟 —— BEGIN —— 数据分析对于运营来说是一个数据抽象的过程。 现实情况是连续的、复杂的、互相影响的,而数据抽象的过程,就是将这些复杂多变的现实情况简化为数字量,搭建数据模型,计算相关因子,推断事件归因,并推进自身改进优化。 由于现实的复杂性,我们作为产品、运营或者数据分析师,在实际问题处理时,就需要做归因分析,需要屏蔽其他因子的干扰,因此我们常常使用用户分群。 分群后,我们的用户群可能简化为: 在每一个分群下,我们可以简化地对比某个
陆勤_数据人网
2018-02-28
1.8K0
机器学习和数据科学领域,最流行的语言是什么?
在开展数据分析项目或职业生涯规划时,应选哪一种编程语言?对此问题,不同职业背景的人给出的答案各不相同。让我们从数据角度来看看,人们在机器学习和数据科学方面所选的编程语言。 要想在机器学习或数据科学领域
陆勤_数据人网
2018-02-28
7850
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档