首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1016295
阅读量
170
订阅数
基于Python的语料库数据处理(三)
在执行某个语句前,我们可能需要对某个条件进行判断,并根据条件判断的结果来决定是否执行该语句。这时就需要使用条件判断if。
陆勤_数据人网
2020-12-14
6170
基于Python的语料库数据处理(二)
语料库处理中,Python语言的字符串运算主要是将词语、句子连接起来,或者将词语、句子重复若干次,如:string1+string2(两个字符串相加),string*n(将该字符串重复n次),具体示例如下:
陆勤_数据人网
2020-11-11
8220
员工流动分析和预测
公司员工,是一家公司成长和发展的关键要素之一。留不住优秀的员工,也就难以打造出卓越的公司。很多公司,比方说,惠普公司,IBM公司等,已经采用数据科学的手段,对内部员工的流动做分析和预测,并且进行提前的干预,以最小化员工流动所带来的的影响。
陆勤_数据人网
2020-11-03
1.2K0
【智能】机器学习强化Fintech
如今,广泛应用于银行业务和金融业务的大数据分析技术几乎不会让任何人充分意识到这个问题。
陆勤_数据人网
2018-07-30
4000
【FinTech】Fintech机器学习,所有你必须知道的
金融世界处理统计数据和定量数字,使其成为机器学习(ML)的完美领域。 这种工程科学已经应用于医疗,旅游,媒体和零售等不同领域。
陆勤_数据人网
2018-07-30
7610
【数据】数据驱动业务的七种类型
我们总说数据驱动业务,可平时看到的,却总是业务部门追着数据部门屁股要数据。哪里是驱动业务了,分明是被人牵着鼻子走啊!很多同学都有类似的疑惑:到底数据分析对企业有什么用?我的数据用到什么地方去了。最关键的:如果数据都对企业没用,我的岗位还值钱吗?数据当然会驱动业务,只是在不同的企业发挥作用的形式不一样。今天我们一起来看一下,数据驱动业务的七种类型。看看你们企业是哪一种。 奴隶监工 类型一 数据驱动业务,最直接的形式就是给业务下KPI。你,今年销售要破千万!你,今年销售要破一个亿!类似的场景我们可能早就有耳闻。
陆勤_数据人网
2018-03-27
9620
【数据】数据预处理
小编邀请您,先思考: 1 数据预处理包括哪些内容? 2 如何有效完成数据预处理? 数据的质量和包含的有用信息量是决定一个机器学习算法能够学多好的关键因素。因此,我们在训练模型前评估和预处理数据就显得至关重要了。 数据预处理没有统一的标准,只能说是根据不同类型的分析数据和业务需求,在对数据特性做了充分的理解之后,再选择相关的数据预处理技术,一般会用到多种预处理技术,而且对每种处理之后的效果做些分析对比,这里面经验的成分比较大。 一. 为什么要预处理数据 现实世界的数据总是或多或少存在各种各样的问题,
陆勤_数据人网
2018-03-27
1.5K0
人工智能技术在移动互联网发展中的应用
智能化需求体现在两个方面 随着移动互联网的发展进入新的方向,移动互联网中的智能化已经成为新的发展趋势和主要需求。智能化需求目前主要体现在两个方面: 一方面是促生新的智能化应用,如自动驾驶汽车、虚拟现实和增强现实应用等,拓宽移动应用领域为用户提供更多应用选择。 另一方面是基于目前已有的大量应用数据进行智能化分析,在现有移动应用的基础上分析用户需求、明晰用户目标、提供用户感受,让用户在固有移动应用领域体验提升。 在智能化引领发展的阶段中,人工智能技术正在越来越广泛地应用在移动互联网领域,越来越多的人工智
陆勤_数据人网
2018-02-28
2.1K0
如何成功实现数据治理
如果你处理过大量数据,你也许听说过“数据治理”一词,你可能会想,它是什么?适不适合你?如何实施?简单来说,数据治理就是处理数据的策略——如何存储、访问、验证、保护和使用数据。数据治理包括制定获取方案:
陆勤_数据人网
2018-02-28
1.7K0
人工智能技术在移动互联网发展中的应用
随着移动互联网的发展进入新的方向,移动互联网中的智能化已经成为新的发展趋势和主要需求。智能化需求目前主要体现在两个方面: ●一方面是促生新的智能化应用,如自动驾驶汽车、虚拟现实和增强现实应用等,拓宽移动应用领域为用户提供更多应用选择。 ●另一方面是基于目前已有的大量应用数据进行智能化分析,在现有移动应用的基础上分析用户需求、明晰用户目标、提供用户感受,让用户在固有移动应用领域体验提升。 在智能化引领发展的阶段中,人工智能技术正在越来越广泛地应用在移动互联网领域,越来越多的人工智能技术更多地参与到移动互联网发
陆勤_数据人网
2018-02-28
9470
数据应用:运营商大数据应用的思考
作者:中国移动研究院大数据与IT技术研究所的段翔 首先大数据我们知道这个时代正在来临,这里有一个调查,随着全球移动互联网和工业和生活数字化的进程,数据现在成为一个比较加速爆炸式增长。我们看这个调查报告
陆勤_数据人网
2018-02-28
1.1K0
【ETL技能】白话数据仓库 ETL 搭建全过程
经过多年来企业信息化建设,大部分都拥有了自己的财务,OA,CRM 等软件。这些系统都有自己的独立数据库,记录着企业运行情况某个方面的数据。但是单独看这些系统的报表,并不一定能对企业运行情况有全面客观的了解。就像只凭身高不能判断一个人是否健康,所以体检的时候我们需要化验许多指标,做各种检测,就是为了对身体情况有更全面的了解,作出更准确的判断。 同样对一个企业,不能仅根据出勤率就判断一个人的绩效高低,因为你不知道他的工作成果情况。仅根据财务报表输入支出也体现不了各部门的收益情况,这个部门有多少工作人员,完成了哪
陆勤_数据人网
2018-02-27
2.5K0
【Spark研究】极简 Spark 入门笔记——安装和第一个回归程序
现在的各种数据处理技术更新换代太快,新的名词和工具层出不穷,像是 Hadoop 和 Spark 这些,最近几年着实火了一把,但自己一直没精力和时间去尝试和学习。特别是听说这些工具配置起来比较复杂,就更懒得去折腾。在这一点上,果然是不如从前了。 然而绝知此事要躬行。即使将来不一定会花大功夫在这上面,但对它们有些基本的了解总是好的。听说 Spark 有一段时间了,但一直是只闻其名不见其实,今天就来简单记录一下初学 Spark 的若干点滴。 Spark 是什么 按照 Spark 官方的说法,Spark 是一个快速
陆勤_数据人网
2018-02-27
9260
【数据科学】什么是数据科学家与数据科学
仅仅在几年前,数据科学家还不是一个正式确定的职业,然而一眨眼的工夫,这个职业就已经被誉为“今后十年IT行业最重要的人才”了。 一、数据科学家的起源 “数据科学”(DataScience)起初叫”datalogy “。最初在1966年由Peter Naur提出,用来代替”计算机科学”(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言,包括今天那些必不可少的软件工程工具的原型。图灵
陆勤_数据人网
2018-02-27
1.5K0
【机器学习】不平衡数据下的机器学习方法简介
机器学习已经成为了当前互联网领域不可或缺的技术之一,前辈们对机器学习模型的研究已经给我们留下了一笔非常宝贵的财富,然而在工业界的应用中我们可以看到,应用场景千千万万,数据千千万万但是我们的模型却依然是那些,在机器学习的应用中对数据的处理与分析往往扮演着比模型更加重要的角色,本文针对机器学习应用数据处理的一个方面即“不平衡数据”下的机器学习方法进行了简单介绍。 引言 不管是在学术界还是工业界,不平衡学习已经吸引了越来越多的关注,不平衡数据的场景也出现在互联网应用的方方面面,如搜索引擎的点击预测(点击的网页往往
陆勤_数据人网
2018-02-27
1.5K0
【Spark研究】用Apache Spark进行大数据处理之入门介绍
什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。 首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。将Hadoop集群的中的应用在内出中运行速度提升100倍,甚至
陆勤_数据人网
2018-02-27
1.8K0
【数据科学家】如何成为一名数据科学家?
一、数据科学家的起源 “数据科学”(DataScience)起初叫”datalogy “。最初在1966年由Peter Naur提出,用来代替”计算机科学”(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言,包括今天那些必不可少的软件工程工具的原型。图灵奖被认为是“计算科学界的诺贝尔奖”。) 1996年,International Federation of Classific
陆勤_数据人网
2018-02-27
7350
【Python环境】Python Anaconda简介及安装
Python虽然是一门优秀的程序语言,但其拥有出色的数据处理能力,尤其是在数据量巨大的时候,因而也吸引了不少数据分析人员的关注和使用。 Python的数据处理能力主要依赖于NumPy,SciPy,Matplotlib,Pandas这4个库,其中NumPy提供了矩阵运算的功能,SciPy则在NumPy的基础上添加了许多科学计算的函数库,而这两个库就使Python具有和Matlab一样的数据处理能力了。Matplotlib库提供了绘图,可以实现数据的可视化,pandas是基于NumPy的一种工具,该库提供了高效
陆勤_数据人网
2018-02-26
9060
【数据分析】数据分析中的六脉神剑
了解数据分析 1定义 · 数据分析是什么? 简单地说就是利用有限的数据通过发散的思维,利用相关关系来解释你想知道的问题。 2目的 · 数据分析干什么? 把隐藏在一对杂乱无章的数据背后的信息集中、萃取和
陆勤_数据人网
2018-02-26
9670
【数据分析】Intel研究院院长吴甘沙:大数据分析师的卓越之道
吴甘沙 Intel中国研究院第一位“首席工程师” Intel中国研究院院长 亲爱的各位同仁,各位同学,早上好。讲到大数据,就要问数据分析师应该做什么?所以我今天的标题是大数据分析师的卓越之道。这里不一
陆勤_数据人网
2018-02-26
8010
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档