作者 CDA数据分析师 1992年,肉丝(Ross Ihaka)和萝卜特(Robert Gentleman)两个人在S语言(贝尔实验室开发的一种统计用编程语言)的基础上开始构思一种新的用于统计学分析的开源语言,直到1995年第一个版本正式发布(和各位年龄相仿)。因为他们名字的第一个字母都是R,所以这门语言就被叫做R。这两个人都是统计学教授出身,再加上R语言的生父S语言,所以R语言在统计学方面有着纯正的血统! 如果你平时的工作会涉及到统计学,那么接触R语言实在是太正常不过了。因为R语言本身为统计而生,
文|英途途友玉器贷副总裁王金伟 2015年8月,英途邀请平安、宜信、玖富、景林等互联网金融领先公司到硅谷进行考察。一周时间,对话了近20家网贷、众筹、金融服务、移动支付和金融大数据等领域的创新企业,如LendingClub、Prosper、Sofi、Better Finance、Funding Circle、ZestFinance、Bitpay等。 与其他平台相比,Monja的定位在专注于机构投资者和投资分析方面,与我们在之前提到过的更加专注于交易的Orchard形成很好的互补,因此不排除作为Orch
法律大数据专题文章计划: 《大数据解读2014年中国裁判文书公开》系列文章,通过业界领先大数据分析技术,对公开裁判文书大规模分析、统计,在全量数据基础上对裁判文书公开情况量化评估。本系列文章具有尝试研究性质,文章的数据全部来自互联网公开数据,所得结论仅用于研究讨论目的,本文的评价依据均来自数据,不代表本文作者及作者所在机构立场。 本文大数据技术源自法海风控网(http://www.fahaicc.com)、法数研究平台(http://www.falvdata.com)的技术底层:天罗采集系统、无量存储系统
專 欄 ❈Rho,Python中文社区专栏作者,现居深圳。知乎专栏地址:https://zhuanlan.zhihu.com/BecomingaDataScientist❈ 项目介绍 所谓探索性数据分析(Exploratory Data Analysis,以下简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。特别是当我们对这些数据中的信息没有足够的经验,不知道该用何种传统统计方法进
数据分析是产品经理的一项重要能力,但不意味着产品经理要懂得多高深的统计学知识,要会用专业的数据挖掘工具。产品经理需要具备的数据分析能力是一种在深度理解业务的前提下,利用数据来指导业务增长的思维。
本次分享主要讲mongodb 在互联网金融中交易与非交易部分如何实践,金融行业涉及哪些注意点,又踩过的坑。 什么是P2P P2P是一种网上的借贷模式,放款人可以通过P2P公司选择认为比较靠谱的借款人进
我有一个风一样的名字, 我写风险管理, 也写数据分析, 他们都叫我, 风析人。 本系列是关于风险管理, 也是关于数据分析的。 【风·析】第一文:风险管理与数据分析 1 风险管理和数据分析 风险管理,是金融各领域中与数据分析关系很大的一个方向。风险本身可看做是一种波动,损失的发生又依赖一定的概率,这就意味着,统计学里的分布、大数定律、期望、方差,在风险管理中都会派上用场,而这些东西的载体又是数据。 尤其是近年来大数据技术的发展,我们常常能听到大数据用于欺诈检测、风险预警、信用评级,这些都与数据有
网址:http://www.kesci.com/apps/home_log/index.html#!/competition 一. 动机与问题背景 P2P网贷平台在2007年乘着互联网浪潮引入国内,2
数据猿导读 无论B2B还是B2C公司希望通过数据驱动业务增长,其中B2B领域中,在数据驱动下的B2B领先企业的收入增长能力是普通企业的5倍、盈利能力高8倍、股东整体回报率高2倍。因此,数据驱动能力正在
随着区块链技术的逐渐推广,越来越多的人了解到了区块链。很多人都能说出区块链的一些特点:去中心化、防篡改、安全可信等等。然而,很多情况下,区块链的这些技术特点都是具有局限性的。现在很多人也已经意识到了,为了性能方面,很多区块链技术在向中心化妥协;区块链的防篡改只是增加了篡改的难度和代价;区块链的安全仅仅是能够抵抗拜占庭容错,而整体安全还需要全方位的保护;等等。
数据分析更多地基于业务背景来解释数据,提取和汇总数据背后的隐藏信息以及查找有价值的内容。由于数据在此过程中是客观的,因此由人来负责。由具有相同数据的不同人解释的结论可能不同,甚至完全相反,但是结论本身并没有错,因此,从客观数据到主观的人,我们需要一些科学的分析方法作为桥梁,以帮助数据信息更好,更全面,更快地去传递。
注:本公众号去年曾发表过一篇倪雪华的《三个月,从化工实验员到数据分析师》。讲述了作者通过自身努力完成行业转换的经历,并对入行数据分析所需技能和知识做了介绍。 入行后,雪华同学的职场之路突飞猛进。本文就
大数据不仅可以帮你看到城市顽疾,还可以做很多你想不到的事情。比如,互联网金融。来自感知城市数据科学研究院、交大OMNILab实验室的这个作品,就研究的是2015年末2016年初各种跑路的P2P。另外,本文还说到了这个团队的另一个作品——预测上海踩踏事件。
互联网理财 P2P 金融 恶意目的骗贷、骗保、洗钱? 企业面临欺诈风险? 用我们的沉淀,给企业足够的“安全感” 腾讯云发布天御反欺诈服务 随着互联网理财、P2P 金融的快速发展,带有恶意目的的骗贷,骗保、洗钱等恶意行为也形成了新的地下产业,这些黑色产业链给企业品牌带来了严重的经济损失,尽管采取了一些办法来防范,但是由于欺诈产业分工明确、行为隐蔽使得企业很难及时发现这些恶意用户。 基于企业的痛点,腾讯云通过大数据分析能力,以及在对抗社交诈骗、电商刷单、保驾互联网银行和支付业务安全上累积的实战经验,发布天御反欺
数据分析从业这么多年,既有庆幸也有焦虑,庆幸的是能进入互联网行业,吃到行业红利从而有一个较高的起薪,焦虑的是数据分析的门槛并不高,而且有明显的职场天花板。
摘自:36氪(ID: wow36kr) 这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战。倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无遗。所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇。 Joyce Zhang 就是这些人中的一个。Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理。在来宜信之前,Joyce 曾经服务过 Hulu、M
首先从构建数据指标体系说起,一个成熟项目的指标体系往往经过前人的构建和完善后,已经非常成熟,不必从0开始构建产品的数据指标体系。但产品经理必须具备从0开始构建数据体系的能力,因为在职业生涯中一定会有接触新产品的时候,即便是同一产品在不同的生命周期重点数据指标也可能不一样。
眼下,在我们生活周围环绕着各种大数据,但很多人对大数据还是一知半解。有人甚至觉得,大数据分析是计算机系、统计系学生才学的技术课程,商学院的学生如果学习大数据分析,肯定不如他们做得好。事实真是这样的吗? 数据本身是中性的 如果手头有海量的信用卡消费数据,可以用来做什么?通常的想法是,这些数据可以给消费者的信用打分,判断是否提高其信用额度。但你有没有想过,可以用这些数据来炒股赚钱呢? 美国第一资本投资国际集团曾经发生过这样的事情:2名分析师利用公司掌握的信用卡消费数据分析了至少170家上市零售公司的销售情况,
Fintech=Fin(金融)+Tech(技术性),Fintech的定义有很多,华尔街俱乐部对Fintech的定义是运用新技术给金融领域带来创新的技术和公司,大致涵盖数字支付和钱包、P2P借贷平台、机器人理财/智能理财、机器学习和云计算、金融征信、金融信息提供平台、Miscellaneous等领域。
点击标题下「大数据文摘」可快捷关注 摘自:36氪(ID: wow36kr) 这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战。倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无遗。所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇。 Joyce Zhang 就是这些人中的一个。Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理。在来宜信之前
随着互联网渗透到生活中的各个角落,金融行业也似乎找到了与互联网的完美结合。互联网金融作为一个新的行业如今正在上升的势头上,因而也涌现了越来越多的P2P公司。但是作为一个互金公司来讲,风险永远是一个最重要的话题。那么如何利用机器学习以及大数据技术来降低风险呢?如何建立信用评分的模型呢?
数据收集能力-->数据处理能力-->逻辑思维框架-->数据可视化-->行业/业务理解
与美国相比,中国的互联网金融行业规模更大,在一些技术领域比如支付处置能力等也更领先。这主要是基于三个方面的原因:市场空白大、技术发展快和监管适度。互联网金融行业的普惠性也十分突出。但行业发展不平衡,比如第三方支付相对发达,网络贷款比较混乱、股权众筹基本没有做起来。未来互联网金融企业的发展可能会呈现多样化,既有大而惠,也有小而美;既有专注tech,也有直接做fin。 美国的监管框架,一方面消除了金融科技领域的一些潜在风险,另一方面也极大地限制了这个行业发展的空间。显然,在风险控制方面,我们应该向美国学习。但我们也应该为互联网金融的发展留下足够的空间。客观地看,互联网金融的发展实实在在地满足了实体经济的一些需求,在助力普惠金融发展方面的作用尤其明显。同样,如果对数据管制过严,大数据分析就无从谈起,但如果听任商业机构任意侵犯个人隐私,也会酿成严重后果。 因此,监管政策的核心是要平衡创新与稳定之间的关系,既保证互联网金融行业的快速发展,又不造成重大的金融、社会风险,起到真正支持实体经济的作用。
2017年1月16日,全球金童科技的发展站趋势全球执委电话委会(939会议)在波士顿召开。 本次会议的主讲人张越女士是波士顿咨询公司(BCG)的全球合伙人兼董事总经理。她将从以下这五大方面讨论全球金融科技: 当我们讲‘金融科技’的时候, 哪些‘科技’需要关注 技术在金融行业扮演了哪些角色? 全球金融科技发展现状和重点商业模式 金融机构如何应对金融科技带来的变化 金融科技在保险行业的发展概述 以下是张悦女士演讲的主要内容,完整PPT可在后台(订阅号-大数据文摘-输入关键字)回复关键字“张越”下载。 当我们
本文共5000字,建议阅读时间10分钟 本讲座选自杨子君博士于2015年6月5日在 RONG 系列论坛之四——大数据与诚信社会研讨会上所做的题为《征信和信用评估——中美比较分析》的演讲。 嘉宾介绍: 杨子君:清华大学电子工程系学士和硕士,美国南加大电子与计算机博士,瑞天欣实数据科技公司创立人之一,之前为全球征信Experian公司首席科学家,以及FICO的高级数据科学家,她是信用风控体系、金融产品和数据分析建模专家,拥有16年数据挖掘和分析行业经验。 她带领瑞天团队为多家国内知名股份制银行、商业银行、消
如果有一天你可以预测未来,你要做的第一件事情是什么?买彩票?第二件、第三件事情呢? 先卖个关子,我们后面再说这件事情。 大数据是个产业,广义上指的是在这个信息过载时代围绕着海量信息产生、传播、收集、处理、创造价值的整个产品链条;狭义上一般指大数据存储与处理、数据挖掘的相关产业。目前市场上利用大数据最多的一般在于分析和预测。 根据笔者10年来在这个行业的从业经验,大数据与前两年的云计算、再往前的网格计算、并行计算都是相同产业链上几个环节,它是作为概念被媒体和从业者炒作起来的。但不可否认的是,我们的社会正处于信
文:罗超 如果让一个人指出自己所在城市的缺点,大都会包括一点:堵车。究竟是北京还是上海更堵车?在过去这很难有确切的答案。最近一份来自地图厂商高德的《交通报告》回答了这个问题:三季度北京成为最拥堵城市。
殷剑锋:非常荣幸能够在这里跟大家分享我们最近的一点研究心得。 现在,互联网金融是非常时髦的词汇,从年初开始,我们一直在跟踪研究,研究来研究去,反正就那点内容,整个思路在其他场合也说过。我的题目是“互联网金融,究竟是互联网金融还是大数据金融”。 互联网金融有三种主要形式:第一,从电子商务中诞生的金融业务;第二,基于网络平台的筹资和融资模式;第三,互联网是一种金融产品的销售渠道,我们称之为网上金融超市。 第一种模式,基于电子支付的,从电子商务进入金融行业,以阿里为典型,阿里能够做金融,其中很重要的
选文编译:钟云岚,Shawn 校对: Cody,Helen 素材来源:https://www.cbinsights.com/blog/major-banks-fin-tech-startup-investment-trends/ 编者按:在一次高盛高层交流的采访中,高盛技术部的负责人Don Duet表示公司正逐渐加大对人工智能和机器学习领域的投资。“是的,我们发现提取数据并将其信息转换为资产的能力是我们的战略计划中至关重要的一部分。”他如是说道,“技术策略和商业策略对于一个公司来说是同等重要的,这可以帮助我
数据库(database)是按照数据结构来组织,存储和管理数据的建立在计算机存储设备上的仓库。 数据库是长期存储在计算机内,有组织的,可共享的数据集合。数据库中的数据指的是以一定的数据模型组织,描述和 存储在一起,具有尽可能小的冗余度,较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。 常用的数据库有mysql,oracle,sqlserver等。作用不一样,数据库是用来支撑业务(1)的,需要响应速度特别快,没 有延时,查询起来都是一条条查询,把相关的数据全部得到,适合用这种关系型数据库。数据仓库主要用来支撑分析的。 问题:公司的多个部门,对相同的数据描述会不一样,在汇总的时候会出问题。
作者:沈艳 介绍:北京大学国家发展研究院教授 来源:北京大学国家发展研究院 本文从谷歌流感趋势2009年前后表现差异谈起,讨论了大数据分析容易面临的大数据自大、算法演化、看不见的动机导致数据生成机制变
微博足迹可视化:http://vis.pku.edu.cn/weibova/weibogeo_footprint/index.html
本文从谷歌流感趋势2009年前后表现差异谈起,讨论了大数据分析容易面临的大数据自大、算法演化、看不见的动机导致数据生成机制变化等陷阱,以及对我国大数据产业发展的借鉴。本文认为,为健康发展大数据产业,我国需要防范大数据自大风险、推动大数据产业和小数据产业齐头并进,并强化提高大数据透明度、审慎评估大数据质量等方面的努力。
现在P2P借贷领域的许多人,包括我自己,都喜欢使用借贷平台提供的大数据来分析趋势和帮助自己更好地了解借款人,以及分析他们的行为,从而来控制我们在 P2P借贷市场上的风险。借贷平台的网络属性使得许多早期的零售投资者是以技术为导向,因此一直存在着一种误解就是,要想成为一名成功的投资者,你需要学 会了解并利用大数据。如果你愿意自学一些信贷和金融技术来帮助你在P2P借贷领域做出更好的投资决策,你就会知道事实并非如此,而且可谓是大错特错 大数据并不能解决所有问题,你需要了解在关于大数据在P2P借贷
今天,科技几乎影响了我们生活的方方面面,科技的发展催生出互联网金融的出现,而互联网金融会影响我们管理资金和投资决策。 我们使用网络银行,我们通过智能手机进行支付,我们通过众筹活动筹集资金,我们投资于P2P贷款,我们通过基于算法比较的平台为我们选择最佳的贷款和抵押产品。 互联网金融逐渐成为我们日常金融活动的内在组成部分。互联网金融领域的创业企业不仅提供更高效且用户更友好的金融服务,而且互联网金融为中小型企业提供新的融资渠道,数字会计系统和人力资源管理平台,数据分析和安全工具以及新的支付解决方案。 以下信息图
除非您是专家,否则物联网(IoT)和万物互联(IoE)之间没什么区别。然而,后一个术语在语义上更广泛。在这篇文章中,我们将详细解释为什么物联网软件开发公司很少使用术语IoE。
1)题目: 【区块链技术工坊23期】工业互联网领域的边缘计算与区块链实践 2)议题:
数据分析专家谢士晨做客数据猿,听听这位日本名古屋大学博士都说了些啥?
百度ECharts:http://echarts.baidu.com/ Cytoscape:http://www.cytoscape.org/ 图表秀:http://www.tubiaoxiu.com/ 数据观:http://shujuguan.cn/ 微博足迹可视化:http://vis.pku.edu.cn/weibova/weibogeo_footprint/index.html BDP个人版:https://me.bdp.cn/home.html ICHarts:http://www.icharts.in/ 魔镜:http://www.moojnn.com/
JavaEE课程概述 阶段 知识点概述 能解决的问题 市场价值 Java基础阶段 计算机基础知识编程基础面向对象 异常图形化界面 常用类介绍集合 IO多线程网络编程 数据存储 综合案例 学生具备javase 本地应用开发能力能够在本机开发一些应用软件例如:压缩软件、下载软件、聊天软件、模拟DOS系统、综合信息管理软件 ¥5000 JavaWeb+SSH框架阶段 HTML CSS JavaScript JQueryBootStarp响应式页面MySQL JDBC服务器端技术:WEB通信、T
EasyNVS是TSINGSEE青犀视频开发的管理平台,与视频安防智能监控系统的接入,不仅可以让EasyNVS获取系统的全部能力,还可以对各地部署的系统进行统一管理。区别于市场上其它的视频大数据运营产品,EasyNVS云管理平台具备众多独特优势特性:包括通过设备端简单的接口调用,可快速实现设备及平台接入,有效缩短开发周期。利用高效、智能的P2P穿透技术和分布式转发技术,支持视频秒开呈现。
随着互联网与金融的不断融合发展,互联网金融早已成为当下最热门的话题之一。那么,什么才是互联网金融?在大数据时代,互联网金融将会呈现怎样的面孔?现在就让数据猿编辑为你解说。 作者 | 张宏 本文长度为2200字,建议阅读4分钟 随着互联网与金融行业的不断融合发展,互联网金融早已成为当下最热门的话题之一。那么,什么才是互联网金融?在大数据时代,互联网金融将会呈现怎样的面孔?我想很多人都对这些问题有点疑惑,在此数据猿编辑将为您详细解说。 互联网金融最早的概念提出者谢平教授认为,以互联网为代表的现代信息科技,特
DT时代 数据就是变量 何谓“数据×”?即乘数效应。在中国经济新常态大背景下,我们以大数据应用为战略引领,实现了从“互联网+”到“大数据×”的融合效应,打通大数据成果向现实生产力转化的通道。 我国大数据产业离爆发期为期不远,目前正是大数据产业的上升发展期,国家提出的“互联网+”政策暖风又起到了一定的推动作用,无论是产业资本、企业科技投入,还是政府应用大数据服务国计民生,我认为,目前阶段应该是进入到大数据领域最好的时间。——北京明略软件系统有限公司技术副总裁,金融事业部总经理 周卫天:金融时代已经来临 与
对于国内数据分析市场,我们感觉如下: 1. 市场巨大。 许多企业(无论是互联网的新锐还是传统的企业)都在讨论这个,也有实际的需求并愿意为此付钱,但是比较零碎尚不系统化。目前对数据需求最强烈的行业依此是:金融机构(从基金到银行到保险公司到P2P公司),以广告投放及电商为代表的互联网企业等。 2. 尚没出现平台级公司的模式(这或许往往是大市场或者大机会出现之前的混沌期)。 3. To B服务的氛围在国内尚没完全形成。 对于一些有能力的技术公司,如果数据需求强烈的话,考虑到自身能力的健全以及数据安全性,往往不会外包或者采用外部模块,而倾向于自建这块业务。 4. 未来BAT及京东、58和滴滴打车等企业,凭借其自身产生的海量数据,必然是数据领域的大玩家。 但是整个行业很大而且需求旺盛,即使没有留给创业公司出现平台级巨型企业的机会,也将留出各种各样的细分市场机会让大家可以获得自己的领地。 对于数据业务,按照我们的理解,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。(数据挖掘业务又被细分为分析、理解及存储。)下面会进行简单介绍,其实从我们的业务也可以看到一些整个行业的大致状况。
导读:本文就给大家推荐一些用于数据分析的“必备神器”,其中很多工具是亲测过认为非常强大的,希望大家能从中找到对自己有帮助的工具。 1.微信大数据分析工具 新榜:http://www.newrank.cn/ 清博:http://www.gsdata.cn/ 数说故事:http://www.datastory.com.cn/ 2数据可视化工具 百度ECharts:http://echarts.baidu.com/ Cytoscape:http://www.cytoscape.org/ 图表秀:http://ww
“失控”体系下的互联网金融 互联网的快速发展,给我们的生活带来了诸多便利,也改变了我们的传统生活模式。如同凯文·凯利在《失控》一书中所描述的,网络的出现,宣告着乌合之众登上历史大舞台,原来只能“一将功成万骨枯”的炮灰生命其历程或将从此改变。网络的出现极大改变了社会之间的关系,在这样一个类似于神经网络架构的社会中,无数“神经元”通过传递汇聚信号形成较为统一的“命令”而控制“躯体”的“运动”,它们通过不断发散又不断汇聚信息的机制,成就了无数个体思维的综合而成的群体智慧进而造就统一的群体活动。 网络已经深入到我们
量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人用户展示经济财务等状况,撮合金融机构为用户提供最优质的贷款服务。金融的本质是风险和流动性,但是目前中国对于个人方面的征信行业发展落后于欧美国家,个人消费金融的需求没有得到很好的满足。按照央行最新数据,目前央行征信中心的数据覆盖人口达到8亿人[1],但其中有实际征信记录的只有3亿人左右,有5亿人在征信系统中只是一个身份证号码。此外,我国还有5亿人跟银行从来没有信贷交易关系,这5亿人对金融部门来说是陌生人。这样算下来
从今天起,小C会开始每天推送一篇数据分析在各个行业的应用。大家有好的文章也欢迎推荐给我们。共同学习,一起进步。 1 “失控”体系下的互联网金融 互联网的快速发展,给我们的生活带来了诸多便利,也改变了我们的传统生活模式。如同凯文·凯利在《失控》一书中所描述的,网络的出现,宣告着乌合之众登上历史大舞台,原来只能“一将功成万骨枯”的炮灰生命其历程或将从此改变。网络的出现极大改变了社会之间的关系,在这样一个类似于神经网络架构的社会中,无数“神经元”通过传递汇聚信号形成较为统一的“命令”而控制“躯体”的“运动”,它们
领取专属 10元无门槛券
手把手带您无忧上云