首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用python爬取人人数据

人人网站需要用户登录才能看到其相应的借贷人信息。也就是说在爬取数据时,需要用户登录。回顾之前的代码,我想是保存cookie这种方法是不能用了。必须找到一种新的方法来模拟登录网站。...查了许多资料,数据捉取无外乎有3种方法: 1.直接抓取数据。 2.模拟浏览器抓取数据。...vb_login_username'] = '你的用户名' br['vb_login_password'] = '你的注册密码' 这段代码中老是遇到问题,第一,select_form中的nr怎么找,第二,在人人网站源代码中如何找所谓的...前面废话说了一堆,都是我学的比较菜,也就是我的经验之谈。 2.selenium包的尝试(重点) 首先你得安装好它,直接pip install selenium即可。...相应数据图展示: ?

1.7K50

P2P用户数据分析——以拍拍为例

近两年P2P行业风云变幻,雷声不断,不巧前几日我也中招,之前给亲戚介绍的P2P平台出现到期未还款的现象,吃惊之余赶忙给平台客服打电话,被告知借款人逾期,目前正加紧催收。...在当前经济下行压力增大的环境下,P2P行业风险日益暴露,加之备案一拖再拖,P2P平台举步维艰。...本期“品玩SAS”我们就深入研究下P2P平台的用户情况,以期对P2P的参与者有一个清晰的认识。...,是国内首家P2P平台,2017年11月10日,拍拍在美国纽约证券交易所上市。...2 数据介绍 本文以拍拍2015年1月1日至2017年1月30日的328553条贷款数据(该时间段10%的真实数据)为研究对象。

3.8K31
您找到你想要的搜索结果了吗?
是的
没有找到

互金协会P2P大数据揭示的趋势

虽然部分平台数据披露不够完整,但是这一百多家平台几乎囊括了行业最优秀的平台,大量数据依然值得分析。...数据来源:中国互金协会、麻袋研究院 3、在余额与累计借贷金额不相关 从在余额与累计借贷金额所呈现的散点图可知,各平台这二者相关系数仅0.3,并不呈现明显的相关性。...数据来源:中国互金协会、麻袋研究院整理 从历史数据看,陆金服可谓一枝独秀,几乎没有受到各种现金政策、政策的影响。...你我(2017.6)、翼龙(2017.5)、点荣金融(2017.5)、团(2017.5)、红岭创投(2017.5)、宜信惠民(2017.4)等与首次登记披露相比,在余额变化不超过6%。...增幅最慢的是信普惠,累计增幅仅7.8%,平均每月增长率不到1%。

66820

遭遇巨头联合绞杀,中小征信机构如何切入P2P

而在这个千亿级别的征信市场上,P2P自然成为首当其冲的战场,各方玩家也已做好持久战的准备,巨头们大刀阔斧招招致命,中小征信机构面对层层绞杀该如何成功突围,恐怕唯有另辟蹊径方能另寻生机。...美国的三征信机构收集统计最多的也是信贷征信数据,甚至没有个人消费数据、通信数据、社交数据。即便有部分通信数据,也只是通信付费状况的履约数据。...传统征信公司更受地域限制,如鹏元、上海资信等作为地方性征信平台,数据主要集中在各自所在的区域,但P2P平台业务却分布在全国。...另外我国多数平台都涉及企业经营借贷业务等多种业务,征信机构为适应我们平台的业务多元性就会放弃如人人、拍拍等垂直的P2P平台,市场亟需专注垂直于P2P领域,具有个性化差异化的征信产品和体系。...巨头们的征信体系可能可以利用掌握的数据来反映个人的信用特征,但如何搭建在这个过程中的对错误认定的纠错机制和形成完善的征信体系就可以成为中小征信的入口。

32930

如何用社交数据做了微粒【腾讯工程师干货分享】

在WOT”互联网+”时代大数据技术峰会上,来自腾讯数据挖掘高级工程师刘黎春做了以《社交数据在征信领域的应用探索》为主题的演讲,在该演讲中他透露了腾讯如何利用社交数据开发个人信用评分模型,并应用在微粒。...三、个体用户画像研究 刘黎春表示,做个体用户画像研究遇到的挑战主要有如下三方面: 其一,如何充分利用腾讯各种丰富的数据资源及之间的联系? 其二,如何使用户画像适应各种不同的应用场景?...其三,如何高效的处理海量的用户数据(超过10亿的QQ用户, 超过千亿级别的各类日志数据) ?...(注:在客户申请查看微粒额度时,腾讯要求客户签署征信查询电子授权协议,然后去查客户的人行征信报告,并将人行征信数据应用于评级模型,因此最终评级模型的KS值还会有显著提升。) ?...微粒应用 最后刘黎春介绍征信模型运用到微粒中的具体应用流程,上图为产品截图。打开QQ如果能够看到微粒贷入口,说明是在腾讯筛选出的白名单里面。

1.9K101

全球第二如何垮台的?

再顺便搞个暗服务导航,里面也有钓鱼加密货币的。没一定隐私及安全功力的,不要随便逛暗......——慢雾科技余弦 当地时间5月3号,跨多国合作的执法部门在德国宣布,他们成功关闭了全球第二市场:The Wall Street Marketplace(华尔街市场,以下简称WSM),并抓获了3...暗与WSM简史 要理解WSM是如何倒下的,我们不妨先看看以往的暗市场历史。...WSM的破案过程大致如上,但还有一个问题悬而未决:执法部门是如何确定罪犯的钱包地址的呢? 失之毫厘,谬以千里 破绽由WSM的被捕创始人之一Frost露出。...碰巧的是,该V**因故停止无法工作,但犯罪团队依然访问WSM网站(没有了V**,使用者的数据相当于失去了保护色),这就使得执法部门顺利获得了Frost的部分信息(包括其具体的位置以及可能的姓名)。

94530

远离流氓软件 - 清除流氓软件工具合集,欢迎补充! 博客分类: 心困中央 360FirefoxUbuntuIEWindows

在出手的过程中,把用到的一些方法与软件整理了一下,写一个总结,欢迎大家一起补充,过个好年:) 我的个人总结: 一、安装FireFox,并让他们使用,大大减少中招流氓软件的机会; 二、一些免费的检测与清除工具...当隐藏的句柄被识别后,RKDetector会试图关闭这些隐藏的任务并且重新扫描服务数据库来检测安装的隐藏服务和隐藏的注册表键值。...RKDetector内置了已知rootkit、工具程序、黑客工具特征的MD5数据库,可以识别这些工具; UnLocker:http://ccollomb.free.fr 当你重命名或删除一个文件/文件夹时...2、国产软件: 360安全卫士(360safe):http://www.360safe.com 不能全信它,但是还是可以清除挺多的流氓软件的; 恶意软件清理助手(RogueCleaner):http...://www.tommsoft.com 可以清除很多残留流氓软件的信息; 安全分析专家(SecAnalyst) :http://www.s-sos.net/downloads/SecAnalyst.htm

74640

如何从某一站获取数据

如果只是突然要从某网站获取一次数据,那么即使没有提供下载,只要复制粘贴即可。如果需要的数据量很大,复制粘贴太耗时,又或是要经常从某网站获取一些数据,那么就要想(码)办(代)法(码)了。...既然是气象人,那么本例就以下载怀俄明大学提供的探空数据为例,讲一下如何从某网站下载数据。 ? 打开网站之后,我们看到一些选项可以选择区域,日期及站点。 ? 绘图类型提供了很多选项 ?...然后回车就可以看到探空数据页了 ? 因为我们只选了一个时次的,所以只有一个时刻的探空信息。而且,从网页给出的数据可以看出,给出的信息非常清晰,基本上只有探空数据和一些计算后的指标。...右击探空数据页,查看网页源代码: ? 可以看到,我们能用到的信息为 H2,PRE,H3标签所对应的信息,而PRE标签对应了探空数据和站点信息及探空指标信息。...获取网页地址,然后就可以直接从网页下载数据了。

3.8K30

思迅软件如何手工处理断数据问题

如何手工处理断数据如何转到系统中 【问题答案】 断数据上传后,后台查询仍无数据数据上传异常导致,建议按照以下步骤操作: 1.在前台安装根目录下的localdata文件夹内保存有历史的销售数据,安装...然后按时间找到后台缺失的数据(假设时间从2013年8月1号至2014年1月23号),从第一条开始,将第一条缺失的数据选中拉黑,然后将鼠标拉到最底端,找到最后一条记录,按住shift键,单击最后一条记录,...注:销售流水和收银流水数据需要一致,否则无法上传。 4.断数据上传后台查询不到的原因:可能为数据保存在销售数据的错误表中,需要清除数据后重新上传。...备份数据库后执行语句完整清除异常数据,保证能成功重传: use hbposv8 --分店则改为hbposv8_branch go delete t_rm_saleflow_error delete t_rm_saleflow_temp...delete t_rm_payflow_error delete t_rm_payflow_temp 5.完成上述操作后,重新进入前台此时数据交换会重新将您制作的断数据上传到后台。

80010

数据猿专访农信互联魏春:如何在养猪场实现“普惠金融”?

记者 | 文 官 | www.datayuan.cn 微信公众号ID | datayuancn 上周,一家网络借贷平台在纽交所上市的消息又一次引燃了媒体舆论。...再加上其极高的资金配置效率,甚至一度被炒作为“传统银行的终结者”,实现普惠金融的希望之光。 但随着一批不合规平台被取缔,沸沸扬扬的“P2P大潮”戛然而止,留下一地鸡毛。...在热度过去之后,平台和银行们终于想清了答案:相较于传统银行小额贷款,如何体现其优势?银行又如何应对带来的挑战? 答案是:大数据。...平台和银行所面临问题的本质就是:如何在保证较低的坏账率的同时,让资金高效的流转,真正实现普惠金融? 大数据征信成为了平台和银行的必然选择。...农信互联已建成“数据+电商+金融”三核心业务平台,在其平台上搭建的垂直产业生态圈已涵盖猪联网、田联网、渔联网、企联网等。

600110

数据24小时 | 医疗保险公司Clover Health获1.6亿美元融资,平台蓝金所将建企业大数据金库

主要利用“医疗+大数据”模式对患者可能存在的健康隐患进行分析、判断。 此外,该公司还将保险与大数据结合起来,旨在通过数据库检索出潜在高危病患,为其提供预防方案,从而降低患者就医费用。...vArmour主要利用大数据分析技术,通过扫描网络数据的方式,为企业提供安全解决方案,从而使企业有效应对威胁事件。...BigID宣布完成210万美元融资,为企业打造数据隐私管理平台 随着“大数据”的不断发展,数据隐私问题越来越得到企业的重视,即使目前监管机构对对其监管力度已经逐渐增强,然而个人数据仍面临更大风险。...平台蓝金所将建实体企业大数据金库,为企业提供资源对接服务 近日,专注于供应链金融的互联网金融服务公司蓝金所宣布将建立实体企业大数据金库,该大数据金库将集资本、资源以及服务为一体,旨在为企业提供资源对接服务...根据双方签订的协议显示,届时将借助九次方大数据数据采集、清洗以及数据建模、可视化等方面的技术优势,进一步构建“互联网+大数据”生态圈,从而提升公司在大数据领域的应用水平,完善产业布局。

68040

数据,时钟同步设备(北斗授时装置)如何保护数据

数据,时钟同步设备(北斗授时装置)如何保护数据数据,时钟同步设备(北斗授时装置)如何保护数据 在我们依赖文件服务器、邮件服务器、互联网网关以及其它无数网络设备的背后,存在一个基本的信任就是:网络里的计算机都有精确的时间...在的企业网内,有可能用到不同级别的时间服务器(NTP)来分发统一的时间。...互联网上有很多NTP服务器,但是它们的可靠性比较低,因为这取决于你的互联网连接的可靠性、本地的流量以及NTP服务器的可靠性和负载情况。...数据流量很大的环境、从事重要任务的部门以及具有可疑可靠性数据链的网络是另外一个问题,在这种场合冗余备份就更加重要。...Kerberos是MIT开发的一个协议,用来在一个不安全的网络内,比如说一个大学,发送加密的口令信息。

64530

栅格数据如何更快运算

背景介绍 这两周我在使用python进行大量的栅格数据的运算,在运算过程中遇到了数据量超级但算力不足的问题。通过这两周的探索,也慢慢找到了一些加快栅格数据计算的方法,和读者分享。...对于非常的数组或在多进程环境下共享数据时,这种方法非常有用。 因为mmap_array只是中间数据,应该记得运行一次,清理一次,防止占用内存。...但还需要注意个问题,如果你运行的是超级的栅格数据,固态硬盘的容量应该是不够保存的,因此每次运行完栅格数据后,都应该及时转移数据到机械硬盘。...pro自带的arcpy进行数据计算,但arcpy数据生成结果是没有被压缩过,每一期的数据都会生成200G大小的栅格数据。...使用多线程,但如何才不能爆内存了?可以通过调整分块的大小,分块越小,内存占用越小,能带动的的线程数量越多。 但是分块的大小不是越小越好,会有一个阈值。

24020

2019年数据产业发展如何

01 2019年中国大数据发展如何 2018年中国大数据产业规模推测达到5405亿元,较2017年4700亿元同比增长15%; 2019年有望达到6216亿元,并且未来几年中国大数据产业将保持在10-15%...报告引用中国信息通信研究院“2015-2019年中国大数据产业市场规模趋势”数据。...02 大数据顶层设计 2018年,全国各地加强贯彻落实《促进大数据发展行动纲要》《大数据产业发展规划(2016-2020)》及相关政策,十多个地方已经设置了省级大数据管理机构,30多个省市制定实施了大数据相关政策文件...03 大数据技术创新 国内骨干企业已经具备了自主开发建设和运维超大规模大数据平台的能力,一批大数据以及智慧城市方面的独角兽企业快速崛起,大数据领域的专利申请数量逐年增加。...05 大数据区域布局 中国已经建设了8个国家大数据综合试验区和5个国家大数据新型工业化示范基地,开展大数据方面的实践探索,区域布局持续优化。

55630

行业步入新周期,出借人的投资秘籍在哪?

文/孟永辉 经历了资本撤离、政策监管的洗礼后,行业发展正迎来新的发展机遇期。以BAT为代表的科技巨头对金融行业的赋能、平台自身合规性建设的加快、出借人的日益成熟都让行业进入到发展新周期。...据第一发布的统计数据显示,截至5月末,全国在营P2P机构多达890家。...当行业进入新机遇期,出借人如何找到适合自己的投资秘籍成为掘金新风口的关键所在。...很多出借人在选择平台的时候,比较迷信名目繁多的评级和排名,甚至还有一些出借人比较看重平台的获奖情况。...特别是平台依然鱼龙混杂的背景下,出借人用某个奖项来甄别平台好坏依然风险颇高。

40110

现金迎来最强监管,互联网金融企业转型迫在眉睫

12月1日,互联网金融风险专项整治、P2P风险专项整治工作领导小组办公室正式下发《关于规范整顿“现金”业务的通知》。“通知”对网络小额贷款做出严格规定,这将使得一批互联网金融企业面临转型。...最强监管力度“通知”的解读 此次下发的《关于规范整顿“现金”业务的通知》,总的来说给从事现金的企业设置了三门槛:经营牌照、场景依托和综合利率36%以下。...这使得目前所有从事现金业务的平台,必须实现业务整顿和转型,将所有的业务落到具体的场景。 平台向借款人收取利息,要折算成综合年化利率。...也就是说,很多平台再也无法通过各种服务费等手段,变相提高利率,而打着现金的旗号,放着高利。...在个人消费金融方面企业就有两个要面对的难点:一个是如何将现有的现金客户导流到消费业务;另一个就是找供应商,一方面安全靠谱的供应商,能够为客户带来更好的消费体验,提高用户粘度,另一方面要尽量压低供应商的供货成本

1K00

WhatsApp数据泄露,近5亿条用户号码在暗出售

据Cybernews报道,有黑客正在地下论坛出售近5亿WhatsApp用户的最新手机号码,而通过检验数据库样本,这些数据极有可能是真实数据。...据称,该数据库包含84个国家的WhatsApp用户数据。...Cybernews的研究人员联系WhatsApp数据库卖家,得到了一份数据样本。样本中有1097个英国和817个美国用户号码。...卖家没有具体说明数据库的获得方法,暗示使用了一些策略来收集数据,并保证数据库中所有号码是WhatsApp活跃用户。 WhatsApp母公司Meta对此不予置评。...某黑客论坛上存在超过5.33亿WhatsApp用户纪录的泄露,下载数据库几乎免费。 除了WhatsApp大规模数据泄露,一份据称包含5亿领英用户资料的数据库被挂上黑客论坛出售。

45510

猎聘单艺:数据分析师的9挑战

报告正文: 大家好,我是来自猎聘的单艺,很高兴今天下午能够有机会跟大家聊一聊我们做数据分析在这个大数据时代会面临的哪些机会和挑战。我演讲的主题是数据分析师的十机遇和挑战。...我自己现在在猎聘负责所有的跟数据有关的事情,包括数据基础设施,数据分析还有数据挖掘、研发方面的工作。 ? 首先讲讲我们猎聘的一个基本情况,这也是我们能做一些不同行业、不同职能的职业发展的基础。...、很有意思的数据,主要是人的职业发展的数据。...有了这些数据之后我们就可以做一些比较有意思的分析了。首先我们对企业信息,通过文本挖掘的方法形成企业画像,职位描述也是这样,形成了三画像,企业画像、人才画像、职位画像。...所以这个时候你要懂数据收集是怎么回事,数据日志系统是怎么构成的,逻辑上是怎么定义的,数据流水线是怎么过来的,数据库里面是怎么通过ETL的过程拿到中央的数据仓库,这些概念你一定要懂,你没有数据就是没有源头

1.2K60
领券