首页
学习
活动
专区
工具
TVP
发布

数据科学与人工智能

专栏作者
811
文章
1011325
阅读量
170
订阅数
金融科技:建模工作环境
我基于公司申请的Ubuntu20.10系统的服务器搭建过可供多人使用Jupyter Hub建模平台,支持Python工作、R工作和Linux工作三种方式,同时,也可以做账户管理、权限管理、共享管理等。我也基于自己的本地机器,在Win系统上面搭建建模工作环境,支持Python工作和R工作。顺便说一下,我在金融科技行业做数据科学工作,Python语言和R语言,我都会使用。我从不做语言的好坏选择,只看语言是否有利于我解决问题。
陆勤_数据人网
2022-01-29
6490
如何在Win10系统下使用Git把本地项目上传到Github?
git status 命令,用于查看当前状态;git add . 命令,用于把项目添加到仓库;git commit -m "" 命令,用于把项目提交到仓库,要养成写注释的好习惯。
陆勤_数据人网
2021-04-02
1.5K0
多媒体程序开发
朋友们大家好,相信大部分人都喜欢玩游戏,无论是在工作间隙还是下班回家的路上,可能都会拿起手机玩游戏打发时间,亦或是在游戏中寻找乐趣,放松自己。上一系列的推文已经结束,主要是跟大家分享了些Python的基础知识,大家可以在公众号主界面查看。从今天起,让我们开启进阶模式,一起来学习用Python制作简单的小游戏。
陆勤_数据人网
2020-09-14
1.3K0
Jupyter Notebook使用总结
俗话说:“天下武功唯快不破”。我们掌握一些快捷键的操作,以提升使用Jupyter Notebook的效率,这是非常有价值的。
陆勤_数据人网
2020-02-26
8630
GitHub 上 57 款最流行的开源深度学习项目
本文整理了 GitHub 上最流行的 57 款深度学习项目(按 stars 排名)。最后更新:2016.08.09 1.TensorFlow 使用数据流图计算可扩展机器学习问题 TensorFlow 是谷歌的第二代机器学习系统,按照谷歌所说,在某些基准测试中,TensorFlow 的表现比第一代的 DistBelief 快了2倍。 TensorFlow 内建深度学习的扩展支持,任何能够用计算流图形来表达的计算,都可以使用 TensorFlow。任何基于梯度的机器学习算法都能够受益于 TensorFlow 的
陆勤_数据人网
2018-02-28
1.2K0
用PHP蜘蛛做旅游数据分析
随着物质的提高,旅游渐渐成为人们的焦点,火热的国庆刚刚过去,乘着这股余热,我想很多人都想知道,大家一般会去哪里玩呢,于是我花了10分钟写了一个采集马蜂窝游记的小程序,当然速度能有这么快,完全依赖于PHP著名爬虫框架phpspider。 国际惯例,我们先来看看代码怎么写,算作抛砖引玉吧 ^_^ 马蜂窝不同于常规网站,因为并发量高并且某些数据需要实时,比如观看人数,点赞人数,所以网站多处使用了Ajax,而Ajax对于普通采集者来说,是个比较大的问题。 观察了一下马蜂窝网站,最终确定了采集路线: 获取热门城市 -
陆勤_数据人网
2018-02-28
2K0
【数据科学】教你成为数据科学“大咖”!
随着互联网的迅猛发展,在线学习逐渐成为主流,MOOC、慕课等概念如雨后春笋般涌现。以往高等学府才能接触到的计算机科学和数据科学,也随着这次风潮来到了公众面前。OSDSM,即数据科学开源课程,能够从理论和技术两方面,帮助人们学习有效利用数据的核心技能。 一、利用互联网成为“大咖” 随着互联网的迅猛发展,网络公开课的网站和APP等日益成熟,从听课、讨论到考试,一条龙的自学服务已经颇成规模。这些课程中,计算机科学尤其是数据科学相关的知识都已包含在内,用户通过使用Coursera、ebooks、StackOve
陆勤_数据人网
2018-02-28
1.1K0
【机器学习】机器学习的11个开源项目
机器学习是目前数据分析领域的一个热点内容,在平时的学习和生活中经常会用到各种各样的机器学习算法。实际上,基于Python、Java等的很多机器学习算法基本都被前人实现过很多次了。这些算法在网上可以找到很多,然而往往存在很多“脏”或者“乱”的开源代码。 在这样的背景下, InfoWorld近日公布了机器学习领域11个最受欢迎的开源项目,这11个开源项目大多与垃圾邮件过滤、人脸识别、推荐引擎相关。它们大多数基于现今最流行的语言以及平 台,推广以及扩展了机器学习领域的很多重要算法。从中,用户不但可以找到LDA等主
陆勤_数据人网
2018-02-27
1.2K0
【Spark研究】用Apache Spark进行大数据处理第一部分:入门介绍
什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。 首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求。 Spark可以将Hadoop集群中的应用在内存中的运行速度提
陆勤_数据人网
2018-02-27
1.4K0
【Python环境】python数据挖掘领域工具包
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array; 比较成熟的(广播)函数库; 用于整合C/C++和Fortran代码的工具包; 实用的线性代数、傅里叶变换和随机数生成函数。 SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。其功能与软件
陆勤_数据人网
2018-02-27
1.2K0
【Python环境】Scikit-Learn:开源的机器学习Python模块
scikit-learn是一个用于机器学习的 Python 模块,建立在SciPy基础之上,获得3-Clause BSD 开源许可证。这个项目是由 David Cournapeau 在 2007 年发
陆勤_数据人网
2018-02-27
6380
【Python环境】Python机器学习库
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array; 比较成熟的(广播)函数库; 用于整合C/C++和Fortran代码的工具包; 实用的线性代数、傅里叶变换和随机数生成函数。 SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。其功能与软
陆勤_数据人网
2018-02-27
1.1K0
【开源工具】60款顶级大数据开源工具!总有一款适合你~
【数据科学自媒体】关注数据科学领域,分享数据科学内容,包括数据科学、机器学习、统计学习、数据分析、数据挖掘、开源工具、Python环境等主题。使命:让人懂数据、用数据,做明智决策! 说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到
陆勤_数据人网
2018-02-26
8200
【Python环境】python中的数据分析库及机器学习库
Python 计算机视觉 SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用Python编写,可以在Mac、Windows以及Ubuntu上运行。 自然语言处理 NLTK —一个领先的平台,用来编写处理人类语言数据的Python程序 Pattern—Python可用的web挖掘模块,包括自然语言处理、机器学习等工具。 TextBlob—为普通自然语言处理任务提供一致的API,以NLTK和Pattern为基础,并和两者都能很好兼容。 jieba—中文断词工具。 Sno
陆勤_数据人网
2018-02-26
1.1K0
【开源工具】大数据时代之开源R
【重要的题外话】 昨天小编在推送文章中做了个小调查,调查各位使用的编程语言情况,有一位Python开发者发来消息说,木有Python,只能选【其他】。是小编忘记告诉大家,微信的投票功能只有6个选项,而且每次推送只能包含一个投票,因此有些编程语言只能用【其他】代替了,还望各位见谅。对推送内容和活动有何意见和建议,均可直接回复,感谢大家一直以来的支持。 2011年由布拉德·皮特主演的影片《点球成金》描述了一个运用数据运营球队的故事:一位落魄的棒球队总经理比利·比恩(Billy Beane)与他的MBA助理拍
陆勤_数据人网
2018-02-26
7700
【机器学习】机器学习资料大汇总
注:本页面主要针对想快速上手机器学习而又不想深入研究的同学,对于专门的researcher,建议直接啃PRML,ESL,MLAPP以及你相应方向的书(比如Numerical Optimization,Graphic Model等),另外就是Follow牛会牛paper,如果谁有兴趣也可以一起来整理个专业的汇总页。本页面将持续更新,敬请关注,如有推荐的文章请留言,谢谢! 000 开源工具 机器学习的开源工具 Python机器学习库 C++矩阵运算库推荐 001 公开课 Machine Learning |
陆勤_数据人网
2018-02-26
1.4K0
【陆勤推荐】人工智能和机器学习领域中有趣的开源项目
本文简要介绍了10款 Quora上网友推荐的 人工智能和机器学习领域方面的开源项目。 GraphLab   GraphLab是一种新的面向机器学习的并行框架。GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从别的应用程序或者服务中抓取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序。(详情
陆勤_数据人网
2018-02-26
7420
【陆勤践行】机器学习开源项目
机器学习是目前数据分析领域的一个热点内容,在平时的学习和生活中经常会用到各种各样的机器学习算法。实际上,基于Python、Java等的很多机器学习算法基本都被前人实现过很多次了。这些算法在网上可以找到很多,然而往往存在很多“脏”或者“乱”的开源代码。 在这样的背景下, InfoWorld近日公布了机器学习领域11个最受欢迎的开源项目,这11个开源项目大多与垃圾邮件过滤、人脸识别、推荐引擎相关。它们大多数基于现今最流行的语言以及平台,推广以及扩展了机器学习领域的很多重要算法。从中,用户不但可以找到LDA等主题
陆勤_数据人网
2018-02-26
7200
【陆勤践行】从零开始,成为数据科学“大咖”
随着互联网的迅猛发展,在线学习逐渐成为主流,MOOC、慕课等概念如雨后春笋般涌现。以往高等学府才能接触到的计算机科学和数据科学,也随着这次风潮来到了公众面前。OSDSM,即数据科学开源课程,能够从理论和技术两方面,帮助人们学习有效利用数据的核心技能。 一、利用互联网成为“大咖” 随着互联网的迅猛发展,网络公开课的网站和APP等日益成熟,从听课、讨论到考试,一条龙的自学服务已经颇成规模。这些课程中,计算机科学尤其是数据科学相关的知识都已包含在内,用户通过使用Coursera、ebooks、StackOverf
陆勤_数据人网
2018-02-26
6490
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档