数据科学学习手札

记录自己的数据科学学习之路
70 篇文章
36 人订阅

全部文章

Feffery

(数据科学学习手札66)在ubuntu服务器上部署shiny

  shiny是R中专门用于开发轻量级web应用的框架,在本地写一个shiny应用并调用非常方便,但如果你希望你的shiny应用能够以远程的方式提供给更多人来使...

852
Feffery

实用的Python(2)利用Python制作gif动图

  moviepy是一个专门用于视频剪辑制作的模块,可以自动化完成很多繁琐的视频剪辑处理工作,除了处理视频数据之外,moviepy中还内置了可以制作gif动图的...

863
Feffery

(数据科学学习手札65)利用Python实现Shp格式向GeoJSON的转换

  Shp格式是GIS中非常重要的数据格式,主要在Arcgis中使用,但在进行很多基于网页的空间数据可视化时,通常只接受GeoJSON格式的数据,众所周知JSO...

701
Feffery

(数据科学学习手札63)利用pandas读写HDF5文件

  HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内...

593
Feffery

(数据科学学习手札64)在jupyter notebook中利用kepler.gl进行空间数据可视化

  kepler.gl是由Uber开发的进行空间数据可视化的开源工具,是Uber内部进行空间数据可视化的默认工具,通过其面向Python开放的接口包kepler...

1246
Feffery

(数据科学学习手札64)在jupyter notebook中利用kepler.gl进行空间数据可视化

  kepler.gl是由Uber开发的进行空间数据可视化的开源工具,是Uber内部进行空间数据可视化的默认工具,通过其面向Python开放的接口包kepler...

720
Feffery

(数据科学学习手札63)利用pandas读写HDF5文件

  HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内...

480
Feffery

(数据科学学习手札62)详解seaborn中的kdeplot、rugplot、distplot与jointplot

  seaborn是Python中基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到...

1025
Feffery

xpath进阶用法

  xpath作为对网页、对xml文件进行定位的工具,速度快,语法简洁明了,在网络爬虫解析内容的过程中起到很大的作用,除了xpath的基础用法之外xpath中还...

1604
Feffery

用Python实现WGS84、火星坐标系、百度坐标系、web墨卡托四种坐标相互转换

  主流被使用的地理坐标系并不统一,常用的有WGS84、GCJ02(火星坐标系)、BD09(百度坐标系)以及百度地图中保存矢量信息的web墨卡托,本文利用Pyt...

2192
Feffery

(数据科学学习手札59)从抓取数据到生成shp文件并展示

  shp格式的文件是地理信息领域最常见的文件格式之一,很好的结合了矢量数据与对应的标量数据,而在Python中我们可以使用pyshp来完成创建shp文件的过程...

1114
Feffery

(数据科学学习手札58)在R中处理有缺失值数据的高级方法

  在实际工作中,遇到数据中带有缺失值是非常常见的现象,简单粗暴的做法如直接删除包含缺失值的记录、删除缺失值比例过大的变量、用0填充缺失值等,但这些做法会很大程...

1054
Feffery

(数据科学学习手札57)用ggplotly()美化ggplot2图像

  经常利用Python进行数据可视化的朋友一定用过或听说过plotly这样的神器,我在(数据科学学习手札43)Plotly基础内容介绍中也曾做过非常详细的介绍...

834
Feffery

(数据科学学习手札56)利用机器学习破解大众点评文字反爬

  爬取过大众点评的朋友应该会遇到这样的问题,在网页中看起来正常的文字,在其源代码中变成了下面这样:

1273
Feffery

(数据科学学习手札55)利用ggthemr来美化ggplot2图像

  R中的ggplot2是一个非常强大灵活的数据可视化包,熟悉其绘图规则后便可以自由地生成各种可视化图像,但其默认的色彩和样式在很多时候难免有些过于朴素,本文将...

863
Feffery

(数据科学学习手札53)Python中tqdm模块的用法

  tqdm是Python中专门用于进度条美化的模块,通过在非while的循环体内嵌入tqdm,可以得到一个能更好展现程序运行过程的提示进度条,本文就将针对tq...

1713
Feffery

(数据科学学习手札54)Python中retry的简单用法

  retry是一个用于错误处理的模块,功能类似try-except,但更加快捷方便,本文就将简单地介绍一下retry的基本用法。

1904
Feffery

(数据科学学习手札52)pandas中的ExcelWriter和ExcelFile

  pandas中的ExcelFile()和ExcelWriter(),是pandas中对excel表格文件进行读写相关操作非常方便快捷的类,尤其是在对含有多个...

1932
Feffery

(数据科学学习手札51)用pymysql来操控MySQL数据库

  pymysql是Python中专门用来操控MySQL数据库的模块,通过pymysql,可以编写简短的脚本来方便快捷地操控MySQL数据库,本文就将针对pym...

1364
Feffery

(数据科学学习手札50)基于Python的网络数据采集-selenium篇(上)

  接着几个月之前的(数据科学学习手札31)基于Python的网络数据采集(初级篇),在那篇文章中,我们介绍了关于网络爬虫的基础知识(基本的请求库,基本的解析库...

1694

扫码关注云+社区

领取腾讯云代金券