首页
学习
活动
专区
工具
TVP
发布

python读书笔记

专栏作者
40
文章
53222
阅读量
32
订阅数
《算法图解》开读
个人认为,算法基础是程序员甚至是与代码打交道的人的基本能力。而优秀的算法能力则能成为从事编程工作的人的核心竞争力。 因为时间复杂度低的算法使得代码的高效运行成为现实,好比快速排序法相较于冒泡排序法。 严谨的算法能将问题的种种情况都妥善解决,滴水不漏。 贪婪的算法能将问题化整为零,将问题的近似解求出,从而得出平衡成本与收益的答案。 因此,算法是从事代码人员的极为重要的能力。 本人之前一直在读《python算法教程》,但由于外部以及内部的原因,阅读的进度搁置在第六章。为了打好算法的基础,本人参加了一个
billyang916
2018-07-06
4110
《算法图解》note 10 K近邻算法1.K近邻算法简介2.python实现方式3.K近邻算法的优缺点
这是《算法图解》第十篇读书笔记,内容主要是K邻近算法的介绍。 1.K近邻算法简介 K近邻算法(K-nearest neighbor)是一个给定训练数据,根据样本数据最近的K个实例的类别来判断样本数据的类别或数值的算法。该算法可细分为两种类型:判断样本类别的分类算法,计算样本数据的值的算法。 2.python实现方式 可用python的scikit-learn包实现K近邻算法。 调用包的方式如下: from sklearn import neighbors #K近邻算法的分类算法 classifier=ne
billyang916
2018-06-19
8103
《算法图解》note 7 狄克斯特拉算法1.狄克斯特拉算法简介2.代码实例
这是《算法图解》的第7篇读书笔记。其主要内容是简述狄克斯特拉算法。 1.狄克斯特拉算法简介 迪克斯特拉(dijkstra)) 算法用于找出有向无环图(DAG)中两点的最短路径。 对于无权重的有向无环图,狄克斯特拉算法的用途等效于广度优先搜索(BFS)。 对于有权重的图: 若边的权重是相等的正数,其用途等效于广度优先搜索。 若边的权重不等且仅权重均为正数,狄克斯特拉算法能出两点间的最短路径。 若边的权重有负数,则狄克斯特拉算法是不适用的。 2.代码实例 现在将通过python代码找出以下DAG中从A
billyang916
2018-06-13
5950
《算法图解》NOTE 5 散列表1.散列表简介2.散列表的特点2.1优点2.2缺点3.应用
这是《算法图解》的第五篇读书笔记,内容主要涉及散列表(hash table)。 1.散列表简介 散列表,又名哈希表,是一种数据结构。它是将用于搜索的键按照一个函数(哈希函数)转化为数组的索引,然后在索引所对应的数组元素中存放与键关联的内容。 从本质上来说,哈希表是一个数组,一个稀疏数组,但这个数组的索引是某个键的映射值,键与索引的映射关系可用哈希函数来表示。 在python中,最常见的哈希表的数据类型就是字典(dict)。 2.散列表的特点 2.1优点 由于散列表本质上是数组,因此支持随机访问,其时间复
billyang916
2018-06-08
8560
《算法图解》note 6 图以及广度优先搜索和深度优先搜索1.图2.广度优先搜索3.深度优先搜索
这是《算法图解》第六篇读书笔记,涉及的主要内容为图结构、深度优先搜索和广度优先搜索。 1.图 1.1图的概述 图(graph)是一种基本的数据结构,它由点和边构成。 根据边有无指向性,可将图分为有向图、无向图。这两种图分别表明点与点之间的关系是单向的(有向图)还是过双向的(无向图)。 1.2图的用途 图可用于表示物体之间的关系,以及用于查找两地点之间的最短路径等。 1.3图的存储结构(python实现有向图) 图的存储结结构可分为邻接矩阵和邻接列表。 下文将按下图展示邻接矩阵和邻接表。 先约定三点:
billyang916
2018-06-04
1K0
《python算法教程》Day7 - 获取有向图的所有强连通分量强连通分量定义代码示例
今天是《python算法教程》的第7篇读书笔记,笔记的主要内容是通过python的遍历方式找出有向图的强连通分量。 强连通分量定义 在有向图G中,如果两个顶点vi,vj间(vi>vj)有一条从vi到v
billyang916
2018-05-02
1.9K0
《python算法教程》Day2 - 图和树的基本数据结构图树
今天是读《python算法教程》的第2天,读书笔记内容为用python实现图和树的基本数据结构。 图 图的基本数据结构有两种,分别为邻接列表和邻接矩阵。 现根据下图通过python实现邻接列表和邻接
billyang916
2018-05-02
1.1K0
《python算法教程》Day1- 渐近表示法渐近表示法的表示符号渐近表示法的使用方式典型的渐近类型及其算法复杂度优先级
算法的时间复杂度一般使用渐近表示法表示。 渐近表示法的表示符号 使用的符号主要有这三个:Of(n))、Ω(f(n))、���θ(f(n))��。分别表示时间复杂度不超过某个代表运行时间上界的函数f(n)的一系列函数、不低某个表示运行时间下限的函数f(n)的一系列函数、时间复杂度在时间复杂度上界函数f1(n)和时间复杂度下限函数f2(n)之间的一系列函数。 其中,f(n)、f1(n)、f2(n)定义为输入规模为n的函数 渐近表示法的使用方式 一般而言,表示运行时间的函数的形式多样,但渐近表示法中的函数仅截取
billyang916
2018-05-02
1.1K0
《python算法教程》Day3 - 递归递归简介代码示例
这是《python算法教程》的第3篇读书笔记。由于之前看书的效率太低了,所以拖了一个多星期才写第三篇读书笔记。这次主要简单总结一下递归(recursion)。 递归简介 递归是编程中一种常见的算法,他的主要特征是函数运行过程中会调用函数自己,呈现出同一个函数层层套嵌的现象。 之所以会使用递归,是因为需要解决的问题可通过分解为与原问题相同但规模较小子问题来解决。同时规模较小的子问题可通过较为简单的代码来解决。 上述解决问题的思路则正可通过递归来实现。但要注意的是: 1.递归算法的开销较大。若开销较小的算
billyang916
2018-05-02
7080
《python算法教程》Day5 - DFS遍历图(邻接字典)DFS简介代码示例
这是《python算法教程》的第5篇读书笔记。这篇笔记的主要内容为运用DFS(深度优先搜索,depth first search)对图(邻接字典)进行遍历。 DFS简介 在解决问题的时候,需要对整个图进行遍历,以获取整个图的节点信息。此时遍历的思路是根据当前访问的点,访问其邻接点,最终使得整个图的节点均被访问。此时,访问邻接节点的策略有DFS(深度优先搜索)和BFS(广度优先搜索)。DFS是先访问当前节点的一个邻接节点,再继续访问该邻接节点的邻接节点,直到访问的邻接节点没有邻接节点。之后再访问上一层节点的另
billyang916
2018-05-02
2.8K0
《python算法教程》Day8 - 构建二分搜索树二分搜索树介绍二分搜索树创建代码
今天是《python算法教程》的第8篇读书笔记,笔记的主要内容是构建二分搜索树。 二分搜索树介绍 若要对一组有序值中执行操作(如查找),二分搜索法是一个优秀的选择,因为其时间复杂度仅为对数级。但很多时候,对序列的操作不仅仅是查找,还涉及到插入新数据。若此时选用数组作为存储数据的结构,插入数据的时间复度是线性级的,显然无法满足快速插入数据的需求。因此,这里引入二分搜索树这一既能利于二分搜索又能以对数级的时间完成搜索的数据结构。 二分搜索树创建代码 二分搜索树是一个对象,其提供插入、搜索节点和判断是否存在某个节
billyang916
2018-05-02
7350
《python算法教程》Day4 - 拓扑排序(基于有向无环图)拓扑排序简介代码实例
这是《python算法教程》的第4篇读书笔记。这篇笔记的主要内容为拓扑排序。 拓扑排序简介 在将一件事情分解为若干个小事情时,会发现小事情之间有完成的先后次序之分,若不按照特定的顺序完成,则会使得整件
billyang916
2018-05-02
2K0
python 数据分析基础 day14-matplotlib模块概括条形图直方图折线图散点图箱线图
今天是读《pyhton数据分析基础》的第14天,今天读书笔记的内容为使用matplotlib模块绘制常用的统计图。 模块概括 matplotlib 是最基础的绘图模块,pandas和seaborn的绘图功能的使用依赖于matplotlib。 条形图 #绘制柱形图 from matplotlib import pyplot as plt #绘图数据 x=["a","c","d","e","b"] y=[11.5,18.6,17.5,14.3,10.8] #创建基础图 fig=plt.figure() #
billyang916
2018-05-02
1.7K0
python 数据分析基础 day13-套嵌字典在数据整理过程中的应用
今天是读《python数据分析基础》的第11天,今天笔记的内容主要是涉及这本书的5.2节。很多时候,业务数据是按照业务这个维度来组织数据的,按5.2节的实例来说,就是客户每购买一次会员,就会产生一条记录。但问题在于,做分析的时候,一般需要以其他维度来组织数据,例如客户维度或时间维度。而这时就会发现按其他维度组织数据必须考虑一个问题,如何将统计维度的值变成唯一的,以便后续数据的进一步处理,以及与其他表进行关联的时候保证不会出现重复的记录。举个例子,按客户组织维度数据,最好保证每个客户标识只出现一次。 在这种
billyang916
2018-05-02
5760
python 数据分析基础 day18-使用pandas进行数据清洗以及探索
今天是读《python数据分析基础》的第18天,读书笔记的内容是使用pandas进行数据清洗以及探索 由于原始数据在某种程度上是“脏”的,原始数据并不能完全使用于分析。因此,需要为其进行清洗。而为了解数据的大致情况,则需要进行数据探索。 以下是进行简单的数据清洗以及探索的代码: 注:数据来源于https://github.com/cbrownley/foundations-for-analytics-with-python/tree/master/statistics/churn.csv #数据探
billyang916
2018-05-02
1.3K0
python 数据分析基础 day15-pandas数据框的使用获取方式1:使用DataFrame.loc[]获取方式2:使用DataFrame.iloc[]
今天是读《pyhton数据分析基础》的第15天,今天读书笔记的内容为使用pandas模块的数据框类型。 数据框(DataFrame)类型其实就是带标题的列表。很多时候,整个数据框的数据并不会一次性的用于某一部的分析,而是选用某一列或几列的数据进行分析,此时就需要获取数据框的部分数据。 获取方式如下: 获取方式1:使用DataFrame.loc[] #调用某两行两列交汇的数据 #[index1,index2]表示引用索引号为index1和index2的两行数据 #[colName1,colName2]表示
billyang916
2018-05-02
1.7K0
python 数据分析基础 - 总结
至此,经过19天的阅读,《python数据分析基础》已经阅读完毕。 个人感觉,这是一本不错的关于数据分析方面的入门书籍。但是,这本书是有阅读门槛的,必须初步了解基本的python语法。否则,在阅读这本书的时候,在同步去了解这本书的所展示的代码所涉及的python基础的情况下,才能较为透彻地理解书中的代码。 在数据导入、数据清洗方面,这本书的论述是不错的,但是,在数据可视化以及数据分析方面,这本书的阐述较为简单,若要将书中所涉及的内容内化成自己可以运用的内容,建议阅读本书相关内容的同时去阅读相关的说明文档
billyang916
2018-05-02
6860
python 数据分析基础 day17-对自变量进行标准化
今天是读《python数据分析基础》的第17天,读书笔记的内容为变量的标准化。 在进行 在建模的时候,会遇到不同的自变量之间的量纲差距很大的情况,如输入变量有年龄和身高(身高以m为单位)时,年龄的范围为(0-100],而身高的范围则是(0,2.5]。此时两个变量之间的取值范围差了一个数量级。若采用这两个变量进行建模,则有可能出现这样的情况:年龄对预测值的影响远高于身高。这意味着年龄的影响程度被高估,身高的影响程度被低估。 为使得变量的影响程度能被正确估计,提高模型的预测精度,对自变量进行标准化是一个有效且可行的方式。 以下将用python演示对自变量进行标准化的操作:
billyang916
2018-05-02
2.6K2
python 数据分析基础 day11-mysql安装
今天是读《python数据分析基础》的第10天,今天的笔记内容是安装mysql数据库。 mysql数据库是一个关系型数据库,分为社区版(免费)以及专业版(收费)。下载网址为:https://dev.
billyang916
2018-05-02
5670
python 数据分析基础 day5-读写csv文件基础python读写csv文件通过pandas模块读写csv文件通过csv模块读写csv文件
今天说一下使用python读写csv文件。 读写csv文件可以使用基础python实现,或者使用csv模块、pandas模块实现。 基础python读写csv文件 读写单个CSV 以下为通过基础python读取CSV文件的代码,请注意,若字段中的值包含有","且该值没有被引号括起来,则无法通过以下的简单代码获取准确的数据。 inputFile="要读取的文件名" outputFile=“写入数据的csv文件名” with open(inputFile,"r") as fileReader: with
billyang916
2018-05-02
3.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档