首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据分析工具篇——for循环运算优化(一)

这一系列《数据分析工具篇》的开篇,也是数据分析流程中开始和结束的动作,数据导入之后,紧接着需要做的就是对数据的处理,我们会花费几篇的时间,来和大家聊一下常用的处理逻辑和常见的几个包,在数据处理过程中,常用的处理逻辑主要有:for循环优化、广播应用方案以及整体(集合)运算方法,特别是for循环,可以说百分之九十九的函数会出现for循环;常见的包主要有:pandas、pyspark、numpy,这三个包可谓是人尽皆知,特别是前两个,一个是小数据使用的包,一个是大数据使用的包,随着python的不断丰富,这两个包越来越完善,今天我们先了解一下for循环的优化方法:

02

想学算法吗少年,跟我来吧

伟大的编程领域的祖师爷尼古拉斯威茨提出程序=数据结构+算法,数据结构的重要性不言而喻,数据结构在计算机学习的过程中是一门必修课,考研一般也是数据结构必考,软件开发中的架构设计中也有很多数据结构的使用,越是底层尤其是存储这一块的东西,数据结构关乎着存储性能,比如MySQL的底层、redis的数据结构。这篇文章并不是将数据结构,而是算法。算法是程序的另一种组成部分,而现在国内的软件开发往往将算法与业务开发分开了,小公司往往不在乎你的算法能力,而大厂可能会问到算法的内容,有的大厂会问一下你的算法思路,有的大厂甚至会让你上机写算法,而国外的公司对算法的要求更高,我在国外面试过一些公司,算法属于必问的内容。

02
领券