1 import pandas as pd 2 import numpy as np 3 4 df = pd.DataFrame({ 5 'key1': [4, 5, 3,...',df.min()) 84 print('df的最大值',df.max()) 85 print('df的key2列的最大值',df['key2'].max()) 86 print('统计df的分位数...()) 89 print('求df的标准差,std()',df.std()) 90 print('求df的方差,var()',df.var()) 91 print('求skew样本的偏度,skew...111 df的key2列的最大值 5.0 112 统计df的分位数,参数q确定位置 key1 4.25 113 key2 4.25 114 Name: 0.75, dtype: float64...,只能对一列,不能对Dataframe 193 print(df['key2'].value_counts()) 194 195 # 判断Dataframe中的每个元素是否都是在某个列表中 196 print
# dict # Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。... the element of key "Bob"', d) # dict内部的存放顺序和key放入的顺序是没有关系的 # 和list比较,dict有以下几个特点: # 1.查找和插入的速度极快,不会随着...# dict可以用在需要高速查找的很多地方,在Python代码中无处不在,正确使用dict非常重要,需要牢记的第一条就是dict的key必须是不可变对象。...# 这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法。...# 要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。
dict = { "name": "张三", "age": 20, "sex": "男"} #常见操作 #len():测量字典中的键值对 print(len(dict)) #keys():返回所有的...,不会用到自己设置的value; 如果key值不存在.返回None,并且把新设置的key和value保存在字典中; 如果key值不存在,但设置了value,则返回设置的value; #字典的定义 my_dict...并且将设置的加入字典中 print(my_dict.setdefault("name1")) print(my_dict.setdefault("name1","555")) print(my_dict...保存在字典中; 如果key值不存在,但设置了value,则返回设置的value; #字典的定义 my_dict={ "name":"小红","age":20,"sex":"女"} #3.get: 格式...key不存在,返回None,设置的不加入字典中 print(my_dict.get("name2")) print(my_dict.get("name2","王五")) print(my_dict) 以上
引言 在Python中,list,dict作为Python的基础数据结构,经常会用到,其定义形式通常有下面两种: a = [] b = list() c = {} d = dict() 二者有什么区别呢...2. list() vs [],dict() vs {} 运行时间 首先比较一下二者的运行时间,timeit模块主要用来测量Python小段代码的执行时间,默认执行100万次。...()') 0.1366278938949108 >>> type({}) dict'> 从时间上来看,明显[]与{}的定义形式更快。...为什么[]比list()更快 dis库是Python自带的一个库,可以用来分析字节码,而字节码是CPython解释器的实现细节。...总结 [],{}定义数据类型速度更快,list(),dict()除了能定义数据类型之外,还可以对数据进行类型转换。
: 连接,; 3、字典中是可以存放不同的数据类型的。...二、特点 1.是不可重复, 2.key必须使用不可变类型数据,一般使用字符串 3.key是无序,字典的查找速度快 三、用法 #创建一个空的字典dict1 = {}#创建有多个元素的字典dict1 = {..."张三":"20","李四":"21","王五":"22"}#根据key值来查询dict["张三"]#当对应的key不存在是, 程序报错 #get方法能通过key来获取对应的值#当对应的key不存在时...["赵六",23] #增加,修改#当key不存在时为增加,key值存在时为修改dict1["小明"] = 32dict1["张三"] = 19 #删除#pop可以根据key来删除字典中的元素,并返回删除的元素的值...中一种非常使用的key-value的数据集合,熟练掌握运用dict会给平时工作学习带来极大的便利。
DataFrame简介: DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。...其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...导入基本python库: import numpy as np import pandas as pd DataFrame构造: 1:直接传入一个由等长列表或NumPy数组组成的字典; dict...>>> dict = { ...
DataFrame简介: DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。...其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...导入基本python库: import numpy as np import pandas as pd DataFrame构造: 1:直接传入一个由等长列表或NumPy数组组成的字典; dict...7 3 4 8 第二种:将包含不同子列表的列表转换为数据框 from pandas.core.frame import DataFrame a=[[1,2,3,4],[5,6,7,8]]#包含两个不同的子列表
作用 python字典的items方法作用:是可以将字典中的所有项,以列表方式返回。如果对字典项的概念不理解,可以查看Python映射类型字典基础知识一文。...url':'www.iplaypy.com'} >>> x.items() [('url', 'www.iplaypy.com'), ('title', 'python web site')] 从结果中可以看到...,items()方法是将字典中的每个项分别做为元组,添加到一个列表中,形成了一个新的列表容器。...x.items() >>> a [('url', 'www.iplaypy.com'), ('title', 'python web site')] >>> type(a) dict...,而且它的工作效率非常的高。
set(iterable) 定义一个set 例如:set1=set(range(100)) set 中的元素 set中的元素必须是可hash,元素可以迭代,不可以索引。...可hash的数据类型: 数值型:int 、float、complex 布尔型: True 、False 字符串: string 、 bytes None set的方法: 增加: add (elem) ...在集合中增加一个元素,如果元素存在,什么都都不做,时间复杂度O(1) update(*others) 在集合中合并其它元素到set中来,参数必须是可迭代对象,直接修该set 删除: remove (...可以做成员运行: in 和not in 由于使用的是hash算法,时间复杂度为O(1) 字典 dict dict的定义: dict是由key-value 键值对的组成的,可变的,无序的,key不重复的数据的集合...只是减少对象的引用计数 字典的遍历方法有: 遍历key 、 遍历 value 、遍历(key 、value) 、 遍历item set和dict的区别: set 和dict的区别是
map()将把func作用于参数列表的每个元素上,并返回一个新的list列表。...:[2, 6, 12] dict()用法 python中字典是一种可变容器模型,且可存储任意类型对象。...字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示: d = {key1 : value1, key2 : value2...创建字典 x = dict() x = {"one": 1, "two": 2, "three": 3} 访问字典的值 x = {"one": 1, "two": 2, "three": 3} print...] = 4 # f1 x.update({"two": 4}) # f2 print(x.get("two")) 以上代码将输出:4 删除字典元素 del x["one"] 参考文献 python中map
使用 Pandas 的between 、cut、qcut 和 value_count离散化数值变量。...分箱是一种常见的数据预处理技术有时也被称为分桶或离散化,他可用于将连续数据的间隔分组到“箱”或“桶”中。在本文中,我们将讨论使用 python Pandas 库对数值进行分箱的 4 种方法。....value_counts 通常用于计算系列中唯一值的数量,但它也可用于使用 bins 参数将值分组到半开箱中。...df['score'].value_counts(bins = 3, sort = False) 默认情况下, .value_counts 按值的降序对返回的系列进行排序。...将 sort 设置为 False 以按其索引的升序对系列进行排序。
数值计算中的原则 避免两个相近的数相减 如上图所示,因为 x 和 y 非常相近,所以 x-y << 0 ,而 x - y 又位于分母,所以会导致误差变得非常大。...例子: 这是因为这里的变量使用了8位来储存,因为在转换到同一个量级的时候,两个小数都要被转换成9位,导致最后一位溢出,最终变成 0.0 \times 10^8 ,从而导致结果出错,小数被“吃掉”。...这个问题是由计算机的存储数据的方式造成的。 解决方法: 绝对值太小的数不宜作除数 如果商特别大,下面继续加减乘除运算的时候可能会出现“大数吃掉小数”。...例如,如果这里的y恰好就是那个很小的数,那么就可能导致商绝对误差很大。 注意简化计算程序,减少计算次数 每一步计算都可能出现舍入误差,所以步骤太多的话可能会导致误差过大。...可以转换成下图公式: 选用数值稳定性好的算法 例题:求积分 可以看到第一步就出现了舍入误差,接着积累下去:
对于dataframe格式的数据: 1、data.value_counts():统计数据出现的次数 2、data.query("label==0"):按指定条件查询数据 3、data.plot():可视化...dataframe格式的数据 4、pandas.get_dummies(data):将某列数据用one-hot编码表示 5、pandas.concat([data1,data2],axis):将data1...的维度上进行拼接 6、data.fillna(0):将缺失数据用0填充 7、data.isna():查询缺失值的那些数据,比如pandas.isna(dfdata['Age']).astype('int32...')将名为'Age'那列的数据的缺失值用1表示 陆续更新,遇到了就记一笔,慢慢积累
__dict__与dir()的区别:dir()是一个函数,返回的是list;__dict__是一个字典,键为属性名,值为属性值;dir()用来寻找一个对象的所有属性,包括__dict__中的属性,__dict...__dict__ #{'age': 2, 'name': 'xy'} 实例中的__dict__属性 print A....类的__dict__存储所有实例共享的变量和函数(类属性,方法等),类的__dict__并不包含其父类的属性。...+ A_dict + object_dict) #True结论dir()函数会自动寻找一个对象的所有属性,包括__dict__中的属性。...__dict__是dir()的子集,dir()包含__dict__中的属性
as np # 检查pandas的版本号 import pandas as pd pd....先来看看Pandas三个基本的数据结构: Series DataFrame Index Pandas的Series对象 Pandas的Series对象是一个带索引数据构成的一维数组,可以用一个数组创建Series...的Series对象比它模仿的一维Numpy数组更加通用 Series是广义的Numpy数组 Series对象和Numpy数组基本可以等价代换,但两者间的本质差异其实是索引: Numpy数组通过隐式定义的整数索引获取数值...Series对象是一种显示定义的索引与数值关联 显示定义的索引让Series对象有了更加强大的能力。...例如,可以通过标准Python 的取值方法获取数值,也可以通过切片获取数值: ind[1] 3 ind[::2] Int64Index([2, 5, 11], dtype='int64') Index对象有许多和
其实dict的用处可大了,比如客户端通过http调用服务器端的api,所传的参数键值对就是dict类型的(java中叫map);比如学生信息,学号是key,该学生相关的信息都可以存到value中。...image.png 新增一个键值对,key放在[]中,value放在=后面 image.png 删除一个键值对,del d[key] image.png 访问dict中的值 image.png 如果没有对应的...key,会报错 image.png 判断某个key是否包含在dict中 image.png 获取dict中所有的key image.png 获取dict中所有的value image.png 循环变量dict...中的key和value image.png sorted方法能按key进行排序 image.png 但是sorted会返回一个新的dict,不会改变原来的dict image.png 上面说了dict的...vlaue可以是任何类型,我们在dict中加个cities的dict试试看,下面就是两个dict的嵌套 image.png 当然,dict中还可以加入List,Set等数据结构,用dict的时候要注意,
之前发现原来在输入框里面输入一串数值之后,系统会自动将数值变为分组形式的一串数字。比如输入123465798之后,系统自动转化为123.456.789。虽然这个并不影响实际运算,但看着很别扭!...后来用新建的帐号登录,执行 su3 对一些信息进行修改,在登录信息里面数字格式改为:以句号作为小数点,以逗号分组。
有的时候,一些代码中需要用到的变量并不是写在代码里或者配置文件中,而是直接写在文件里,比如.thrift文件配置之类的,这时候当我们定义字典时,key有时候就不是定义好的值,而是文件中的变量,使用下面的技巧就可以反向直接使用变量而调用
在python中,数值有以下3种类型 int, 整数 float,浮点数 complex,复数 其中整数和浮点数都属于实数的范围,而复数使用到的情况较少,这里不做讨论。...,与之相对,chr函数可以将数值转换为ASCII编码的字符。...,完整的函数列表请查看官方文档 https://docs.python.org/zh-cn/3/library/math.html 在实际工作中,对于数值我们还需要进行随机数操作,此时就需要用到内置模块...(0, 1) -0.08735515600559883 以上只是random模块中的部分函数,完整的函数列表请查看官方文档 https://docs.python.org/zh-cn/3/library.../random.html 对于一系列的数值,我们可以计算均值,中位数等统计指标,此时需要用到内置的statistics模块,常见操作如下 import statistics # 计算平均数 >>> statistics.mean
字典是使用最为广泛的数据结构了,从结构来看,其内容就是键值对,键称为key, 值称为value, 类似词典中通过前面的索引来快速查找后面的页面,通过key可以快速定位对应的值。...字典,是python中对这种结构的命名,在其他语言中有其他的名字,比如perl中称之为哈希。...print(i) ... one tow three 在perl中,哈希的key都是字符串,而在python中,字典的key非常灵活,只要是不可变的对象都可以,比如数字,字符串,元组。...值为列表的字典 python中不仅key很灵活,其value也很灵活。...tow': 1, 'three': 2}}) 上述写法只支持两个key的嵌套 在实际工作中已经可以满足需求了,两层以上的嵌套几乎用不到。