首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python基本手册

type() #查看类型 dir() help() len() open() #文本文件的输入输出 range() enumerate() zip() #循环相关 iter() #循环对象 map() filter() reduce() #函数对象 abs(-2) #取绝对值 round(2.3) #取整 pow(3,2) #乘方 cmp(3.1, 3.2) #比较大小 divmod(9, 7) #返回除法的结果和余数 max([2, 4, 6, 8]) #求最大值 min([1, 2, -1, -2]) #求最小值 sum([-1, 1, 5, 7]) #求和 int(“10”) #字符转为整数 float(4) #转为浮点数 long(“17”) # 转为长整数 str(3.5) #转为字符串 complex(2, 5) #返回复数2 + 5i ord(“A”) #A对应的ascii码 chr(65) #ascii码对应的字符 unichr(65) #数值65对应的unicode字符 bool(0) #转换为相应的真假值,0相当于False btw:”空” 值相当于False:[],(),{},0,None,0.0 all([True, 2, “wow!”]) #是否所有元素相当于True,全为True则为True any([0, “”, False, [], None]) #是否有元素相当于True sorted([1, 7, 4]) #序列升序排序 reversed([1, 5, 3]) #序列降序排序 list((1, 2, 3)) #tuple转换为表list tuple([4, 5, 4]) #list转换为tuple dict(a=3, b=”hi”, c=[1,2,3]) #构建字典 d = dict(a=3, b=”hi”, c=[1,2,3]) #d则为字典,字典的引用方式d[“a”]的值为3 input(‘input something’) #等待用户输入 globals() #返回全局变量名,函数名 locals() #返回局部命名空间

05

如何对非结构化文本数据进行特征工程操作?这里有妙招!

文本数据通常是由表示单词、句子,或者段落的文本流组成。由于文本数据非结构化(并不是整齐的格式化的数据表格)的特征和充满噪声的本质,很难直接将机器学习方法应用在原始文本数据中。在本文中,我们将通过实践的方法,探索从文本数据提取出有意义的特征的一些普遍且有效的策略,提取出的特征极易用来构建机器学习或深度学习模型。 研究动机 想要构建性能优良的机器学习模型,特征工程必不可少。有时候,可能只需要一个优秀的特征,你就能赢得 Kaggle 挑战赛的胜利!对于非结构化的文本数据来说,特征工程更加重要,因为我们需要将文

06
领券