首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

《利用Python进行数据分析·第2版》第10章 数据聚合与分组运算10.1 GroupBy机制10.2 数据聚合10.3 apply:一般性的“拆分-应用-合并”10.4 透视表和交叉表10.5 总

对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之后,通常就是计算分组统计或生成透视表。pandas提供了一个灵活高效的gruopby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 关系型数据库和SQL(Structured Query Language,结构化查询语言)能够如此流行的原因之一就是其能够方便地对数据进行连接、过滤、转换和聚合。但是,像SQL这样的查询语言所能执行的分组运算的种类很有限。在本章中你将会看

09

手把手 | 范例+代码:一文带你上手Python网页抓取神器BeautifulSoup库

大数据文摘作品,转载要求见文末 编译 | 元元、康璐 网络上的信息是任何人穷极一生也无法全部了解的。你需要的或许不是简单的获得信息,而是一个可以收集,整理,分析信息,并且具有拓展性的方法。 你需要网页抓取(Web scraping)技术。 网页抓取可以自动提取网站上的数据信息,并把这些信息用一种容易理解的格式呈现出来。网页抓取应用广泛, 在本教程中我们将重点讲解它在金融市场领域的运用。 如果你是个投资达人,每天查找收盘价一定是个烦心事,更不用提数据来源于多个网站的时候。我们可以用代码写一个网络爬虫 (web

03

定制office2007静默安装版

1. 全自动安装: a) 在每个.ww里面有一个名为Config.XML的配置文件来实现的。专业增强版本位于光盘根目录下的ProPlus.ww目录下,企业版则位于Enterprise.WW目录下 b) 用记事本打开目录下的Config.xml,我们只需要修改里面的相应行就可以实现免输序列号、自动输入用户名、单位、定制安装组件。 < PIDKEY Value = “有效的安装序列号” / > <USERNAME Value=”用户名” /> <COMPANYNAME Value=”公司名” /> 以上内容禁用中文符号    <OptionState Id=“OptionID”State=”absent” Children=“force”/> 我们只要将不需要安装的项目替换其中的“OptionID”即可。如果需要不安装多个项目,则可以分多行来指定,absent就是不安装的意思    <OptionState Id=“OptionID”State=”Local” Children=“force”/> 我们只要将需要安装的项目替换其中的“OptionID”即可。如果需要安装多个项目,也是分多行来指定,”Local”就是本地安装的意思 下面就是相关的设置例子: <INSTALLLOCATION Value=”%programfiles%\Microsoft Office” /> ;默认安装路径 <OptionState Id=”WORDFiles” State=”Local” Children=”force” /> ;默认安装Word组件 <OptionState Id=”EXCELFiles” State=”Local” Children=”force” /> ;默认安装Excel组件 <OptionState Id=”PPTFiles” State=”Local” Children=”force” /> ;默认安装PowerPoint <OptionState Id=”ACCESSFiles” State=”Local” Children=”force” /> ;默认安装Access

01

Python可视化库

现如今大数据已人尽皆知,但在这个信息大爆炸的时代里,空有海量数据是无实际使用价值,更不要说帮助管理者进行业务决策。那么数据有什么价值呢?用什么样的手段才能把数据的价值直观而清晰的表达出来? 答案是要提供像人眼一样的直觉的、交互的和反应灵敏的可视化环境。数据可视化将技术与艺术完美结合,借助图形化的手段,清晰有效地传达与沟通信息,直观、形象地显示海量的数据和信息,并进行交互处理。 数据可视化的应用十分广泛,几乎可以应用于自然科学、工程技术、金融、通信和商业等各种领域。下面我们基于Python,简单地介绍一下适用于各个领域的几个实用的可视化库,快速带你入门!!

02
领券