linux df -li_df linux_linux df - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

【小白必看】Python爬虫数据处理与可视化

Python爬取豆瓣电影Top250并进行数据分析

利用Python爬取豆瓣电影TOP250并进行数据分析，爬取’排名’,‘电影名称’,‘导演’,‘上映年份’,‘制作国家’,‘类型’,‘评分’,‘评价分数’,'短评’等字段。

8天长假快来了，Python分析【去哪儿旅游攻略】数据，制作可视化图表

2023年的中秋节和国庆节即将来临，好消息是，它们将连休8天！这个长假为许多人提供了绝佳的休闲机会，让许多人都迫不及待地想要释放他们被压抑已久的旅游热情，所以很多朋友已经开始着手规划他们的旅游行程。

Python对豆瓣电影Top250并进行数据分析

由于CSDN审核机制，导致原文章无法发出，故修改了相关词汇，并改为两篇问章发布。数据获取翻页操作 📷 观察可知，我们只需要修改start参数即可 headers字段 headers中有很多字段，这些字段都有可能会被对方服务器拿过来进行判断是否为爬虫通过headers中的User-Agent字段来原理：默认情况下没有User-Agent，而是使用模块默认设置解决方法：请求之前添加User-Agent即可；更好的方式是使用User-Agent池来解决（收集一堆User-Agent的方式，或

Python爬取豆瓣电影Top250并进行数据分析

利用Python爬取豆瓣电影TOP250并进行数据分析，爬取’排名’,‘电影名称’,‘导演’,‘上映年份’,‘制作国家’,‘类型’,‘评分’,‘评价分数’,’短评’等字段。

R语言快速入门上手

较早之前就听说R是一门便捷的数据分析工具，但由于课程设计的原因，一直没有空出足够时间来进行学习。最近自从决定本科毕业出来找工作之后，渐渐开始接触大数据行业的技术，现在觉得是时候把R拿下了；用了3天时间，除了对R先有一个大概认识之外，也着手敲指令。由于计算机专业的底子还不错，而且先后接触过不下10种编程语言，感觉R语言入门上手还是挺简单的。下面是自己汇总的一些简单入门代码供大家参考，感兴趣的朋友也可逐行敲打测试。

Python开发物联网数据分析平台---web框架

前端使用Bootstrap主题框架AdminLTE，后台使用python语言的tornado作为web框架。利用tornado的模板作为主要的动态页面生成方式，以及巧妙使用模板将json数据渲染到页面hidden元素的值，然后在js中直接用eval函数计算隐藏域的值来生成图表JavaScript插件所需的json数据来生成页面中相应的可视化图表。

实践应用|Python自动化连接FTP批量下载指定文件

有个小姐姐要从历史数据日志里根据一定的规则筛选一批数据，这批数据中有对局战场id字段，再根据这些id转化为文件名，连接远程FTP搜索该文件并下载到本地，然后打开文件删除前5行并在第6行行首添加一个字母，最后将该文件后缀名修改。一天处理50+个这样的文件转化需求，简单算了下，差不多刚好要一天时间吧！！

fastdfs简单实现

首先我们现在一台机器上完成client、tracker、storage三部分的安装

python基础1

如果同时安装 python2.7 和python3.5 要在python3.5的安装路径下将python.exe改名

使用 Pandas, Jinja 和 WeasyPrint，轻松创建一个 PDF 报表

我们都知道，Pandas 擅长处理大量数据并以多种文本和视觉表示形式对其进行总结，它支持将结构输出到 CSV、Excel、HTML、json 等。但是如果我们想将多条数据合并到一个文档中，就有些复杂了。例如，如果要将两个 DataFrames 放在一张 Excel 工作表上，则需要使用 Excel 库手动构建输出。虽然可行，但并不简单。本文将介绍一种将多条信息组合成 HTML 模板，然后使用 Jinja 模板和 WeasyPrint 将其转换为独立 PDF 文档的方法，一起来看看吧~

DrugBank

官网： web：https://www.drugbank.com/ 简介： DrugBank是一个精选的药品知识库，其产品可在市场上购买，用于精准医学，远程医疗和药物发现。药品信息结构化，统一化。

Python 爬取链家成都二手房源信息 asyncio + aiohttp 异步爬虫实战

编辑 | JackTian 来源 | 杰哥的IT之旅（ID：Jake_Internet）转载请联系授权（微信ID：Hc220066）

pandas+PyQt5轻松制作数据处理工具

由于在工作中需要处理很多日志文件数据，这些数据并不存在于数据库，而是以每日1个单文件的形式存在，为了让我们在日常数据处理中更方便的进行一些基础的数据合并、清洗筛选以及简单的分组或数据透视处理，结合PyQt5与pandas库，制作了一个简单的数据处理可视化工具。

实战｜用pandas+PyQt5制作一款数据分组透视处理工具

早起导读：pandas是Python数据处理的利器，如果每天都要使用pandas执行同样的操作，如何制作一个有界面的软件更高效的完成？本文提供了一种基于PyQt5的实现思路。

安装Selenium自动化测试框架、并用Selenium爬取拉勾网最新职位数据

本文主要讲解selenium的安装和基础使用，然后利用selenium爬取拉勾网最新的职位信息。

Python数据分析实战(1) 成都土地市场分析

土地市场数据一般会公示在当地的公共资源交易中心，但经常会出现只公示当周或当月数据的情况，因此，我们得去找专业的土地网站获取交易数据。比如土流网：https://www.tudinet.com/market-0-0-0-0/

对社区技术偏好和区域分布分析之后，我发现孤单的人只有我

如何使用python对腾讯云开发者社区各位创作者，进行一个区域和技术偏好分析。作为数据分析的课题，我们首先想到的就是，如何去收集创作者们的区域和技术偏好数据。

2019CCF-BDCI-乘用车细分市场销量预测方案（Top1%）

本文将带来最近一场比赛的方案分享，这是一场有关时间序列的问题，虽然没有进决赛，不过很多点还是非常值得学习的。希望能给大家带来帮助，也欢迎与我进行更多讨论。

图解大数据 | 综合案例-使用Spark分析挖掘音乐专辑数据

教程地址：http://www.showmeai.tech/tutorials/84

AI网络爬虫-从当当网批量获取图书信息

你是一个Python爬虫专家，一步步的思考，完成以下网页爬取的Python脚本任务：

使用网络爬虫自动抓取图书信息

网络爬虫是一种从互联网上进行开放数据采集的重要手段。本案例通过使用Python的相关模块，开发一个简单的爬虫。实现从某图书网站自动下载感兴趣的图书信息的功能。主要实现的功能包括单页面图书信息下载，图书信息抽取，多页面图书信息下载等。本案例适合大数据初学者了解并动手实现自己的网络爬虫。

基于bs4+requests爬取世界赛艇男运动员信息(进阶篇)

在详情页面，部分页面具有5个字段信息，部分页面具有2个字段信息。每个字段信息都在li标签中，对每个li标签做循环遍历。将li标签中的第1个class等于dt的div标签作为字典的键，将li标签中的第1个class等于dd的div标签作为字典的值。将数据收集结果item_list数据持久化为excel时，对变量item_list进行循环遍历，excel表格的字段名要赋值为最长字段的字典的所有字段。

用python爬取豆瓣读书网中所有图书的基本信息，全部都一目了然！

互联网给了我们很多的方便，而网络小说、电子书等也应潮流而发展，方便了人随时查看想要看的图书，方便携带。

Python数据分析之Pandas（四）

: | -----: | -----: | ---: | ---------: | -------: | | 0 | 1 | F | 1 | 10 | 48067 | | 1 | 2 | M | 56 | 16 | 70072 | | 2 | 3 | M | 25 | 15 | 55117 | | 3 | 4 | M | 45 | 7 | 02460 | | 4 | 5 | M | 25 | 20 | 55455 |

Linux硬链接，软链接

文件是存储在硬盘上的，硬盘最小单位叫扇区(sector)，每个扇区存储512字节。操作系统读取硬盘的时候，如果一个一个读取那效率很低，因此一次性读取多个扇区，即一次性读取一个块(block)。这种多个扇区组成的块，就是文件存取的最小单位。block的大小最常见的是4KB，即连续8个sector组成一个block。

python在租房过程中的应用

总第84篇 01|背景介绍：租房是再普遍不过的一件事情了，我们在租房过程中常考量的两个因素是出租房离公司的远近以及价格，而我们一般都会去链家上看相应的信息，但是链家网只有价格没有距离，对于我这种对帝都不是很熟的人，对各个区域的位置是一脸懵逼，所以我就想着能不能自己计算距离呢，后来查了查还真可以。具体做法就是先获取各个出租房所在地的经纬度和你公司所在地的经纬度，然后进行计算即可。我们在获取经纬度之前首先需要获取各个出租房所在地的名称，这里获取的方法是用爬虫对链家网上的信息进行获取的。关于爬虫可以先看看

python scrapy爬虫练习(1) 爬取豆瓣电影top250信息

文章目录一、分析网页目标URL：https://movie.douban.com/top250?start=0&filter= 每一页有25条电影信息，总共10页。检查网页可以发现，每条电影的详细

自动化系列（三）Python实现定时邮件

在日常数据交付中，定时邮件是必不可少的。一般企业的数仓会开发出相关平台供分析师使用，但仅限于SQL语言，虽然大多数场景下足够了，但难免碰到一些复杂的需求需要SQL查询+Python处理，这个时候就需要自定义的定时邮件了。

Python中的DataFrame模块学

python 3.6.8 Windows x86 executable installer

王者荣耀五周年，带你入门Python爬虫基础操作(102个英雄+326款皮肤)

《王者荣耀》上线至今5个年头了，作为这些年国内最热门的手游（没有之一），除了带来游戏娱乐之外，我们在这五周年之际，试着从他们的官网找点乐趣，学习一下Python爬虫的一些简单基础操作。

python之pandas数据筛选和csv操作

本博主要总结DaraFrame数据筛选方法（loc,iloc,ix,at,iat），并以操作csv文件为例进行说明

python爬虫：利用函数封装爬取多个网页，并将爬取的信息保存在excel中（涉及编码和pandas库的使用）

在之前的文章中，我们已经爬取了单网页的湖北大学贴吧的信息。仔细想一想，单网页也才只有50条信息，如果你想找到女神在哪些时间段发了哪些帖子，这么点信息是远远不够的········（毕竟，女神并不会天天发帖，贴吧每天的发帖数量肯定远远不止50条），所以，为了老铁们的幸福生活/注：并不是为了我自己，因为我女神是我女朋友（不加这句话，怕是要跪搓衣板板）/现在有必要更深入的探讨一下怎么爬取多网页的信息。

数据分析 ——— pandas基础（二）

在了解了pandas数据结构之后，我们来了解一下pandas的统计功能，数据的迭代，排序等

文章马伊琍离婚后微博评论太多了...用代码来解决吧

上周末文章同学的一条微博：“吾愛伊琍，同行半路，一别两宽，餘生漫漫，依然親情守候.”

Python 实现社交网络可视化，看看你的人脉影响力如何

作者 | 俊欣来源 | 关于数据分析与可视化我们平常都会使用很多的社交媒体，有微信、微博、抖音等等，例如在微博上面，我们会关注某些KOL，同时自己身边的亲朋好友等等也会来关注我们自己，成为我们自己的粉丝。而慢慢地随着粉丝的量不断累积，这层关系网络也会不断地壮大，很多信息也是通过这样的关系网络不断地向外传播，分析这些社交网络并且了解透彻它对于我们做出各项商业决策来说也是至关重要的，今天小编就用一些Python的第三方库来进行社交网络的可视化数据来源小编用的数据是来自领英当中的社交数据，由于小编之前

可能是最全的User-Agent列表

User-Aagent String这个网站收集了爬虫、浏览器、主机、邮件客户端等客户端的请求头的UA字段。其中浏览器的UA头有将近10000个。但是访问这个网站很慢。

【年度系列】使用LSTM预测股票市场基于Tensorflow

在本文开始前，作者并没有提倡LSTM是一种高度可靠的模型，它可以很好地利用股票数据中的内在模式，或者可以在没有任何人参与的情况下使用。写这篇文章，纯粹是出于对机器学习的热爱。在我看来，该模型已经观察到了数据中的某些模式，因此它可以在大多数时候正确预测股票的走势。但是，这个模型是否可以用于实际，有待用更多回测和实践去验证。

快速掌握Python数据采集与网络爬虫技术（附代码及操作视频案例）

在课程开始之前，我要先说一段免责声明：这次课程对于数据抓取的相关知识，只做学术探讨，不要利用抓取到的数据做有损访问网站商业利益的事情，比如你也建立一个同样业务的网站；也不要对访问网站的服务器造成压力，影响正常用户的访问。以上也是大家以后在进行数据采集的时候需要注意的。那我们继续讲技术，数据采集对于我们日常的工作有什么帮助呢？我举个例子。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐