mblog - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

抓取个人微博之 Ajax 数据爬取

数据分析入门系列教程-微博热点

在前面，我们学习了爬虫的基本流程和必备技能，对于刚刚入门的人来说，打好基础，掌握基本步骤是最为重要的。

Notepad-- 轻量级文本编辑器的安装及基本使用

3.Notepad--v2.10.0-win10-portable.zip 是绿色免安装版本，解压即用，不会关联右键菜单注册表。

python 新浪微博爬虫

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/7/1 上午3:29 # @Author : BrownWang # @Email : 277215243@qq.com # @File : sinaweibo.py # @Software: PyCharm # -*- coding: utf-8 -*- import urllib.request import json import time import s

01-Djangob部署与安装

linux系统下部署Django 1、Python3安装 2、setuptools安装 3、django安装

Hadoop2.4 支持snappy

我们Hadoop 2.4集群默认不支持snappy压缩，但是最近有业务方说他们的部分数据是snappy压缩的（这部分数据由另外一个集群提供给他们时就是snappy压缩格式的）想迁移到到我们集群上面来进行计算，但是直接运行时报错：

Python抓取指定微博用户最新动态

首先需要获取目标用户的oid。进入目标用户主页，按F12打开控制台，在Element页按Ctrl+F打开搜索栏，输入oid即可，然后将oid填入get_weibo.py

JAVA 应用线上故障排查手册

线上故障主要会包括 CPU、磁盘、内存（含JVM）以及网络问题，而大多数故障可能会包含不止一个层面的问题，所以进行排查时候尽量四个方面依次排查一遍。基本上出问题就是 df、free、top、jstack、jmap具体问题具体分析

python和Ajax在一起了？真的？？？

有些时候我们使用浏览器查看页面正常显示的数据与使用requests抓取页面html得到的数据不一致，这是因为requests获取的是原始的HTML文档，而浏览器中的页面是经过JavaScript处理数据后的结果。这些处理过的数据可能是通过Ajax加载的，可能包含HTML文档中，可能经过特定算法计算后生成的。

Python实现单博主微博文本、图片及热评爬取

文章简介经常刷微博的同学肯定会关注一些有比较意思的博主，看看他们发的文字、图片、视频和底下评论，但时间一长，可能因为各种各样的原因，等你想去翻看某个博主的某条微博时，发现它已经被删除了，更夸张的是发现该博主已经被封号。那么如果你有很感兴趣的博主，不妨定期将Ta的微博保存，这样即使明天微博服务器全炸了，你也不用担心找不到那些微博了。（自己的微博也同理哦。）看网上一些微博爬虫，都是针对很早之前的微博版本，而且爬取内容不全面，比如长微博不能完整爬取、图片没有爬取或没有分类，已经不适用于对当下版本微博内容的

爬虫课程（十二）｜ajax分析法（微博）：通过获取api爬取新浪微博内容数据实战

一、回顾我们之前利用Scrapy爬取豆瓣网站信息时，直接通过加载目标URL返回的Response得到想要的值。我也在后面爬取知乎网站时通过模拟登录的方式进入到目标URL，也是通过返回的Response得到需要的值。这一次，我们将通过解析网站的HTTP请求去破解获取数据的API的方式去爬取想要的数据。二、找出微博用户唯一标示：oid 一般做爬虫爬取网站时，首选的都是m站，其次是wap站，最后考虑PC站，因为PC站的各种验证最多。当然，这不是绝对的，有的时候PC站的信息最全，而你又恰好需要全部的信息，那

调研了 100 来个 Java开源博客系统，发现这 7 个最哇塞！

因为个人需求，我重新整理了一些 Java 博客系统，大部分都是基于 Spring Boot 开发的。

微博全站爬虫修复更新啦！！！

说一声抱歉，当时那段时间我实在太忙，就没有立刻解决，但是记在备忘录上，但是今天下午终于可以有空闲了，就着手解决了这个问题；问题主要是由微博接口和网页结构的变化引起的，现将有关修改过程及结果修改如下；同时会详介绍如何获取 cookies 。

分享10个优质的Java练手项目

最近有很多小伙伴私信我说推荐几个毕设项目，在这里我收集了10个可以直接导入运行的项目。

分享10个优质的Java练手项目

最近有很多小伙伴私信我说推荐几个毕设项目，在这里我收集了10个可以直接导入运行的项目。

Python 爬取“工商秘密”微博后，我做了这个“可视化大屏”（附gif图）

微博作为我的日常软件之一，平时除了看看热搜、肖战（哈哈），我还会时不时看看秘密，虽然从来都没有投过稿，但还是会对一些感兴趣的内容评论评论或者点点赞，前两天刷秘密突然很想知道，

掌握XSS与CSFR，我也可以是个黑客！

今天呀，我想当一名黑客，去黑别人的网站！我有两三技能，独乐不如众乐乐，今天我也把这个几个攻击手段教给你，咱们一起搞事情去。

掌握XSS与CSFR，我也可以是个黑客！

今天呀，我想当一名黑客，去黑别人的网站！我有两三技能，独乐不如众乐乐，今天我也把这个几个攻击手段教给你，咱们一起搞事情去。

python爬虫抓取新浪微博数据

新浪微博的数据是用ajax异步下拉加载的，在chrome的调试模式下可捕捉到相应的请求：

爬取许嵩的所有微博并存入MongoDB

我很喜欢许嵩的音乐，我以前基本上他的每首歌都会唱，比如《素颜》、《灰色头像》、《玫瑰花的葬礼》、《清明雨上》、《庐州月》等等，打开播放器，基本上都是循环播放许嵩的歌，简直欲罢不能！

HTML5 Web Worker的使用

Web Workers 是 HTML5 提供的一个javascript多线程解决方案，我们可以将一些大计算量的代码交由web Worker运行而不冻结用户界面。

Python爬虫之Ajax分析方法与结果提取

这里还以前面的微博为例，我们知道拖动刷新的内容由 Ajax 加载，而且页面的 URL 没有变化，那么应该到哪里去查看这些 Ajax 请求呢？

开源一款多人博客或者社区网站系统,适用于资讯网站!

MB MB是基于Jfinal开发的多人博客或者社区网站,二次开发之后也可以作为资讯网站等。具有简单、大气、美观、响应式设计，易二次开发的优点。前台有一部分界面参考了[mblog]，后台使用AdminLTE。第一次开源，本人水平有限，很多地方还可以改进，有不足的地方还请大家多多指正。参考网站： http://mb.daymooc.com 技术选型： JDK8 Jfinal 3.1 缓存 Ehcache 视图模板 Jfinal enjoy模板其它 Jsoup、fastjson、ajax jQuery Boo

BigDecimalUtils 转换工具类

package com.mtons.mblog.base.utils; import org.apache.commons.lang3.ObjectUtils; import org.apache.commons.lang3.StringUtils; import java.math.BigDecimal; import java.text.DecimalFormat; public class MoneyUtils { /** * 将钱格式化 */ privat

Python爬虫之微博好友圈代码代码分析词云

数学建模已结束，刚开始的目标就是不熬夜，结果还是熬夜了（QAQ），缓了一天就来写简书了，感觉很久没爬虫了，今天就爬下移动端的微博好友圈信息。代码 import requests import json headers = { 'Cookie':'xxxxxxxx', 'User_Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Saf

MYSQL中日期与字符串间的相互转换

SELECT * FROM tairlist_day WHERE rq>’2010-07-31′ AND rq<‘2010-09-01’

python实现在线微博数据可视化

完整代码gitee地址：https://gitee.com/lyc96/weibo

新浪微博布局学习——妙用TabHost

为了更好的开发Android应用程序，除了熟练掌握基本的UI组件和API外，还需要掌握一些技巧，而这些技巧可以通过阅读一些代码来提高，本系列将与大家分享一些新浪微博布局方面的收获，欢迎交流！

开源免费的Java多人博客系统

5. 重新定义了Group概念, 即内容分组, 不再有原来复杂的模板定制等, 去除了原有的视频和问答定制, 可以在Group里面自行扩展

JSP博客管理系统myeclipse开发mysql数据库mvc结构java编程

JSP博客管理系统是一套完善的web设计系统，对理解JSP java编程开发语言有帮助 mvc结构，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。本系统包括设计源码相关文档，详情咨询Q 251836457

Python黑科技：利用Python实现微博监控小姐姐动态

0x00 前言: 前几个星期在写一个微博监控系统可谓是一波三折啊获取到微博后因为一些字符编码问题导致心态爆炸开发中断但是就在昨天发现了另外一个微博的接口一个手机微博的接口https://m.

Python | 利用Python实现微博监控小姐姐动态

作者：奶权来源：http://www.jianshu.com/p/9e7ba0a0a610

深入理解JS异步编程四（HTML5 Web Worker）

>Web Workers 是 HTML5 提供的一个javascript多线程解决方案，我们可以将一些大计算量的代码交由web Worker运行而不冻结用户界面。

如何保存微博的所有图片链接并下载图片到本地

但是今天不止一个读者跟我反馈，图片 url 保存不了了，就算是有图片的微博，原始图片 url 列也是空的。

微博（APP）榜单爬虫及数据可视化

首先对部分用户id进行可视化，字体大一点的是上榜2次的（这次统计中最多上榜的是2次）。

Linux中Nginx配置域名访问多个项目解决方案

首先是系统环境：CentOS7，Nginx版本：1.62（如需其他版本自行到官网下载）

Flask实现微博画像采集小工具

Flask是Django之外用Python实现的另一优秀Web框架。相对于功能全面的Django，Flask以自由、灵活著称。在开发一些小应用的时候使用Flask就非常合适。本文将使用Flask开发一个微博用户画像的生成器。

Scrapy框架的使用之Scrapy爬取新浪微博

前面讲解了Scrapy中各个模块基本使用方法以及代理池、Cookies池。接下来我们以一个反爬比较强的网站新浪微博为例，来实现一下Scrapy的大规模爬取。一、本节目标本次爬取的目标是新浪微博用户的公开基本信息，如用户昵称、头像、用户的关注、粉丝列表以及发布的微博等，这些信息抓取之后保存至MongoDB。二、准备工作请确保前文所讲的代理池、Cookies池已经实现并可以正常运行，安装Scrapy、PyMongo库。三、爬取思路首先我们要实现用户的大规模爬取。这里采用的爬取方式是，以微博的几

新浪微博IPAD客户端XSS(file域) + 构造Worm

Izy发现，当我们通过第三方APP“快手”，将信息分享到微博时，信息内容就会造成一个XSS。当用户在ipad版微博客户端上查看这条微博的时候，即触发。我们这次的目的就是让这个存储型XSS变成蠕虫。

自造微博轮子，再爬姐姐和奶奶殿下

缘起昨天写了一篇文章，主要是有感于文章马伊琍的婚姻，才爬了下他们微博下的评论，结果有位老哥说

教小师妹快速入门Mybatis，看这篇就够了

上面代码中知识为了展示JDBC整个过程（异常和资源是简单粗暴的处理了，我们关注的点不在这两个）。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐