有没有办法把这些行组合起来？html抓取_有没有办法把这些查询和计算结合起来？_有没有办法将这些变量以一种有意义的方式组合起来？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

腾讯AI Lab副主任俞栋在GMIS 2017大会上的演讲：语音识别领域的四项前沿研究

本文转载自机器之心作者：黄小天 5 月 27 日，由机器之心主办、为期两天的全球机器智能峰会（GMIS 2017）在北京 898 创新空间顺利开幕。大会第一天重要嘉宾「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯 AI Lab 副主任俞栋、英特尔 AIPG 数据科学部主任、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能专家参与峰会，并在主题演讲、圆桌论坛等互动形式下，从科学家、企业家、

05

[Power BI]零售周报、月报一劳永逸、一网打尽！

凡是在零售行业的同仁，必定要接触数字。各种报表——日报、周报、月报周期性的要制作：也许要追踪销售进度，也许要查看库存水位，也许要看人员绩效等等。

02

您找到你想要的搜索结果了吗？

是的

没有找到

实战 | 记一次实战中SelfXSS+CSRF+越权漏洞的组合拳

在渗透测试中，经常能够遇到这样一种XSS漏洞，它通常存在于比较隐私的个人信息配置等等功能中，有一个非常鲜明的特点就是“只有自己可见，别人不可见”，XSS漏洞只能攻击自己自然是毫无价值的，因此此类Self-XSS几乎不会被SRC所接受。本文通过对一个在线游戏平台的测试经历，提供一种攻击思路，把原本无害的Self-XSS漏洞与其它漏洞结合起来打组合拳，从而实现无害漏洞从无害到高危的利用。

04

玩大数据一定用得到的18款Java开源Web爬虫

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

04

JavaEE - JPA（1）：事务的基础概念

现在任何应用都需要数据持久化。否则就不算是一个完整的应用。那么对于一个数据持久化而言，最重要的无外乎两方面：

02

专访 | 数库CEO刘彦：金融大数据平台是如何「养成」的？

在未来，金融行业的从业门槛会越来越低，当科技让信息不对称的差距变得越来越小，一个人或许能与一家大型的专业机构匹敌。在数库ChinaScope CEO刘彦看来，大数据以及人工智能技术的发展让金融数据平台

05

什么是定点数？

在现实生活中，我们经常使用整数和小数，不知道你有没有思考过，这些数字在计算机中是如何存储的？

01

深入浅出Windows BATCH

BATCH也就是批处理文件，有时简称为BAT，是Windows平台上的一种可运行脚本，与*nix(Linux和Unix)上的Shell脚本和其它的脚本（Perl，Python）等是一样的，实质上就是一个文本文件，可是用特定的软件去解释的时候，就变成了可运行脚本。在Windows上，可运行脚本就是BATCH文件，也叫批处理文件，这是从DOS时代遗留下来的名字，意思就是把非常多命令放到一起来运行。它的扩展名是*.bat，双击便可直接运行，在命令行（CMD或叫做命令提示符）以下也能够当作一个命令来运行。由于这是Windows支持的东西，所以仅仅能在Windows平台使用。（特殊情况除外，不要钻牛角尖，没意思的)。比方著名的Windows垃圾清理小工具就是一个BAT批处理文件。

01

通俗易懂的链表

然后用下一个元素覆盖掉当前元素，同理后面的所有元素都需要前移一位，时间复杂度为O(n)，当数据量很大时，效率就非常低。

03

一文详解神经网络模型

在之前的机器学习基石课程中，我们就接触过Perceptron模型了，例如PLA算法。Perceptron就是在矩gt(x)外面加上一个sign函数，取值为{-1,+1}。现在，如果把许多perceptrons线性组合起来，得到的模型G就如下图所示：

01

使用爬虫抓取网易云音乐热门评论生成好玩的词云

作者：纯臻来源： http://blog.csdn.net/marksinoberg/article/details/70809830 互联网爬虫是一个很有意思的技术，借由爬虫，我们可以做到很多好玩的事情——这其中就包括爬取评论。词云就是个更好玩的技术，通过技术方法分析词语出现频率，生成可视化的图形，将文字内容用图形呈现，想想就很意思。这次，我们就试着把这两个技术结合起来吧。前言网易云音乐一直是我向往的“神坛“，听音乐看到走心的评论的那一刻，高山流水。于是今天来抓取一下歌曲的热门评论。

06

Android App 除了 Java 和 Kotlin 没有第三个选择？怎么可能~！

最近因为好多同学因为各种原因需要学会做一个安卓应用程序，而学会做一个安卓应用程序需要花费的时间和精力是很大的，同时传统的安卓开发还有很多不足，比如当软件进行更新迭代时需要漫长的编译过程。有没有什么办法可以快速做出一个安卓应用程序呢？办法当然是有的，我们可以使用 React Native 来编写安卓应用程序。

01

用Python手把手教你实现一个爬虫（含前端界面）

作为程序员想必对爬虫这个概念很熟悉，这里再来了解一下爬虫的基本原理，爬虫的工作原理其实很简单，它首先会向目标网站发送一个HTTP请求，然后解析服务器返回的HTML页面，从中提取所需的信息，而这些信息可以是文本、图片、链接等。与此同时，爬虫可以根据这些信息来判断是否需要继续抓取该页面，以及如何抓取该页面的其他链接。另外，爬虫主要是通过python语言来具体实现的，本文也是以python语言来做示例语言进行介绍。下面再来分享一下爬虫的设计思路，具体如下图所示：

06

基于微前端的大型中台项目融合方案

关于微前端是什么，以及微前端落地方案，社区遍地都是，本篇文章不会再赘述这些基础知识。当然如果你没了解过上述知识，也可以直接读下这篇文章，足够浅显易懂。这篇文章通过实现一个商城后台，介绍了基于 umi 框架的微前端落地方案，通过这篇文章，你可以收获

01

基于GAN的“真人捏脸”已上线，照片逼真无死角：脸型、五官、表情等均可控制

没错，虽然GAN能生成逼真的人脸，但距离自己理想的人脸，总有那么一点不完美——面部表情、脸上皱纹、发质……

01

Python爬虫在Django项目中的数据处理与展示实例

当谈到Python爬虫技术与Django项目结合时，我们面临着一个引人入胜又具有挑战性的任务——如何利用爬虫技术从网络上抓取数据，并将这些数据进行有效地处理和展示。在本文中，我将为您介绍Python爬虫技术在Django项目中的数据抓取与处理流程。

00

CSP进阶-link Bypass unsafe line

随着时代的发展,XSS也成不可磨灭的漏洞之一，但是攻和防的进化总是相互交织的，所以CSP也应运而成，以白名单为基础而建立的防御策略本以为会是xss的克星，但事实并不是这样的，曾经也写过一篇文章

02

不是科班生，不会知道计算机中的「小数点」问题！

回顾下，定点数的含义。约定计算机中小数点的位置，且这个位置固定不变，小数点前、后的数字，分别用二进制表示，然后组合起来就可以把这个数字在计算机中存储起来，这种表示方式叫做「定点」表示法，用这种方法表示的数字叫做「定点数」。

01

大厂前端面试考什么?

一个拥有 length 属性和若干索引属性的对象就可以被称为类数组对象，类数组对象和数组类似，但是不能调用数组的方法。常见的类数组对象有 arguments 和 DOM 方法的返回结果，还有一个函数也可以被看作是类数组对象，因为它含有 length 属性值，代表可接收的参数个数。

07

语音助手是什么？未来的语音助手是什么样子的？

从字面上看，语是说话，音是声音，助手是辅助的意思，合起来就是说话声音辅助，人与人之间交流可以通过语音即可完成沟通交流，不需要助手，然而，人和设备之间的语音交流，由于人和设备构造的不同，就必须给设备安装一个语音助手，帮助设备理解人的说话的意思，设备才会正确执行人的语音的命令。所以，语音助手怎么理解人说的语音内容，就非常重要，目前市面上的语音助手，可以理解简单的人的语音内容，稍微复杂点，容易搞出笑话或者不执行，比如，我想和某人说话，设备就无法理解了，改成我想给某人打电话，它就能帮您启动打电话给某人，对此，语音助手是一个比较低智能化，具备有限能力，减少人动手操作并安装在设备上的软件。

03

跟我学爬虫，看大神不到30行代码做的一个简单爬虫！

已经看了那么多基础知识了，下面我们做几个实战项目来挑战一下吧。这次为大家带来，Python爬取校花网美女图片的例子。

02

Python爬虫开发的3大难题，别上了贼船才发现，水有多深

写爬虫，是一个非常考验综合实力的活儿。有时候，你轻而易举地就抓取到了想要的数据；有时候，你费尽心思却毫无所获。

02

基于GAN的“真人捏脸”已上线，照片逼真无死角：脸型、五官、表情等均可控制

萧箫发自凹非寺量子位报道 | 公众号 QbitAI 使用GAN生成的2D人脸模型很美丽，然而却终究缺了点什么？没错，虽然GAN能生成逼真的人脸，但距离自己理想的人脸，总有那么一点不完美——面部表情、脸上皱纹、发质…… 由于GAN没办法进行参数调控，即使人脸再逼真，也没办法控制五官等细节。现在，一个新模型GIF （Generative Interpretable Faces）的出现打破了这一定律：不仅能用GAN生成逼真的人脸，而且还能通过具体的参数控制它。这是怎么做到的？用3D模型的参

02

如何让搜索引擎抓取AJAX内容？

越来越多的网站，开始采用"单页面结构"（Single-page application）。整个网站只有一张网页，采用Ajax技术，根据用户的输入，加载不同的内容。这种做法的好处是用户体验好、节省流

03

一日一技：一行代码把包含二元组的列表拆成两个列表

我们知道，当我们有两个长度一样的列表的时候，可以使用 zip快速把它组合起来。例如：

02

LeetCode刷题实战91：解码方法

算法的重要性，我就不多说了吧，想去大厂，就必须要经过基础知识和业务逻辑面试+算法面试。所以，为了提高大家的算法能力，这个公众号后续每天带大家做一道算法题，题目就从LeetCode上面选！

01

HTML
和

元素没有特定的含义。除此之外，由于它属于块级元素，浏览器会在其前后显示折行。

01

GMIS 2017 | 腾讯AI Lab副主任俞栋：语音识别研究的四大前沿方向

机器之心整理演讲者：俞栋 5 月 27-28 日，机器之心在北京顺利主办了第一届全球机器智能峰会（GMIS 2017），来自美国、加拿大、欧洲，中国香港及国内的众多顶级专家分享了精彩的主题演讲。在这

08

硬纪元干货|暴风集团王刚：VR2.0即将到来，行业逐步开始理性成长

VR2.0模式下的商业需要从VR技术产品、VR内容、B端应用、终端消费者等几方面切入，并现场分析了VR教育、VR娱乐、VR医疗等具体应用案例。 5月18日，由镁客网、IT耳朵联合举办的“2017中国V

06

从抓取豆瓣电影聊高性能爬虫思路

顶部导航为提供了很多种类型的入口，其中和电影有关的有：排行榜、选电影和分类。为了便于后续更精细的分析，这里选择进入分类页面，地址。通过浏览的开发工具，我们最终能确认数据来源是的

04

vivo前端智能化实践：机器学习在自动网页布局中的应用

在设计稿转网页中运用基于self-attention机制设计的机器学习模型进行设计稿的布局，能够结合dom节点的上下文得出合理的方案。

04

说话夹杂English的人：我不是要装X，只是Brain功能太强

只要你能把两种语言都学到熟练，那切换起来太过自然、简单，甚至切换的时候都意识不到。

04

Python爬虫与逆向工程技术的结合，实现新闻网站动态内容的多线程抓取

嗨，亲爱的python小伙伴们，大家都知道Python爬虫是一种强大的工具，可以帮助我们从网页中提取所需的信息。然而，有时候我们需要从新闻网站抓取动态内容，但是有些新闻网站使用了动态内容加载技术使得传统的爬虫方法无法获取完整的新闻内容。在这种情况下，我们可以借助逆向工程技术，结合多线程抓取的方式，来实现对新闻网站动态内容的抓取。本文将向你展示如何使用Python编写一个多线程爬虫，通过逆向工程技术实现对新闻网站动态内容的摘要。废话不多说了，让我们开始吧！

02

元素定位和定位辅助工具

selenium里面有很多东西，第一个就是webdriver，web自动化中主流用的东西，它可以支持非常多的语言。它有个录制工具是selenium ide，短期内一周内有个效果可以用录制，录制是非常简单的。但是正经做项目的时候，是从来不用selenium ide的。

01

业界 | 让机器人学会理解语义概念：谷歌提出深度视觉新技术

选自Google Research Blog 作者：Sergey Levine 机器之心编译参与：黄小天、路雪近日，谷歌官方博客上发表了一篇题为《Teaching Robots to Understand Semantic Concepts》的文章，探讨了在机器人学习（robotic learning）方面的一些最新进展。机器人学习是指通过机器人自动收集的数据（量很大，但是缺乏标签）与人类的标注数据结合起来从而允许其理解语义概念。通过深度视觉特征（deep visual features），机器人在人类

07

Java和Python思维方式的不同之处

我刚刚开始工作的时候，其实特别讨厌Java。因为它太繁琐，就像一个絮絮叨叨的老奶奶。但后来因为工作原因强行写了一年的Java，反而不那么讨厌它了。

05

数据湖应用案例有哪些数据湖是如何进行工作的

社会中的资源各种各样，如果依靠自己的力量，是没有办法将资源整合好的，而数据湖却可以，它能够存储很多的数据资源，对于管理和办公来说，有着很大的作用，以下就是数据湖应用案例。

03

JavaScript中几种常用的设计模式

设计模式：代码书写经验，为了应对各种场景，经过前人不断的总结，压缩，形成的一套又一套的代码的书写规范，形成了设计模式。

01

如何识别、抓取和构建高质量机器学习数据集（上）

数据是任何机器学习问题的核心。如果没有相关数据的访问，机器学习目前所取得的所有进步都是不可能的。话虽如此，如今大多数机器学习爱好者都专注于获取方法论知识(这是一个好的开始，但不能超越)。

02

思路分享 | 从零模拟一次实战记录并成功提权

前天下午，风和日丽，我呆呆的坐在电脑前，思考着我存在的意义。这时，大佬突然走进机房，扔给我了一个靶机，让我搞定它。瑟瑟发抖的我，也不敢问什么，扛着靶机来到了一个没人的地方。打算花些时间来研究下。

03

Python 网络抓取和文本挖掘-1 H

偶然在图书馆看到《基于R语言的自动数据收集：网络抓取和文本挖掘实用指南》，被第一章概述所吸引，迫不及待地借回来，下载代码在RStuido里进行实验。然后断断续续，囫囵吞枣式地翻了一遍，增长了知识，但没有如预期提升技能。决定换一种方式，照着书里的内容，用Python实现一遍，作为读书笔记。结果第一章就遇到困难了，要实现第一章的例子需安装basemap、geos等一系列包，还要实现对表格数据的提取。那就从第二章开始吧，直到第八章，然后再回过头来完成第一章的例子。

04

挖洞经验 | 记一次曲折的Getshell过程

最近在挖某框架的漏洞，其中挖到一枚Getshell，挖的过程有点曲折感觉可以写篇文章总结一下，方便与各位大牛交流交流。因为此框架有大量用户，并且此漏洞并未修复，故此隐去所有有关此框架的信息，连文章中

09

Appium之「元素定位和UiAutomator表达式」

xpath 相对定位：如果相对定位中这个元素是有 id 的，这个 id 是唯一的，xpath 定位中优先通过 id 来定位。

02

实验：用Unity抓取指定url网页中的所有图片并下载保存

突发奇想，觉得有时保存网页上的资源非常麻烦，有没有办法输入一个网址就批量抓取对应资源的办法呢。

03

序列周期性与魔术（三）——经典应用与改良

在前面的文章中，我们从数学里的周期性入手，分析了序列周期性在对称群下的本质，以及如何把这一基本性质应用到魔术中的例子。

02

CCAI 2017 | 日本理化学研究所杉山将：弱监督机器学习的研究进展

日本理化学研究所先进智能研究中心主任杉山将记者 | JayZhang 7 月 22 - 23 日，在中国科学技术协会、中国科学院的指导下，由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办的 2017 中国人工智能大会（CCAI 2017）在杭州国际会议中心盛大召开。在本次大会上，日本人工智能和机器学习领域新一代的代表性人物——日本理化学研究所先进智能研究中心主任Masashi Sugiyama（中文名：杉山将）为参会者带来了《弱监督机器学习的研究进展》的演讲。

Appium之「元素定位和UiAutomator表达式」

xpath 相对定位：如果相对定位中这个元素是有 id 的，这个 id 是唯一的，xpath 定位中优先通过 id 来定位。

03

Python爬虫在Django项目中的数据处理与展示实例

接下来，我们将Django项目与爬虫脚本结合起来。我们可以在Django项目中创建一个新的应用程序，然后编写视图函数来处理爬虫抓取到的数据。在视图函数中，我们可以调用爬虫脚本，并将抓取到的数据传递给模板进行展示。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭