腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
4
回答
我
需要
一个
强大
的
Web
Scraper
库
c#
、
.net
、
web-crawler
、
web-scraping
我
需要
一个
强大
的
网络挖掘
库
从网络上挖掘内容。既可以付费,也可以免费,两者对
我
来说都很好。请建议
我
一个
图书馆或更好
的
方法来挖掘数据并存储在
我
喜欢
的
数据
库
中。
我
已经找过了,但我没有找到任何好
的
解决方案。
我
需要
专家
的
好建议。请帮帮我。
浏览 2
提问于2010-12-07
得票数 29
1
回答
使用
Web
::
Scraper
从.onion站点中刮取
perl
、
proxy
、
scrape
、
tor
、
torsocks
问题:使用网站::刮刀从tor .onion站点上刮走现行守则:my $piratelink=$PIRATEBAYSERVER.'/search/' .'/0/7/0';
浏览 1
提问于2016-04-17
得票数 1
回答已采纳
2
回答
分离Subversion存储
库
并创建部署策略
linux
、
svn
、
model-view-controller
、
repository
我
的
网站有两个独立
的
组件:网站(MVC)和基于php cli
的
scraper
。这两个组件共享公共模型文件,但部署在不同
的
服务器上。现在,它们都使用相同
的
存储
库
。
我
期待外包
的
刮板开发,但我希望保持在房子
的
网站发展。因此,
我
认为最好
的
方法是为网站、
scraper
和共享文件建立单独
的
存储
库
。但是,
我
浏览 2
提问于2011-08-20
得票数 0
3
回答
我
想从playstore获得应用程序
的
版本号
flutter
、
web-scraping
、
jsoup
、
html-parsing
在android中,我们使用JSOUP依赖项从playstore获取版本号,但在颤栗中无法找到备用版本。
浏览 3
提问于2020-03-26
得票数 0
1
回答
在Moose中创建
一个
Web
::
Scraper
对象作为class属性
perl
、
moose
我
正在尝试具体地模仿,这个属性:has 'worker' => ( isa => '
Web
::
Scraper
',
scraper
(sub { });); 但是,当我将相同
的
代码放入
我
的</e
浏览 16
提问于2017-02-01
得票数 4
回答已采纳
2
回答
用于访问和检索信息
的
Perl或MySQL
html
、
mysql
、
perl
、
parsing
我
试图检索几个网页以便
我
可以操纵他们
的
信息。
我
正在寻找什么是最好
的
工具和软件包来做这件事。最好是使用Perl来解析表,但是
我
也可以使用MySQL,尽管我必须学习它。(
我
相信它们是HTML表,尽管页面是用Java编写
的
。)
我
要求
的
不是任何代码,而是关于我如何做到这一点
的
意见、建议和建议。目前,
我
的
意图是解析这些表,合并它们,并构建
一个
表,其中包含
浏览 1
提问于2014-06-05
得票数 0
回答已采纳
1
回答
winform not浏览器未被替换
c#
、
winforms
、
class
、
browser
、
webbrowser-control
在
我
的
Form1中,
我
初始化了
一个
类
scraper
。在
scraper
类中有
一个
函数login。其思想是,该类将用户登录到网站上,并返回
web
浏览器,以便在Form1中可以使用登录
的
webbrowser控件。到目前为止,
我
已经掌握了以下代码:Form1{
Scraper
sc
浏览 0
提问于2013-08-07
得票数 0
回答已采纳
1
回答
如何在函数返回0之前禁用PyQt4中
的
按钮(或整个主窗口)
python
、
pyqt
、
pyqt4
我
有
一个
web
刮刀脚本,让我们称它为
scraper
.py,它将数据写入数据
库
。
我
用显示数据库内容
的
tableWidget制作了gui。现在,
我
添加了
一个
按钮,它将从
scraper
.py脚本调用main()函数。由于
scraper
正在使用selenium,并且花费了大约20秒来完成所有操作(从打开浏览器到关闭它),
我
希望在
scraper
.py完成之前禁用该按钮(或者
浏览 2
提问于2015-11-22
得票数 0
回答已采纳
4
回答
Python - Cloudflare阻止
的
请求
python
、
python-3.x
我
正在尝试登录
一个
网站。当我查看print(g.text)时,
我
得到
的
不是
我
期望
的
网页,而是
一个
cloudflare页面,上面写着“访问前检查您
的
浏览器”。
浏览 1
提问于2018-03-04
得票数 10
回答已采纳
3
回答
在rails中返回数组并存储它
mysql
、
ruby-on-rails
、
arrays
我
知道这听起来可能是
一个
“简单
的
问题”,但我是rails
的
新手,
我
不知道
我
的
应用程序结构是否正确。 class JPG < ActiveRecor
浏览 1
提问于2013-08-30
得票数 1
1
回答
如何修复无法加载这样
的
文件- Nokogiri (LoadError)在c9.io中?
ruby
、
rubygems
、
nokogiri
、
cloud9-ide
我
正在为Ruby使用Cloud9 IO。
我
运行了包安装。甚至安装了宝石。但我还是会发现这个错误。猩红花:~/workspace/nokogiri_ ruby (主)$ruby
web
_
scraper
.rb
web
_
scraper
.rb require': cannot load such fileusr/local/rvm/rubies/ruby-2.3.0/lib/ruby/2.3.0&
浏览 0
提问于2016-10-03
得票数 0
2
回答
我
如何“获得”数据
的
所有酒吧/俱乐部在美国
的
数据
库
。Yelp API?
java
、
database
、
json
、
screen-scraping
、
data-mining
我
要做
的
是创建
一个
美国所有酒吧
的
数据
库
。
我
需要
这个数据
库
半定期更新(大约每周),以包括新开
的
酒吧。 yelp api
的
问题是他们只返回20个结果。在
我
周围5英里
的
范围内有800多家酒吧。
我
如何才能现实地实现
我
的
目标?
浏览 0
提问于2011-01-18
得票数 1
2
回答
使用
Web
::
Scraper
提取javascript
javascript
、
html
、
perl
、
parsing
我
在使用
Web
::
Scraper
提取javascript时遇到了问题。下面是
我
的
测试脚本:use Modern::Perl;use Data::Dumper; my $
scraper
=
scraper
{ process &quo
浏览 1
提问于2013-05-22
得票数 1
2
回答
Heroku和
Web
抓取
ruby
、
web-services
、
api
、
heroku
、
sinatra
我
有
一个
nokigiri网络爬行器,它发布到
一个
数据
库
,
我
正试图发布到heroku。
我
有
一个
sinatra应用程序前端,
我
想从数据
库
中拉入它。
我
是Heroku和
web
开发
的
新手,不知道处理这种事情
的
最好方法。
我
是不是必须将上传到数据
库
的
web
scraper
脚本放在sinat
浏览 1
提问于2013-07-12
得票数 7
3
回答
如何使用
Web
::
Scraper
仅从
一个
表中进行选择?
css
、
html
、
perl
、
css-selectors
我
想从网页中提取只用于标题节点对象方法
的
文本。: process "table.reference > tr > td > a", 'renners[]' => 'TEXT'; print $res2->{renners}[$i];}
我
得到了所有标签
的<
浏览 0
提问于2013-02-01
得票数 1
2
回答
为什么"context.Apify“没有定义
javascript
、
node.js
、
apify
我
正在学习如何在Apify
Web
-
Scraper
中使用request,
我
不明白它是如何工作
的
。
我
首先用Postman做了这件事,
我
确实得到了
我
想要
的
结果,现在
我
想在Apify上做同样
的
事情。headers: { Accept: 'application/json' }, payloa
浏览 20
提问于2019-09-02
得票数 0
回答已采纳
2
回答
如何在python可执行文件中使用os.system()?
python
、
shell
、
cmd
、
pyinstaller
我
需要
在python可执行文件中运行这个命令instagram-
scraper
"+ username +" --media-metadata --media-types none,正如您所看到
的
,下面是
我
用来这样做
的
代码,当我像py test.py那样运行它时,它运行得很好,但是当我使用PyInstaller命令:pyinstaller -F test.py、将它转换成
一个
可执行文件之后,它不工作,并且它不会返回任何错误import os def
浏览 7
提问于2021-08-01
得票数 0
回答已采纳
3
回答
从网站中存储信息
c#
、
web
我
想创建
一个
应用程序,以保存在网页上提供
的
一些信息
的
历史记录。
一个
页面会是什么样子
的
例子: 所以我想
的
是,把浏览器放在表单中,然后导航到
一个
页面,然后点击
一个
按钮将信息保存在页面上,在反代码中,它将选择选定
的
页面,查看源或其他东西,并选择适当
的
数据并将其存储。
我
想要获得
的
数据是: Team1、Team2、每个团队
的
胜利者和百分比以及赌注
的
浏览 0
提问于2015-08-14
得票数 1
回答已采纳
1
回答
Selenium“无法连接到HTTPS URL,因为SSL模块不可用
selenium
、
selenium-webdriver
、
anaconda
我
有
一个
安装了selenium
的
anaconda环境。当我尝试运行时,
我
得到这个错误: Traceback (most recent call last): File "c:\Users\Nick\Desktop\Code\product-
scraper
"C:\Users\Nick\anaconda3\envs\
web
-
scraper
\lib\site-packages\webdriver_manager\chrome.py", lin
浏览 158
提问于2021-02-28
得票数 0
回答已采纳
1
回答
如何从URL域调用正确
的
类
python
、
python-3.x
、
class-variables
目前,
我
一直在创建
一个
web
爬虫,在这里
我
想调用正确
的
类,从给定
的
URL中抓取
web
元素。目前,
我
创建了:import tldextract scrapers = {}
scraper
.scrape(reque
浏览 1
提问于2021-05-24
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券