腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
无法输入世界人口数字('https://countrymeters.info/en')‘
python
、
python-3.x
我试图从网站的中导入世界人口数据,但无法使用Python导入
浏览 10
提问于2022-06-02
得票数 0
回答已采纳
2
回答
使用htmlagilitypack
提取
文本
和图像
c#
、
html
、
c#-4.0
、
html-parsing
我正在从
网页
中
提取
内容
。在
网页
中,电话号码和电子邮件id等信息都存储在图像中。我想要
提取
图像和表格中的
文本
。在输出字符串中,我希望输出的方式与在带有图像和
文本
的
网页
中显示的方式相同。以下是
网页
内容
。<td><img src="" /></td><tr> <td>text<
浏览 2
提问于2012-07-20
得票数 0
1
回答
从
网页
中
提取
内容
并使用Java进行比较
java
、
javascript
我正在开发一个Java项目,其中我有一个子模块,我需要从
网页
提取
内容
文本
,图像,颜色,并将其与另一个
网页
进行比较。我计划在本地使用WinHTTrack软件下载
网页
,但问题是它没有保存为超
文本
标记语言。如何使用WinHTTrack等软件下载具有超
文本
标记语言扩展名的
网页
,或仅通过ctrl+s保存
网页
。此外,我计划使用HTML解析器来
提取
3种
内容
类型
文本
,图像,颜色,
浏览 2
提问于2012-03-06
得票数 0
回答已采纳
1
回答
仅从
网页
中
提取
文本
内容
javascript
、
jquery
、
html
我需要从
网页
中
提取
所有的
文本
内容
。我使用了'document.body.textContent‘。但是我得到的是well.How形式的javascript
内容
,我能确保我只得到可读的
文本
内容
吗?<script src="https://ajax.googleapis.com/ajax/libs/jquery/2
浏览 1
提问于2015-09-28
得票数 2
1
回答
javascript-如何使用纯
JS
/jquery/rangy/其他库来获取
网页
中的最高级别节点,其整个
文本
内容
已被用户选中
javascript
、
jquery
、
rangy
,用户选择浏览器中显示的一些
文本
--用户选择
文本
在
网页
中用户选择
文本
在
网页
中。maindiv",但是在场景4中,div1_2的全部
内容
以及div2的全部
内容
都被选中--即这2个div的
内容
被选中,它们不是兄弟。因此,我希望为场景4
提取
的结果是"div1_2“和"div2”。如何
提取</em
浏览 6
提问于2012-08-06
得票数 0
2
回答
使用BeautifulSoup打印类
内容
python
、
python-3.x
、
beautifulsoup
、
python-requests
我想在课堂上打印课文。<div class="sc-ikPAkQ ceimHt"></div>from bs4 import BeautifulSouppage = requests.get(URL) soup = BeautifulSoup(page.con
浏览 3
提问于2021-08-31
得票数 0
回答已采纳
6
回答
如何获取
网页
上的字数?
c#
、
asp.net
我需要得到一个
网页
上的总字数。我知道System.Net.WebClient类的事。但是它的DownloadString()方法返回整个HTML标记,因为我只需要
文本
,这样我就可以计算出单词的数量。
浏览 2
提问于2011-05-23
得票数 8
回答已采纳
1
回答
如何获取具有所有属性的
网页
正文
javascript
、
html
我想从
网页
中
提取
动态
内容
,与
网页
中的
内容
完全一样,而不是纯
文本
。我正在使用下面的块,它给出了纯
文本
,但我需要像属性
文本
。
浏览 12
提问于2019-07-09
得票数 1
1
回答
Tika信息抽取
java
、
apache-tika
我可以知道如何使用Tika在
网页
中
提取
表格形式的信息,如数字吗?为此,Tika有解析器吗? 谢谢
浏览 0
提问于2012-08-16
得票数 1
1
回答
使用Chrome扩展
提取
网页
中包含的全部
文本
javascript
、
google-chrome
、
google-chrome-extension
我正在开发一个Chrome扩展,用于谷歌搜索结果的
文本
解析。我希望用户在总括框中插入一个特定的
文本
,然后直接到Google搜索页面。"%20%2B%20cnpj");在将当前选项卡定向到搜索页之后,我希望获得页面的纯
文本
形式
浏览 3
提问于2016-09-04
得票数 2
回答已采纳
1
回答
如何从
网页
中
提取
文本
内容
?
java
、
web
、
web-scraping
、
text-mining
、
web-mining
我正在用java开发一个应用程序,它可以从不同的
网页
中
提取
文本
信息,并将其总结为一个page.For示例,假设我在不同的
网页
上有一条新闻,比如印度教,印度时报,政治家,etc.Now。我的应用程序应该从这些页面中
提取
重要的点,并将它们放在一起作为单个news.The应用程序基于web
内容
mining.As的概念。所以,如果我得到一个新闻
网页
,第一步是从
网页
中
提取
主要新闻,排除超链接,广告,无用的图片等。我的问题是,我如何做到这一点?
浏览 7
提问于2012-02-10
得票数 0
回答已采纳
2
回答
网站关键词,无限加载,面向对象
php
、
mysql
、
database
、
oop
问题是,当您启动
提取
器时,会无限地加载。并且从不在数据库中保存任何
内容
。
浏览 1
提问于2012-12-02
得票数 2
回答已采纳
1
回答
将
网页
缩减为iOS上的
文本
(目标C)
html
、
ios
、
objective-c
、
cocoa-touch
我在这里的主要目标是实现像Readability或Safari的阅读器服务这样的效果,其中
网页
的主要
内容
被转换为
文本
。我其实不想显示任何图片,只要得到所有
网页
的重要
文本
。我目前正在使用一些相当长的自建代码来解析
网页
,以便让s了解标题可能是什么样子,并且我还在解析 [self.textLabel setText:finalBody]
浏览 2
提问于2015-06-05
得票数 2
回答已采纳
3
回答
如何从
网页
中
提取
特定
文本
?
java
、
text
、
extract
、
webpage
我正在尝试从
网页
中
提取
特定的
文本
?这是
网页
中包含特定
文本
的部分:<div class="body"><dt>F.Name:</dt><dt>L.Name:</dt> <dd><a class=&q
浏览 1
提问于2011-09-19
得票数 3
1
回答
使用IcePDF或PDFBox从PDF生成HTML页面
html
、
pdf
、
pdfbox
、
icepdf
我想使用IcePDF或PDFBox从PDF中
提取
内容
。但我现在不知道如何继续从
提取
的
文本
和图像生成HTML
网页
。
浏览 6
提问于2012-12-24
得票数 1
3
回答
以编程方式下载页源中未显示的
文本
javascript
、
python
、
html
、
web-scraping
、
web-crawler
给定一个
网页
,我以以下方式
提取
它的Html
内容
:response = urllib2.urlopen('http://www.example.com/')但是一些
文本
组件不显示在Html页面源中,例如在中(重定向到索引中,请访问其中一个日期并查看特定的邮件)如果您查看页面源,您将看到邮件
文本
没有出现在源中,而是似乎是由
JS
如何以编程方式下载此
文本</em
浏览 0
提问于2015-02-18
得票数 1
回答已采纳
1
回答
从url Xcode中
提取
文本
?
objective-c
、
xcode
、
url
、
text
、
nsdata
我试图从
网页
中
提取
文本
并将其显示在textView中;viewPage本身就是
文本
视图如何仅
提取
文本
?
浏览 2
提问于2015-12-03
得票数 0
2
回答
从
网页
中
提取
数据
parsing
、
html-parsing
、
html-content-extraction
、
text-extraction
我正在做一个需要从
网页
中
提取
数据的学校项目。准确地说,我需要一个库或开源程序来从html/
文本
数据中
提取
人类可读的
内容
。类似于web浏览器呈现的
文本
内容
。我知道用正则表达式解析html是从其中
提取
文本
的最糟糕的方法。我需要它来计算
文本
文档之间的相似度。 任何帮助都将不胜感激。谢谢
浏览 2
提问于2011-04-19
得票数 0
4
回答
如何使用python检测
网页
内容
的语言
python
我必须测试一堆网址,这些
网页
是否有各自的翻译
内容
。是否有任何方法可以通过使用Python语言返回
网页
中的
内容
语言?就像如果页面是中文的,那么它应该返回`“中文”。
内容
显示在<releasehigh>下
浏览 13
提问于2015-06-25
得票数 1
回答已采纳
1
回答
主脚本和
内容
脚本之间的数据交换-- Firefox Addon SDK
javascript
、
html
、
forms
、
firefox
、
firefox-addon-sdk
我的Mozilla (用Addon编码)需要在表单提交到
网页
服务器之前以
网页
形式加密信息。我使用的加密库只能在lib/main.
js
中访问,并且要在
网页
上加密的信息是由
内容
脚本收集的。我的想法是让我的Addon用以下过程加密数据: 当单击表单的submit按钮时,
内容
脚本将表单的数据(
文本
输入中的
文本
)发送到main.
js
。main.
js
使用库加密数据,然后将密码
文本
发送回
内容
浏览 6
提问于2013-11-18
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一键提取图片上的文本内容,还能进行翻译和语音合成
微信Mac版3.7.0发布:支持图片文字提取、可以翻译网页内容
当 JS 大猪蹄子遇到 HTML 小姐姐
Python爬虫从头学之爬虫基本原理
网络爬虫基本原理——基于python语言
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券