腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
html
中
提取
一些
文本
python
、
html
、
web-scraping
、
beautifulsoup
我的
html
"page“如下所示: <p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Times New</i> 1974<br> 我需要
提取
如下内容: ヤブツバキクラス(常緑広葉樹林)、日本山茶( Camellietea japonicae ) リュウキュウガキ-クスノハガシワオーダー,Diospyro) rows = soup.find_all('span'
浏览 22
提问于2019-06-04
得票数 0
回答已采纳
2
回答
如何在Java中用Jsoup
从
javascript变量
中
解析
html
?
java
、
javascript
、
html
、
jsoup
我使用Jsoup来解析
html
文件,并从元素中
提取
所有可见
文本
。问题是javascript变量
中
的
一些
html
位显然被忽略了。什么是最好的解决方案来让这些比特出来?<!DOCTYPE
html
><head> var
html
= "<span>some text</span>&
浏览 0
提问于2013-07-29
得票数 2
1
回答
Slideshare.net站点在iPad Safari
中
是如何工作的?
javascript
、
html
我现在正在探索在移动浏览器
中
打开Office文档,但确保用户没有访问该文件的权限。 我发现,即使不下载pps文件到iPad,幻灯片也能够显示演示文稿。
浏览 0
提问于2011-09-26
得票数 0
1
回答
从
HTML
中
提取
文本
的速度快于NLTK?
python
、
html
、
nltk
、
text-extraction
我们使用NLTK
从
HTML
页面中
提取
文本
,但是我们只需要最简单的
文本
分析,例如单词计数。 是否有更快的方法
从
HTML
中使用Python
提取
可见
文本
?了解
HTML
(理想情况下是CSS)的
一些
最低水平,如可见/不可见的节点,图像的alt
文本
等,将是另外伟大的。
浏览 2
提问于2017-11-09
得票数 1
回答已采纳
1
回答
使用Indy httpserver在网页
中
查找关键字
delphi
、
pascal
、
indy
、
delphi-xe3
、
indy10
我正在尝试使用Indy http服务器在网页
中
查找代理筛选器的关键字。我已经设置了一个代理和http服务器,它可以在网页浏览器上工作,但是当我在网页中找到一个关键字时,我会很吃力。
浏览 1
提问于2013-04-16
得票数 0
4
回答
Perl:
从
段落
中
删除列表<ul>。
HTML
解析
html
、
perl
、
parsing
我有一堆
html
文件,需要从中
提取
文本
,但不需要
提取
列表的内容。
html
如下所示: <title>intranet mycompany</title> </body> 我真的想要<
浏览 0
提问于2012-04-19
得票数 1
1
回答
使用IcePDF或PDFBox
从
PDF生成
HTML
页面
html
、
pdf
、
pdfbox
、
icepdf
我想使用IcePDF或PDFBox
从
PDF中
提取
内容。但我现在不知道如何继续
从
提取
的
文本
和图像生成
HTML
网页。
浏览 6
提问于2012-12-24
得票数 1
2
回答
块引用和代码块在Pagedown
中
不能正常工作
javascript
、
markdown
我正在尝试使用将
一些
标记转换为超
文本
标记语言。我有一个带有
一些
标记的div> This is supposed to be a blockquote </div>$(function () { var text = $("#text")
浏览 2
提问于2012-03-10
得票数 2
回答已采纳
1
回答
如何使用AppleScript
从
电子邮件
中
检索URL?
url
、
curl
、
applescript
、
extract
在过去,我会用AppleScript
提取
电子邮件的内容,消息的正文会显示URL。ExtractEmailMessages()将theMsg设置为theMsg tell应用程序的条目1 "Mail“将BodyMessage设置为theMsg end tell的内容有什么方法可以
提取
URL,以便我可以用AppleScript打开链接? 谢谢。
浏览 5
提问于2020-09-08
得票数 0
回答已采纳
3
回答
如何在C#
中
删除大型
html
字符串
中
的所有<a></a>标签?
c#
、
asp.net
、
html
、
parsing
我有一个很大的
HTML
字符串,我已经在其中解析了一大堆已经形成的链接。我正在寻找一种快速的方法来摆脱所有的链接,只显示
文本
。如有任何帮助或建议,欢迎光临!示例
html
字符串如下所示: <A href="test.com">myText</A>, <A href="test1.com">myText</A>, <A href="test2.com">myText</A>, <A
浏览 0
提问于2010-12-10
得票数 2
2
回答
使用javascript
从
html
文本
获取纯测试
javascript
、
html
我使用的是struts,我
从
数据库
中
获取
html
文本
,并将其存储在字符串
中
,然后将其传递给jsp。现在在jsp
中
,我必须
从
html
字符串中
提取
纯
文本
,并使用javascript显示在TextArea
中
。 请建议
一些
解决方案,我不允许使用jquery。
浏览 2
提问于2013-04-13
得票数 0
4
回答
如何在lucene
中
索引pdf,ppt,xl文件(基于java或者python或者php都可以)?
java
、
indexing
、
lucene
我还想知道如何在索引时添加元数据,以便提高
一些
参数
浏览 1
提问于2010-04-06
得票数 4
回答已采纳
4
回答
如何使用Ajax发送和接收隐藏值
javascript
、
php
、
jquery
、
ajax
、
hidden
这是我的工作id,在php
中
。 console.log(response); }, error: function (request, status,
浏览 10
提问于2016-10-01
得票数 4
回答已采纳
4
回答
检索带间距的内部
文本
javascript
、
jquery
我想从任意的
HTML
块中
提取
文本
。('<div><p>Some</p>Inner<div>Text</div></div>').text()有什么更好的方法来
从
HTML
中
提取
文本
,同时保持
HTML
所使用的视觉结构的
一些
概念呢?在上面的例子<
浏览 2
提问于2014-02-26
得票数 1
回答已采纳
4
回答
如何使用python检测网页内容的语言
python
是否有任何方法可以通过使用Python语言返回网页
中
的内容语言?就像如果页面是中文的,那么它应该返回`“中文”。 我用langdetect模块检查了它,但是无法得到我想要的结果。
浏览 13
提问于2015-06-25
得票数 1
回答已采纳
3
回答
有用于Lucene的
HTML
分析器/标记器吗?
lucene
我想从
html
中
索引
文本
,在Lucene
中
,实现这一点的最佳方法是什么?编辑 最后使用了杰里科·帕瑟。它不创建DOM,而且易于使用。
浏览 1
提问于2011-03-11
得票数 10
回答已采纳
1
回答
转换/编译
从
数据库中
提取
的多个.pdf文件为一个.pdf/
文本
文件/
html
的程序
language-agnostic
、
text
、
automation
在数据库
中
查询姓名。所讨论的数据库更像是ebscohost而不是mysql。2.从一系列.pdfs
中
单独移除
文本
。3.将这些结果粘贴/输出到单个文件
中
。我有限的背景是php,javascript,
html
,等等,我只是不认为他们有能力读取这样的文件类型,如果我错了,请纠正我。所以我猜我只是在寻找1.一种语言/或方法,可能很适合我已经学到的东西。我将尝试
从
他那里获得
一些
更精确的信息,当我得到它时,我会补充这一点。而且我没有必要的代表。添加'.
浏览 0
提问于2011-11-29
得票数 0
回答已采纳
2
回答
如何在没有额外信息的情况下有效地
从
网页簇中
提取
文本
java
、
python
、
web-scraping
、
beautifulsoup
、
scrapy
我有大约一百万的网页列表,我想有效地从这些网页上
提取
文本
。目前我正在使用python
中
的BeautifulSoup库
从
HTML
中
获取
文本
,并使用请求命令来获取网页的
html
。这种方法除了
文本
之外还
提取
一些
额外的信息,比如在body
中
是否列出了任何javascript。 你能给我推荐
一些
合适而有效的方法来完成这项工作吗?我看了scrapy,但它看起来像爬行特定的网站
浏览 24
提问于2019-05-22
得票数 0
1
回答
从
PDF中
提取
数据
java
、
pdf
、
itext
、
pdf-generation
、
pdfbox
我有一个系统,最终
从
html
文件创建PDF文件。它的工作原理与邮件合并非常相似。它从数据库
中
抓取数据,将数据合并到
html
文档
中
的palceholders
中
,然后将
html
文件转换为pdf。当我对
html
文件进行单元测试时,我可以查看占位符
中
的值。例如,如果我有一个John Smith,并且我想验证其名称是否为"John Smith“,我只需在合并后查看div的值。我需要做
一些
类似的事情来验证pdf
浏览 0
提问于2018-10-17
得票数 0
2
回答
从
html
文件python中
提取
文本
python
、
nltk
我写了一个代码
从
html
文件中
提取
一些
文本
,这个代码
从
网页中
提取
请求的行,现在我想
提取
序列data.Unfortunately我不能
提取
文本
,它显示
一些
错误。response)print text
html
= r
浏览 0
提问于2016-03-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简单几行代码提取html文件中全部指定标签内的文本
Excel中批量提取摘要文本
Excel数字提取技巧:从混合文本中提取数字的方法
如何用Python从PDF文件中提取文本词汇
NLP提升篇之从海量文本中抽取主题
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券