我正在试图找到被传递的H1标签的图像。标记可以是在线杂志()上的任何一篇文章。这意味着我不能依赖特定的容器等等。
我最初的想法是找到H1标签的字符位置并找到图像。这将让我确定他们相对于H1标签的位置。除非我遗漏了一些东西,否则我找不到一种方法来获得美丽汤中查找元素的字符位置。
无论使用什么方法来解析html,它都必须使用格式错误的语法。
示例:
<html>
<p>some text</p>
<img src="#" alt="I don't care about this image"/>
我是否可以使用获取所有主体标记的计数,然后为所有标记分配一个唯一属性id,如"data-id=1“、"data-id=2”等。
我希望测试这个静态网站翻译的目的,然后我将使用查询选择器数据- id,并从每个标签中提取TextContent并使用翻译API翻译文本,并将翻译后的文本设置为从原来提取的标记id。
C#
var html = File.ReadAllText(@"C:\example.html");
var parser = new HtmlParser();
var document = parser.Parse(html);
我有一个由<div id = "main">组成的html文档。在这个div中可能有几个层次的节点,没有精确的结构,因为是创建文档内容的用户。我打算使用JavaScript函数来返回div id = "main"中的所有节点。任何标签都是,考虑到可能有不同层次的儿童。
现在,我有一个函数,它返回所有的标记,甚至那些在div id = "main"之外的标记。
function getNodes() {
var all = document.getElementsByTagName("*");
for (
我正在尝试使用jQuery wrapAll将一个h1标签和多个p标签封装到一个div中。
这是我的HTML:
<h1>Title</h1>
<p>This is a paragraph</p>
<p>This is another paragraph</p>
<div class="img"></div>
和我的jQuery:
$('h1').wrapAll('<div class="first-col" />');
$(&
我有一个字符串,其中包含一个完整的超文本标记语言文档(包括<script>,<header>,<footer>等标签)。
除了几个标签之外,我如何删除所有这些标签及其内容?
我希望将<p>、<b>、<img>、<h2>和<em>标签与这些标签中的内容一起保存。其他所有东西都应该去掉。
我真的不确定如何解决这个问题,并且在网上找不到任何与我类似的问题/解决方案。
<p>Hello <b>this</b></p> is an <span>exa
据我所知,文章标签是“内容的一个独立项目部分”,www.w3.org/wiki/HTML/Elements/文章
我有一个网页,只有一个博客帖子。该博客的文本顶部有一个img和一个标题(它是一个img,它说明了我在博客文本中所讲的内容)。img和标题应该在文章标签的内部还是外部?
国际管理小组:
<img src="1.png">
<div>Caption of the image</div>
这篇博客文章简化了:
<article>
<h1>Title of the post</h1>
<div&g
我在$text中存储了以下内容:
<h1>Bonjour tout le monde (diverses langues) !</h1>
<h2>Anglais</h2>
Hello World!
<quote>Every first computer program starts out "Hello World!".</quote>
<h2>Espagnol</h2>
¡Hola mundo!
<image=http://example.com/IMG/jpg/p
我已经将AngleSharp安装到一个新的Visual项目(2017和2015)控制台应用程序中。parser.Parse似乎正常工作(没有例外),但我看不到任何脚本正在运行。我尝试过使用一个简单的console.log脚本和一些更复杂的脚本。我也没有观察到任何脚本错误。
为什么?我做错什么了?
我希望使用控制台输出来调试javascript,就像在浏览器的developer tools窗口中读取控制台窗口一样。请告诉我,如果有什么特别的,我需要用AngleSharp捕获javascript错误。
谢谢。
using AngleSharp;
using AngleSharp.Parser.Ht
在更新标记代码之后,我正在学习laravel和标签。当我单击一个标签时,我会遇到以下问题:
为foreach()提供的外观\点火\异常\ViewException无效参数(View:)
我在控制器中的代码:
<?php
namespace App\Http\Controllers;
use App\Article;
use App\Tag;
use Illuminate\Http\Request;
class ArticlesController extends Controller
{
public function index()
{
if(request('
我正在解析许多HTML文档,并且在每个需要尝试提取英国邮政地址的范围内。为了做到这一点,我使用AngleSharp解析HTML,然后使用TextContent查找与TextContent匹配的节点:
var parser = new HtmlParser();
var source = "<html><head><title>Test Title</title></head><body><h1>Some example source</h1><p>This is a parag
我已经创建了一个DJANGO博客引擎,它接受我的帖子,模板解析它的html标签。链接等。都在工作,但它不加载图像文件,而是显示“替代”。我已经在单独的html文件中尝试过这个标记,但事实并非如此。只是不显示django博客文章中的图像。
模板文件的相关部分:
{% include 'blog/header.html' %}
</aside>
<section id ="content">
<article>
{%for post in posts %}
<h2><a href="{{ post_g