仅获取HTML标记中的顶级文本

获取HTML标记中的顶级文本可以通过解析HTML文档并提取标记中的文本内容来实现。以下是一个完善且全面的答案：

HTML标记中的顶级文本是指在HTML文档中直接包裹在<body>标签内的文本内容，即不包含在任何其他标签中的文本。获取HTML标记中的顶级文本通常用于提取网页的主要内容，例如新闻文章、博客内容等。

为了实现这个功能，可以使用HTML解析库或工具，如BeautifulSoup、Jsoup等。这些工具可以将HTML文档解析为DOM树的形式，然后通过遍历DOM树来获取顶级文本。

以下是一个示例代码，使用Python的BeautifulSoup库来获取HTML标记中的顶级文本：

from bs4 import BeautifulSoup

def get_top_level_text(html):
    soup = BeautifulSoup(html, 'html.parser')
    body = soup.find('body')
    top_level_text = body.get_text(separator=' ')
    return top_level_text.strip()

# 示例用法
html = '''
<html>
<body>
    <h1>标题</h1>
    <p>段落1</p>
    <div>
        <p>段落2</p>
        <span>文本</span>
    </div>
    <p>段落3</p>
</body>
</html>
'''

top_level_text = get_top_level_text(html)
print(top_level_text)

运行以上代码，将输出以下结果：

标题 段落1 段落2 文本 段落3

在这个示例中，我们使用BeautifulSoup库解析HTML文档，并通过find方法找到<body>标签。然后，使用get_text方法获取<body>标签内的所有文本内容，并通过设置separator参数为一个空格，将各个文本片段连接起来。最后，使用strip方法去除文本前后的空白字符。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，这里无法给出具体的推荐。但腾讯云提供了一系列与云计算相关的产品和服务，包括云服务器、云数据库、云存储等，可以根据具体需求选择适合的产品。您可以访问腾讯云官方网站（https://cloud.tencent.com/）了解更多信息。