腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >node.js不识别unfluff模块中的url。

问node.js不识别unfluff模块中的url。
EN

Stack Overflow用户

提问于 2015-03-06 14:11:27

回答 1查看 475关注 0票数 1

任何帮助都将不胜感激。

我需要从网站中提取数据，并发现节点解锁完成了这项工作(请参阅https://github.com/ageitgey/node-unfluff)。有两种方法来调用这个模块。

首先，从命令行工作！第二，不工作的节点js。

extractor = require('unfluff');
data = extractor('test.html');
console.log(data);

输出：{"title":"","lang":null,"tags":[],"image":null,"videos":[],"text":""}

数据返回一个空的json对象。它似乎无法读取test.html。

它似乎不认识test.html。这个例子说，“我的html数据”，有什么方法可以获得html数据吗？谢谢。

javascript

node.js

云联络中心6.1折起

灵活稳定的一体化云联络中心，助力快速搭建集电话、在线交流、音视频通话为一体的客户联络平台

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-03-06 14:38:57

来自unfluff的文档

提取器(html，语言) html:要解析的html 语言(可选)：文档的两个字母的语言代码。这将是最好的自动检测，但可能有一些情况下，您想要覆盖它。

您正在传递一个文件名，它期望传入文件的实际HTML。

如果您在脚本上下文中执行此操作，我建议您执行以下操作

data = extractor(fs.readFileSync('test.html'));

但是，如果您是在服务器上下文中执行此操作，或者当阻塞成为问题时，您应该这样做：

fs.readFile('test.html', function(err, html){
    var data = extractor(html);
    console.log(data);
));

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28908547

复制

（六·）可选的对象属性类型

对象开发语法

我们上一章节中定义的对象属性，使用的时候必须要包含定义的属性，否则就会报错，那么如果在我们开发中，有些属性不是必须的怎么办呢？

老怪兽

2023/02/22

1.3K0

swift 可选类型笔记

swift

晚上十一点半了，看书累了，原本想睡了的，想了想，还是把刚看的总结一下，把这篇笔记写了吧。广州下雨，真特么的冷。。好了，废话不说了，说正题说说Swift可选类型。先定义一个变量： var string="zhangxu" 想想这个变量要强转成 Int 类型的会怎样？ // var Zint: int = string.toint() 这样子肯定是不行的，没发转换成 Int 类型的，那有没有想过 Zint 的值会是什么呢？这时候我们今天的主角，可选类型就登场了！ var Zint

Mr.RisingSun

2018/01/09

6750

iOS:swift :可选类型

其他

import UIKit /*: 可选类型 * 可选类型表示变量可以有值, 也可以没有值 * C 和 Objective-C 中并没有可选类型这个概念 * Swift中只有可选类型才可以赋值为nil

用户1941540

2018/05/11

1.2K0

python的实例_类_静态方法—特殊函数—状态码

python

以某

2023/03/07

4750

python 参数可选的装饰器

日志服务

from functools import wraps, partial import logging

用户5760343

2019/12/12

1K0

Python 中的枚举类型

python 汽车 bug member

你好，我是征哥，今天分享一下 Python 中的枚举类型，为什么需要枚举类型，及如何使用。

somenzz

2022/10/25

9590

Python 中的异常类型

python

Python中的异常类型异常类型集合异常名称说明 Exception 通用异常类型（基类） ZeroDivionError 不能整除0 AttributeError 对象没有这个属性 IOError 输出输出操作失败 IndexError 没有当前索引异常名称说明 KeyError 没有这个键值（Key） NameError 没有这个变量（未初始化对象） SyntaxError Python语法错误 SystemError 解释器的系统错误 ValueError 传入的参数错误代码 # co

Zkeq

2022/05/18

9840

Python中的枚举类型

python

>>> from enum import Enum #导入模块中的类 >>> class Color(Enum): #创建自定义枚举类 red = 1 blue = 2 green = 3 >>> Color.red #访问枚举类的成员 <Color.red: 1> >>> type(Color.green) #查看枚举类成员的类型 <enum 'Color'> >>> isinstance(Color.red, Color) True >>> x = dict() >>>

Python小屋屋主

2018/04/16

1.2K0

python中的时间类型

python c 语言编程算法 unix

时间类型是编程语言中经常使用到的，且在日常生活中也常用到。本文将介绍几种时间库的常用方法，以满足日常编程的需要，主要涉及的库有：time、datetime中的time类型。

python数据可视化之路

2023/02/23

2.2K0

Python中的数组类型

python

Python没有提供内置的数组类型，但是通过标准库array提供了array类支持数组的创建与使用，可以创建的数组类型包括整数、实数、Unicode字符等等，可以使用help()函数查看更完整的类型列表。 >>> from array import array >>> s = "Hello world" >>> sa = array('u', s) #创建可变字符串对象 >>> print(sa) array('u', 'Hello world') >>> print(sa.tostring())

Python小屋屋主

2018/04/16

3.9K0

Python中的布尔类型

python 编程算法其他

布尔类型还可以与其他数据类型进行逻辑运算，Python规定：0、空字符串、None为False，其他数值和非空字符串为True。

py3study

2020/01/09

1.7K0

python静态类型检查工具mypy

python

mypy 是 Python 的一个可选静态类型检查器，旨在结合动态（或“鸭子”）类型和静态类型的优点。mypy 将 Python 的表达能力和便利性与强大的类型系统和编译时类型检查相结合。mypy 类型检查标准 Python 程序；使用任何 Python VM 运行它们，基本上没有运行时开销。

zy010101

2022/05/05

8800

[oeasy]python0050_动态类型_静态类型_编译_运行

python

动态类型_静态类型回忆上次内容上次了解了帮助文档的生成开头的三引号注释可以生成帮助文档文档可以写成网页 python3 本身也有在线的帮助手册目前的程序提高了可读性有什么方法可以让程序更可读么？🤔 变量名首先在变量名上想办法名字本身就有某些含义具有某些可读性可以把 a 换成 apple :4,10s/a/apple/gc 过程中需要用Y/n进行确认 b 换成 banana :11,17s/b/banana/

oeasy

2023/05/09

3820

python里[::-1]_python中的数组类型

https java 网络安全编程算法 python

当j缺省时，默认为len(alist), 即a[1:]相当于a[1:len(alist)]

全栈程序员站长

2022/09/22

1.5K0

python中的数据类型

python

Python 支持三种不同的数字类型整型(int) - 通常被称为是整型或整数，是正或负整数，不带小数点。Python3 整型是没有限制大小的，可以当作 Long 类型使用，所以 Python3 没有 Python2 的 Long 类型。布尔(bool)是整型的子类型。

用户7737280

2021/11/10

1K0

python中的强制类型转换

python 函数集合数据字符串

python内提供了几种称为强制类型转换的函数，可以将一个变量的类型强制转换为另一种类型。比如，整型->浮点型，列表->元组。

matinal

2023/10/13

3740

Python 函数中的参数类型

python

Python 中函数的参数类型比较丰富，比如我们经常见到 *args 和 **kwargs 作为参数。初学者遇到这个多少都有点懵逼，今天我们来把 Python 中的函数参数进行分析和总结。

码农小胖哥

2020/02/24

3.3K0

通俗的方式理解动态类型，静态类型；强类型，弱类型

python java

引言今天和一个朋友讨论 C++ 是强类型还是弱类型的时候，他告诉我 C++ 是强类型的，他和我说因为 C++ 在写的时候需要 int，float 等等关键字去定义变量，因此 C++ 是强类型的，我告诉他 C++ 是弱类型的他竟然还嘲笑我不懂基础。我又尝试去问了另外一个同学 Python 是强类型还是弱类型的时候，得到的竟然是弱类型，就因为定义变量没有 int，float！然后我想找一些网上的资料试图告诉他们他们是错的（我是对的），结果发现网上的资料大多为了严谨结果把简单的问题（其实并不简单）说的很

桃翁

2018/06/27

2.3K0

TypeScript中的可选属性和只读属性

其他

可选属性接口里的属性不全都是必需的。有些是只在某些条件下存在，或者根本不存在。例如给函数传入的参数对象中只有部分属性赋值了。带有可选属性的接口与普通的接口定义差不多，只是在可选属性名字定义的后面

孙亖

2018/06/07

2.9K0

python中的类型和对象

面向对象编程 python

type(list)查看list是由谁实例化的或者list.__class__

py3study

2020/01/09

1.3K0

相似问题

在Mac 10.11.6上失败

Xcode 8:无法接受OS X EL Capitan 10.11.6上的许可协议

不可接受条件

WordPress登录不可接受

RestEasy 406不可接受

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问node.js不识别unfluff模块中的url。
EN

云联络中心6.1折起

回答 1

Stack Overflow用户

在Mac 10.11.6上失败

Xcode 8:无法接受OS X EL Capitan 10.11.6上的许可协议

不可接受条件

WordPress登录不可接受

RestEasy 406不可接受

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问node.js不识别unfluff模块中的url。EN

云联络中心6.1折起

回答 1

Stack Overflow用户

在Mac 10.11.6上失败

Xcode 8:无法接受OS X EL Capitan 10.11.6上的许可协议

不可接受条件

WordPress登录不可接受

RestEasy 406不可接受

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问node.js不识别unfluff模块中的url。
EN