首页
学习
活动
专区
工具
TVP
发布

Astropeak

专栏作者
16
文章
15298
阅读量
31
订阅数
nodejs cheerio模块提取html页面内容
本文给出使用一个用cheerio模块提取html文件中指定内容的例子,并说明具体步骤、涉及到的API、以及其它模块。 cheerio模块是一个类似jquery的模块,具有相似的API、功能,能够将一个网页解析为DOM,以及通过selector选择元素,设置、获取元素属性。
用户2176428
2022-05-11
3.1K0
简短的perl程序
简短的perl程序能够实现大功能。   perl是如何做到的呢?   1. 默认变量      如果没有向函数提供参数值,则默认参数为$_;      如果没有变量用于接收一个表达式的值,则默认接收变量为$_。      perl语言每条语句可像管道那样运行,通过默认变量$_串接起来。   2. 特殊语法      利用一些正常情况下没有含义的语法,如while(<>){}.      如果按照正常的语法,这个定法的意义是:读取一行文本,然后丢弃。      由于正常情况下没有人会这么用,perl语言将这一语法利用起来了。在实际中写起来非常方便。   3. 变量值不用给定初值,不用提前声明      perl会自动为变量选择合适的初值,如果没有给定的话。      对于数值,初值为0;对于字符串,初值为““,也就是空字符串。   4. 对于一些常用语法的简洁写法      如通过qw定义一个字符串list,可避免写引号。   简短的好处?   简短,再加上perl与shell结合非常好,可以在命令行上直接写出简短又功能强大的代码。   一个常用用法:
用户2176428
2022-05-11
4440
基于隐马尔科夫模型的中文分词方法
本文主要讲述隐马尔科夫模及其在中文分词中的应用。 基于中文分词语料库,建立中文分词的隐马尔科夫模型,最后用维特比方法进行求解。
用户2176428
2018-12-07
1.1K0
ASCII、 Unicode 和 UTF8
ASCII: 英文字母与数字编号的一一对应。每个英文字母对应一个编号。范围0~127 Unicode: 全世界所有语言中字符与数字编号的一一对应。也即为存在的每个字符指定一个唯一的编号。范围为0~0x10FFFF。 所以, ASCII与Unicode是类似的东西,都是为一个字符指定一个唯一的数字编号 只不过Unicode的范围更大,能够表示更多的字符。 在计算机的世界里,只有数字,而不会有什么字符。一个字符在计算机看来就是一个数字。ASCII与Unicode就是将字符与数字一一对应起来的映射。比如对于
用户2176428
2018-06-27
1.3K0
Python:怎样用线程将任务并行化?
如果待处理任务满足: 可拆分,即任务可以被拆分为多个子任务,或任务是多个相同的任务的集合; 任务不是CPU密集型的,如任务涉及到较多IO操作(如文件读取和网络数据处理) 则使用多线程将任务并行运行,能够提高运行效率。 假设待处理的任务为:有很多文件目录,对于每个文件目录,搜索匹配一个给定字符串的文件的所有行(相当于是实现grep的功能)。 则此处子任务为:给定一个目录,搜索匹配一个给定字符串的文件的所有行。总的任务为处理所有目录。 将子任务表示为一个函数T,如下所示: def T(dir, pattern)
用户2176428
2018-06-27
1.4K0
Python 描述符是什么?以及如何实现
先看一个例子,@property。被@property修饰的成员函数,将变为一个描述符。这是最简单的创建描述符的方式。 class Foo: @property def attr(self): print('getting attr') return 'attr value' def bar(self): pass foo = Foo() 上面这个例子中, attr 是类 Foo 的一个成员函数,可通过语句 foo.attr() 被调用。 但当它被 @property 修饰后
用户2176428
2018-06-27
6100
掌握Python 装饰器,其实只需要一盏茶的功夫
装饰器的语法为 @dec_name ,置于函数定义之前。如: import atexit @atexit.register def goodbye(): print('Goodbye!') print('Script end here') atexit.register 是一个装饰器,它的作用是将被装饰的函数注册为在程序结束时执行。函数 goodbye 是被装饰的函数。 程序的运行结果是: Script end here Goodbye! 可见函数 goodbye 在程序结束后被自动调用。 另一个常
用户2176428
2018-06-27
4220
为什么不需要为Python对象添加 getter 和 setter
Getter 和 setter在java中被广泛使用。一个好的java编程准则为:将所有属性设置为私有的,同时为属性写getter和setter函数以供外部使用。 这样做的好处是属性的具体实现被隐藏,当未来需要修改时,只需要修改getter 和 setter即可,而不用修改代码中所有引用这个属性的地方。可能做的修改为: 在获取或设置属性时打一条日志 设置属性时,对值对进检查 设置发生时, 修改设置的值 获取属性时,动态地计算值 可谓是好处多多,getter和setter为变量访问提供了灵活的方式。 但pyt
用户2176428
2018-06-27
1.2K0
Emacs Helm: 使用关键字搜索、获取、执行任何东西
Helm 是一个emacs的软件包,定义了一个通用框架,交互式地、动态缩减式地使用关键字选择、获取、执行任何东西。比如: 执行emacs 命令 打开文件 查看man文档 执行grep操作 执行apt命令 相看imenu函数定义 切换buffer Helm软件包本身包含两部分,框架本身及应用。以上列表均为应用。基于框架,可以轻松创建新的应用。 基本原理 Helm的三个重要概念:candidate, narrowing, action. Candidate Candidate即候选值
用户2176428
2018-06-27
1.4K0
用emacs的org2blog组件写cnblogs博客 -- 环境配置及使用
本文给出了一个安装、配置org2blog的方法,实现在emacs中书写blog文章、并发布到cnblogs网站的功能。 emacs是一个编辑器, 同时也是一个平台,可以通过插件无限扩展功能。org2blog是emacs的一个插件,这个插件能够将org-mode文件发布到wordpress博客网站上,但同时也支持发布到所有提供了MetaWeblog Web service API的博客网站。 博客园网站提供了MetaWeblog的接口,因此可使用org2blog发布博文到博客园,但代码需要做一些修改。 Me
用户2176428
2018-06-27
4580
软件设计---高层设计(一):共性可变性分析和分析矩阵
软件开发中最大的问题之一为:处理问题域中的变化。初次拿到软件需求,看似有一定规律,但也存在各种特殊情况。怎样发现共性,及其变化,Alan在他的书中(design patterns explained)中给出了两种方法:共性可变性分析,和需求知矩阵。 共性可变性分析 先找出概念,及它们的各种变化。 然后分析概念之间的关系,通过从大到小的顺序。背景法。如果概念1使用了概念2,则概念1是背景,应该先分析概念1。相当于先搞出框架,然后填东西,这样会更高效一些。 将概念定义为接口,而它们的变化则定义为具体实现类。
用户2176428
2018-06-27
6650
Spring使用 --- 基本概念(二):AOP,面向方面编程
本文讲述sprint的第二个基本概念: AOP,即面向方面编程 什么是面向方面编程 软件项目中,日志系统等服务系统被核心功能系统调用,日志系统的代码分散在各处。面向方面编程将日志等服务系统独立出来,作为单独一个模块,形成一个“方面”。然后通过一些手段将日志与核心代码再联系起来,叫做“织入”。由此将原来混杂在一起的代码分离成单独的模块,代码质量提高,模块内聚性更高,核心模块专注于处理核心业务流程,而不需要关注不相关的东西,如记录日志、考虑安全等因素。 通过面向方面编程,模块可以更加独立。只要不是本模块需要做
用户2176428
2018-06-27
3740
Spring使用 --- 基本概念(一):DI,依赖注入
本文讲述sprint基本概念之一: DI, 即依赖注入。 什么是依赖注入 说类A依赖于类B,最简单的例子是类A有一个类型为类B的成员变量。 依赖注入是指类A不用关心类B对象如何创建,它只知道有一个类B的对象,只需要使用就行了。 这样有几个好处: 可以很容易替换类B的对象,达到不同的效果 类A更容易测试。只需要创建一个类B的mock对象即可。 类A与类B解藕 不使用依赖注入时,类A负责创建类B的对象,写法如下: class A { B b; A (){ // 此处A创建一个B
用户2176428
2018-06-27
4120
Emacs Helm: 使用关键字搜索、获取、执行任何东西
Helm 是一个emacs的软件包,定义了一个通用框架,交互式地、动态缩减式地使用关键字选择、获取、执行任何东西。比如: 执行emacs 命令 打开文件 查看man文档 执行grep操作 执行apt命令 相看imenu函数定义 切换buffer Helm软件包本身包含两部分,框架本身及应用。以上列表均为应用。基于框架,可以轻松创建新的应用。 基本原理 Helm的三个重要概念:candidate, narrowing, action. Candidate Candidate即候选值
用户2176428
2018-06-27
1.3K0
用emacs的org2blog组件写cnblogs博客 -- 环境配置及使用
本文给出了一个安装、配置org2blog的方法,实现在emacs中书写blog文章、并发布到cnblogs网站的功能。 emacs是一个编辑器, 同时也是一个平台,可以通过插件无限扩展功能。org2blog是emacs的一个插件,这个插件能够将org-mode文件发布到wordpress博客网站上,但同时也支持发布到所有提供了MetaWeblog Web service API的博客网站。 博客园网站提供了MetaWeblog的接口,因此可使用org2blog发布博文到博客园,但代码需要做一些修改。 Me
用户2176428
2018-06-27
7050
Annotation: 代码的修饰符
Table of Contents 简介: 是什么, 用途, 为什么有用 使用: 一个简单例子,如@Override。系统提供的annotation,做成列表 定义新的annotation。 涉及到的语法, processor的编写(以及使用APT辅助编写)。 在框架中的应用。如Junit中。 简介: 是什么, 用途, 为什么有用 Annotation 是一种元数据(metadata),它本身不是代码,但提供了一些关于代码的数据。这些数据可以是限定代码的一些功能,也可以是增加一些功能。可以将它理解为代码的修
用户2176428
2018-06-21
4850
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档