首页
学习
活动
专区
工具
TVP
发布

Django Scrapy

专栏成员
121
文章
199207
阅读量
38
订阅数
倒排索引
主楼搜索引擎的主流算法 倒排索引源于实际应用中需要根据属性的值来记录,这种只能怪索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录开确定属性值,而是由属性值来确定记录的位置,因而称之为倒排索引inverted index。带有倒排索引的文件我们称之为倒排索引文件,简称倒排文件inverted file tf-idf概念 倒排索引待解决的问题 1 大小写转换的问题,如python PYTHON应该为一个词 2 题干抽取,looking和look应该处理成一个词 3 分词,若屏
98k
2018-04-23
9840
多态 接口重用,一种接口,多种实现 实例 多态 静态方法 @staticmethod 在函数前边加修饰@ 为了 让这个方法和类没关系 @classmethod @类方法只能访问类变
98k
2018-04-12
5140
python2.7搬运--->TensorFlow - 深度学习破解验证码
谷歌的开源深度学习工具 --py 简介 验证码主要用于防刷,传统的验证码识别算法一般需要把验证码分割为单个字符,然后逐个识别,如果字符之间相互重叠,传统的算法就然并卵了,本文采用cnn对验证码进行整体识别。通过本文的学习,大家可以学到几点:1.captcha库生成验证码;2.如何将验证码识别问题转化为分类问题;3.可以训练自己的验证码识别模型。 安装 captcha 库 sudo pip install captcha 生成验证码训练数据 所有的模型训练,数据是王道,本文采用 captcha 库生成验证码,
98k
2018-04-11
1.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档