腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
smy
专栏成员
举报
109
文章
344059
阅读量
41
订阅数
订阅专栏
申请加入专栏
全部文章(109)
javascript(19)
其他(17)
html(14)
php(12)
css(8)
云数据库 SQL Server(6)
windows(6)
https(6)
java(5)
git(5)
linux(5)
nginx(5)
编程算法(5)
视频处理(4)
网络安全(4)
微信(4)
vue.js(3)
数据库(3)
apache(3)
http(3)
容器(3)
缓存(3)
flash(3)
负载均衡(2)
ios(2)
jquery(2)
json(2)
ajax(2)
webview(2)
单片机(2)
打包(2)
github(2)
unix(2)
容器镜像服务(2)
yarn(2)
开源(2)
npm(2)
tcp/ip(2)
云点播(1)
objective-c(1)
jsp(1)
react(1)
node.js(1)
硬件开发(1)
sql(1)
mvc(1)
api(1)
apt-get(1)
容器服务(1)
文件存储(1)
图像处理(1)
网站(1)
渲染(1)
webpack(1)
gulp(1)
存储(1)
shell(1)
html5(1)
jdk(1)
dns(1)
hashmap(1)
cdn(1)
敏捷开发(1)
小程序(1)
nat(1)
unicode(1)
ascii(1)
es(1)
chrome(1)
script(1)
插件(1)
搜索文章
搜索
搜索
关闭
linux下.bashrc文件修改和生效
编程算法
shell
在linux系统普通用户目录(cd /home/xxx)或root用户目录(cd /root)下,用指令ls -al可以看到4个隐藏文件,
smy
2019-08-12
12.3K
0
Base64编码原理分析
编程算法
Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,在了解Base64编码之前,先了解几个基本概念:位、字节。
smy
2019-02-28
2.1K
0
海量数据相似度计算之simhash和海明距离
hashmap
编程算法
通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集的数据以千万计算,我们如何对于这些海量千万级的数据进行高效的合并去重。最简单的做法是拿着待比较的文本和数据库中所有的文本比较一遍如果是重复的数据就标示为重复。看起来很简单,我们来做个测试,就拿最简单的两个数据使用Apache提供的 Levenshtein for 循环100w次计算这两个数据的相似度。代码结果如下:
smy
2019-02-13
2.7K
0
webpack打包速度和性能再次优化
webpack
html
javascript
编程算法
打包
一. 改单dll为双dll 因为上图原因,使用CommonsChunkPlugin时,导致其打包出来的vendors.js内的模块ID会因为其他文件引用模块数量的变化而变化。 所以现利用DllPlug
smy
2018-04-03
2.1K
0
插入排序算法
编程算法
插入排序算法演示: 对数列9、1、5、3、8按从小到大排序: 对第2个数排序 9 1 5 3 8 9 5 3 8 9 5 3 8 1 9 5 3 8 对第3个数排序 1 9 3 8 1 9 3 8 1 5 9 3
smy
2018-04-03
679
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档