首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何 100 亿 URL 中找出相同 URL

来源 | https://doocs.github.io/advanced-java/ 题目描述 给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。...请找出 a、b 两个文件共同 URL。 解答思路 每个 URL 占 64B,那么 50 亿个 URL占用空间大小约为 320GB。...思路如下 : 首先遍历文件 a,对遍历到 URL 求 hash(URL) % 1000 ,根据计算结果把遍历到 URL 存储到 a0, a1, a2, ..., a999,这样每个大小约为 300MB...这样处理过后,所有可能相同 URL 都在对应小文件中,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...然后遍历 bi 中每个 URL,看在 HashSet 集合中是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件中。

2.8K30
您找到你想要的搜索结果了吗?
是的
没有找到

分享几个酷炫 IDEA 主题

CodeWhite7 来源 | blog.csdn.net/weixin_46146269/article/details/104793277 IDEA,全称 IntelliJ IDEA ,是 Java 语言集成开发环境..., IDEA 在业界被公认为是最好 java 开发工具之一,尤其在智能 代码助手、代码自动提示、重构、 J2EE支持、 Ant 、 JUnit 、 CVS 整合、代码审查、创新GUI 设计等方面的功能可以说是超常...平时开发中由于频繁用眼原因,导致许多开发人员视力下降,主题插件虽然不能提高开发效率,但这时候一个舒适主题可以使开发人员更舒适开发。 以下推荐几款个人喜欢几款主题!...以上4个主题是我比较喜欢主题主题下载可以在idea里下载插件,也可以到官网插件中下载。链接已经给出。 在IDEA中下载:搜索这4个插件下载即可。 ? 更换主题:在Setting中设置更换 ?...这些主题合你胃口吗 ?你还有更好主题推荐吗?留言区告诉我们哟!

6K20

分享几个绕过URL跳转限制思路

大家对URL任意跳转都肯定了解,也知道他危害,这里我就不细说了,过~ 大家遇到肯定都是很多基于这样跳转格式 http://www.xxx.xxx/xxx?...xxx=http://www.xxx.xxx/xxxxx 基本思路大家就是直接替换后面的URL来检测是否存在任意URL跳转,如果不存在,就直接返回到它自己域名,如果存在,就跳转到你指定URL...其实就是放到它自身域名前面也就是你添加想要跳转域名后面,如:http://www.aaa.com/acb?Url=http://test.com?...Url=http: … ttp://login.aaa.com 当然,还有多重,这个结构多重跳转你修改最后面的URL就可以达到任意URL跳转,中间URL就没必要动了。...0x06 点击触发达到绕过URL跳转限制 比如很多登陆页面的地方,其URL是一个跳转URL 如:http://www.aaa.com/acb?

3.9K60

面试经历:如何 100 亿 URL 中找出相同 URL

题目描述 给定 a、b 两个文件,各存放 50 亿个 URL,每个 URL 各占 64B,内存限制是 4G。请找出 a、b 两个文件共同 URL。...解答思路 每个 URL 占 64B,那么 50 亿个 URL占用空间大小约为 320GB。...思路如下 : 首先遍历文件 a,对遍历到 URL 求 hash(URL) % 1000 ,根据计算结果把遍历到 URL 存储到 a0, a1, a2, ..., a999,这样每个大小约为 300MB...这样处理过后,所有可能相同 URL 都在对应小文件中,即 a0 对应 b0, ..., a999 对应 b999,不对应小文件不可能有相同 URL。...然后遍历 bi 中每个 URL,看在 HashSet 集合中是否存在,若存在,说明这就是共同 URL,可以把这个 URL 保存到一个单独文件中。

1.9K00

分享几个有点意思 GitHub 项目

作者 | GitHubDaily 来源 | GitHubDaily 今天跟大家分享下,过去一周我在 GitHub 上看到几个比较实用开源项目。...语音伪装神器,让你跟马云称兄道弟 不久前,一位来自比利时小哥在 GitHub 上开源了一个基于深度学习语音合成项目,它通过采集分析一段具体声音样本,便可在 5 秒内生成与之类似的克隆语音。 ?...https://liyasthomas.github.io/postwoman/ 名字上看,你应该就可以大概判断出两者暧昧关系了。...https://github.com/liyasthomas/postwoman 功能上看,Postwoman 相较 Postman 略有删减,少了不少与服务器进行数据交互一些功能,但是作为一款 API...前不久,一位来自加拿大学生在 GitHub 上开源了一个与 waifu2x 相仿项目,它便是:Anime4K。

77020

分享下我 GitHub 被封经历

最近好像又有人 GitHub 被封,每隔一段时间就有。分享下我自己经历吧,好几年以前了,也许还是有点参考价值。...有一些使用 GitHub 做第三方登录网站登不上了 知道了事情大概原因后,我要做主要就是两件事,第一件事是想办法挽回上面说到三个损失;第二件事是联系官方,看事情能不能补救。...我用谷歌搜了下自己 GitHub ID ,的确找到了一些第三方网站备份,但要不就是信息太旧不全,要不就没有 star 列表,只能说挽回部分损失。...不过我很快发现,GitHub API 仍然是可以访问。...就是我们可以访问如下 API 来找到某个用户 star 过仓库: https://api.github.com/users/[username]/starred 比如这两天被封那位仁兄sam01101

83340

分享最近看到几个 GitHub 项目

今天周日,刚好得空,抽出一点时间跟大家分享下,过去一周我在 GitHub 上看到几个比较实用开源项目。...语音伪装神器,让你跟马云称兄道弟 不久前,一位来自比利时小哥在 GitHub 上开源了一个基于深度学习语音合成项目,它通过采集分析一段具体声音样本,便可在 5 秒内生成与之类似的克隆语音。 ?...https://liyasthomas.github.io/postwoman/ 名字上看,你应该就可以大概判断出两者暧昧关系了。...https://github.com/liyasthomas/postwoman 功能上看,Postwoman 相较 Postman 略有删减,少了不少与服务器进行数据交互一些功能,但是作为一款 API...前不久,一位来自加拿大学生在 GitHub 上开源了一个与 waifu2x 相仿项目,它便是:Anime4K。

1.7K20

Github 是如何做到同步系统主题颜色

今天逛 github 发现出了一个新功能: image.png 动态效果: image.png 可以更改主题模式了,其实更改主题模式也不是什么新鲜功能,有很多网站都有: image.png image.png...image.png image.png 可以看到实现方式基本就是在浏览器本地存一个数据来标识当前处于什么模式,当然 github 也没有例外: image.png 那难道本文就完了?...当然没有,这次要讲的是同步系统主题模式,有没有发现第一张图下拉框内有一个选项:Sync with system: image.png 它这里就是同步系统主题地方,先看下动态效果: image.png...那它是如何实现呢?...if(event.mode == 'dark'){ }else if(event.mode == 'light'){ } }) 但是我们可以通过另一个途径来实现检测主题变化

69750

解决Github TimeOut到经典面试题:输入URL到浏览器显示页面发生了什么?

Github仓库地址:https://github.com/Damaer/Coding 编程笔记地址:https://damaer.github.io/Coding/ 问题描述 在Windows操作系统上...,push代码到git时候,出现了Failed to connect to github.com port 443: Timed out错误。...首先我们可以使用以下命令,删除代理配置: git config --global --unset http.proxy 然后打开ipaddress.com,查询以下域名,记录其ip: github.com...DNS,重新push: ipconfig /flushdns 以上做法可以解决部分连接github问题,主要是超时问题,如果不是超时问题,上面的做法是不会起作用,这个只是把对应域名和ip...上述只是一个概述,具体细节很多,这个下次具体聊聊,但是我们可以看出,在这个过程中确实涉及到了DNS服务器以及缓存,所以我们刷新缓存之后,访问github就可以请求到对应ip上去。

84010

解决Github TimeOut到经典面试题:输入URL到浏览器显示页面发生了什么?

问题描述 在Windows 操作系统上,push代码到git时候,出现了Failed to connect to github.com port 443: Timed out错误。...首先我们可以使用以下命令,删除代理配置: git config --global --unset http.proxy 然后打开ipaddress.com,查询以下域名,记录其ip: github.com...github.global.ssl.fastly.net [9816fe7d3fa5484babb47c162d1c83d1.png] [3aacaa7b9af824b7e928b5f5f535d91f.png...上述只是一个概述,具体细节很多,这个下次具体聊聊,但是我们可以看出,在这个过程中确实涉及到了DNS服务器以及缓存,所以我们刷新缓存之后,访问github就可以请求到对应ip上去。...【刷题笔记】 Github仓库地址:https://github.com/Damaer/codeSolutionundefined笔记地址:https://damaer.github.io/codeSolution

89220

行之有效屏蔽恶意 URL 请求方法分享

说起恶意 URL 请求(Malicious URL request)可能很多老站长们应该都知道,URL 恶意请求对于网站来说是很正常一种“黑客行为”,大家都知道搜索引擎有“蜘蛛爬虫”(bot),那么反之黑客也有自己...简单点说就是一个可以在网络上运行并且不断“遍历”发现网站上程序漏洞并记录反馈给指定服务器什么,需要时候就可以针对网站漏洞进行攻击或者什么(攻击只是一个统称,把被攻击网站做“肉鸡”用来攻击别人...『26 号被攻击记录和分析』一文攻击其实就是一次大规模恶意 URL 请求造成,如果你还是不明白或者无法理解恶意 URL 请求的话,那么下面的日志记录请求只要你关注过自己站点日志文件一定不会陌生...URL 请求节录,这是明月自用主机上 Web 服务器拦截屏蔽掉恶意 URL 请求,当然这仅仅是个代表而已,形式有很多种,在『26 号被攻击记录和分析』一文里明月曾经做过汇总分析,这些恶意请求可以说是无时无刻存在着...WAF 规则,这是最简单措施了,几乎不用花费我们什么,都是免费

2.6K20

输入URL到渲染完整过程1

浏览器会对跨域资源访问进行一些限制图片同源策略对 ajax 跨域限制最为凶狠,默认情况下,它不允许 ajax 访问跨域资源图片所以,我们通常所说跨域问题,就是同源策略对 ajax 产生影响有多种方式解决跨域问题...它总体思路是:如果浏览器要跨域访问服务器资源,需要获得服务器允许图片而要知道,一个请求可以附带很多信息,从而会对服务器造成不同程度影响比如有的请求只是获取一些新闻,有的请求会改动服务器数据针对不同请求...,高兴像一个两百斤孩子,于是,它就把响应顺利交给 js,以完成后续操作下图简述了整个交互过程图片需要预检请求简单请求对服务器威胁不大,所以允许使用上述简单交互即可完成。...HTTP/1.1 200 OKDate: Tue, 21 Apr 2020 08:03:35 GMT...Access-Control-Allow-Origin: http://my.com...添加用户成功可以看出...cookie// xhrvar xhr = new XMLHttpRequest();xhr.withCredentials = true;// fetch apifetch(url, { credentials

64440

博客添加暗色主题切换功能,主题切换聊聊前后端cookies使用

也就是在当天,我给自己博客 github 上面提交了一个 issue,也就是需要给博客添加一套暗色主题并支持主题切换。但是人都是有拖延症,这一拖,两个月就过去了,我主题切换功能才终于上线了。...cookies使用 既然实现了主题切换,那么如何存储用户切换主题状态,这是最重要一点,毕竟你总不能让用户每次刷新页面都需要重新切换主题吧。...,虽然可以实现主题状态保持,但是由于主题亮色切换到暗色,虽然切换速度太快我们看不到主题由亮色转换成暗色过程,但是可以感觉到页面有一个非常短暂“闪光”,其实这也就是 css 做替换过程,虽然短到可以忽略...分析完因果关系,就可以着手动起来了,当时我认识到问题到想到解决办法其实也就花了不到5分钟,当时脑子转还挺快。...可以看我当时提交修改 https://github.com/Hopetree/izone/pull/100/files 总结 主题切换本质就是样式覆盖 可以通过 cookies 设置值来记录当前用户选择主题状态

51910

GitHub上星星最多男人开始发GitHub综述资料

作者:Bruce.D github:https://github.com/doukoi-BDB GitHub仓库介绍 1、仓库所有代码全部免费、原创。...GitHub仓库功能 1、仓库分享 — 项目中需要用到函数(ctrl+c/v 即可使用),函数都是封装提交 2、仓库分享 - 相关类文件(ctrl+c/v ,稍作调整,即可使用) 3、仓库分享 - 相关...GitHub 使用说明 一、使用 composer 拉取对应版本代码 1)拉取特定版本1.0.3 :composer require txz/sdk:1.0.3 2)拉取项目的5.5系列版本:composer...4)也可以下载我包:https://packagist.org/packages/txz/sdk 二、消息通知 1)版本内容更新,底部消息公告 + 社群消息通知 更新公告&其他 一、其他公告 1)...函数包含 【 1、默认生成用户名 ,函数:getUserName 2、数组中元素 & 对象中属性,拼接成url形式字符串 ,函数:weiXin_buildSign 3、随机字符串 ,函数:uniqueString

35230
领券