如何找出系统大文件_sun系统找出大文件_如何找出系统盘大文件 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

利用Linux命令高效查找大文件为windows系统瘦身

海量数据面试题总结(1)-Hash映射+Hash统计+归并排序

首先考虑是否需要将大文件分成小文件，针对数据太大，内存受限，只能是将大文件化成小文件(取模映射)；

Apache Ozone和密集型数据节点

该帖子也是由两名思科员工共同撰写的：Karthik Krishna，Silesh Bijjahalli

被吐槽 GitHub仓库太大，直接 600M 瘦身到 6M，这下舒服了

忙里偷闲学习了点技术写了点demo代码，打算提交到我那 2000Star 的Github仓库上，居然发现有5个Issues，最近的一条日期已经是2022/8/1了，以前我还真没留意过这些，我这人懒得很，本地代码提交成功基本就不管了。

解决八种Linux硬盘问题的技巧

#1 - 错误: 设备上无剩余空间当你的类UNIX系统磁盘写满了时你会在屏幕上看到这样的信息。本例中，我运行fallocate命令然后我的系统就会提示磁盘空间已经耗尽： $ fallocate -l 1G test4.imgfallocate: test4.img: fallocate failed: No space left on device 第一步是运行df命令来查看一个有分区的文件系统的总磁盘空间和可用空间的信息： $ df 或者试试可读性比较强的输出格式： $ df -h 部分输出内容： Fi

Python基于目标文件夹对另一文件夹的内容查漏补缺

本文介绍基于Python语言，以一个大文件夹作为标准，对另一个大文件夹所包含的子文件夹或文件加以查漏补缺，并将查漏补缺的结果输出的方法。

Git目录为什么这么大

本文围绕git的目录过大，从git进行版本控制底层存储出发，简要分析Git目录过大的原因，以及如何处理

CleanMyMac系统软件有什么新功能?

CleanMyMac X是一款知名的专业Mac系统软件工具，拥有一键智能扫描Mac系统缓存、删除系统垃圾和恶意软件，并让 Mac 恢复高效运行。

查找生成文件的进程

作为运维经常发现一些很大的log文件，不知道怎么出来的，不知道能不能删掉。例子中的大log我已经删掉，现在又生成的小文件。

【Git】不同步大文件

因为经常在家办公，所以在家和公司各有一台电脑，因为我是用 Goland 来记笔记的，所以家和公司需要随时同步到笔记内容，不管是自动还是手动。关于同步的方法我用的是 git，并且在 github 上创建了一个 private 的仓库来做中间不同的工具。

10.7 Git 内部原理 - 维护与数据恢复

有的时候，你需要对仓库进行清理 - 使它的结构变得更紧凑，或是对导入的仓库进行清理，或是恢复丢失的内容。这个小节将会介绍这些情况中的一部分。

Git 维护及数据恢复

你时不时的需要进行一些清理工作 ── 如减小一个仓库的大小，清理导入的库，或是恢复丢失的数据。本节将描述这类使用场景。

Git GC命令清理Git暂存区

Git 会不定时地自动运行称为 “auto gc” 的命令。大部分情况下该命令什么都不处理。不过要是存在太多松散对象 (loose object, 不在 packfile 中的对象) 或 packfile，Git 会进行调用 git gc 命令。 gc 指垃圾收集 (garbage collect)，此命令会做很多工作：收集所有松散对象并将它们存入 packfile，合并这些 packfile 进一个大的 packfile，然后将不被任何 commit 引用并且已存在一段时间 (数月) 的对象删除。

大数据面试题分析

转自：https://blog.csdn.net/csuwubing/article/details/79259749

linux之lsof使用技巧

原文链接:https://rumenz.com/rumenbiji/linux-lsof-skills.html

linux之lsof使用技巧

原文链接:https://rumenz.com/rumenbiji/linux-lsof-skills.html

linux之lsof使用技巧

linux下有哪些文件普通文件目录符号链接面向块的设备文件面向字符的设备文件管道和命名管道套接字当前系统中所有被打开的文件 > lsof COMMAND PID TID USER FD TYPE DEVICE SIZE/OFF NODE NAME systemd 1 root cwd DIR 253,1 288 64 /

软件设计师中级下午答题解题策略分析~

最近在琢磨软件设计师的下午题目，一开始发现看见流程图，逻辑困难的比较难受。因为流程图怎么说呢，是没学过吧！

性能工具之15个常用的Linux文件系统命令

测试人员最常见和繁琐的任务之一就是清理环境，比如防止磁盘空间出现不足。下面是我收集的一些常用的 Linux 文件系统相关命令。

AL淘宝交叉面终获offer面试总结

4）讲一下一个变量从产生到结束所经历的过程，讲一下字符串常量的过程？5）将一下线程安全问题产生的原因？

10 道 BAT 大厂海量数据面试题（附题解+方法总结）

•如何从大量的 URL 中找出相同的 URL？（百度）•如何从大量数据中找出高频词？（百度）•如何找出某一天访问百度网站最多的 IP？（百度）•如何在大量的数据中找出不重复的整数？（百度）•如何在大量的数据中判断一个数是否存在？（腾讯）•如何查询最热门的查询串？（腾讯）•如何统计不同电话号码的个数？（百度）•如何从 5 亿个数中找出中位数？（百度）•如何按照 query 的频度排序？（百度）•如何找出排名前 500 的数？（腾讯）

大数据入门与实战-Hadoop核心HDFSHadoop简介一、 HDFS概念及优缺点二、HDFS写流程与读流程三、Shell命令操作HDFS四、Python程序操作HDFS

课程链接：https://www.imooc.com/video/16287 Hadoop简介 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。详情见：Hadoop基本介绍一、 HDFS概念及优缺点应用场景与特点普通的成百上千的机器按TB甚至PB为单位的大量的数据简单便捷的文件获取 HDFS概念数据块是抽象块而非整个文件作为存储单元，默认大小为64MB，一般设置为128M，备份

教你如何迅速秒杀掉：99%的海量数据处理面试题

一般而言，标题含有“秒杀”，“99%”，“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌，但进一步来讲，如果读者读罢此文，却无任何收获，那么，我也甘愿背负这样的罪名，:-)，同时，此文可以看做是对这篇文章：十道海量数据处理面试题与十个方法大总结的一般抽象性总结。

Linux运维工程师面试题（1）

如果 root 密码忘记了，grub 的密码也忘记了，可以进救援模式将 /mnt/sysimage/boot/grub/grub.conf 文件里密码那行删了即可，或者直接修改 shadow 文件，直接把 root 密码删了，即可以使用 root 进行空口令登录了。

Percona Toolkit工具简介

Percona Toolkit简称pt工具，是Percona公司开发用于管理MySQL的工具，功能包括检查主从复制的数据一致性、检查重复索引、定位IO占用高的表文件、在线DDL等，DBA熟悉掌握后将极大提高工作效率。

线上问题排查，这些命令你一定用得到！

问题：1.2.3.4的sshd的监听端口是22，如何统计1.2.3.4的sshd服务各种连接状态(TIME_WAIT/ CLOSE_WAIT/ ESTABLISHED)的连接数。

干货！Apache Hudi如何智能处理小文件问题

Apache Hudi是一个流行的开源的数据湖框架，Hudi提供的一个非常重要的特性是自动管理文件大小，而不用用户干预。大量的小文件将会导致很差的查询分析性能，因为查询引擎执行查询时需要进行太多次文件的打开/读取/关闭。在流式场景中不断摄取数据，如果不进行处理，会产生很多小文件。

为什么医疗保健需要MFT来帮助保护EHR文件传输

毫无疑问，医疗保健行业需要EHR技术来处理患者，设施，提供者等之间的敏感患者信息。但是，如果没有安全的MFT解决方案，您将无法安全地传输患者文件，从而使您的运营面临遭受数据泄露，尴尬，声誉损失以及随之而来的高昂损失的风险。

线上操作与线上问题排查实战

技术同学需要经常登录线上的服务器进行操作，58到家架构部/运维部/58速运技术部，联合进行了一次线上操作与线上问题排查实战演练，同学们反馈有收获，特将实战演练的问题和答案公布出来，希望对大家也有帮助。

Java架构师线上问题排查，这些命令程序员一定用得到！

问题：1.2.3.4的sshd的监听端口是22，如何统计1.2.3.4的sshd服务各种连接状态(TIME_WAIT/ CLOSE_WAIT/ ESTABLISHED)的连接数。常见方法：

python识别批量网站中的图片

实现方式：下载网页源码，在源码中识别包含图片url的标签，如,

。由于对html了解较少，哪些标签可能含有图片是从查看多个网站的源码中总结出来的。

解决Windows 11系统C盘爆满：Docker 桌面版日志文件的疑难杂症

在使用Windows系统时，C盘空间爆满是许多用户经常遇到的问题。尽管通过传统方法（如清理临时文件、卸载不必要的软件等）可以在一定程度上缓解这个问题，但有时候，这些常规手段似乎对于某些特殊情况无能为力。特别是对于频繁使用Docker的开发人员来说，巨大的日志文件往往是隐藏的罪魁祸首。

亿万级数据处理的高效解决方案

全文行文是基于面试题的分析基础之上的，具体实践过程中，还是得具体情况具体分析，且各个场景下需要考虑的细节也远比本文所描述的任何一种解决方法复杂得多。

010

Git清理commit中历史提交的大文件

du是linux 的基础命令，很多用法，详情自己去查找其他文档。因为git的历史文件都是存在一个文件里的，我们使用下面命令可以找出排名前五的文件

Google 史上评分最高的 App 推出中国版

还记得「Files Go」吗？去年年底，我就发文章推过关于「Files Go」的消息，如下：

线上操作与线上问题排查实战

技术同学需要经常登录线上的服务器进行操作，58到家架构部/运维部/58速运技术部，联合进行了一次线上操作与线上问题排查实战演练，同学们反馈有收获，特将实战演练的问题和答案公布出来，希望对大家也有帮助。一、了解机器连接数情况问题：1.2.3.4的sshd的监听端口是22，如何统计1.2.3.4的sshd服务各种连接状态(TIME_WAIT/ CLOSE_WAIT/ ESTABLISHED)的连接数。参考答案： netstat -n | grep 1.2.3.4:22 | awk '/^tcp/ {++S

每天学一个 Linux 命令（20）：find

find 命令用来在指定目录下查找文件，在参数之前的任何字符串都会当作是目录名。使用 find 命令时，如何不设置任何参数，则 find 命令将在当前目录下查找子目录与文件，并且将查找到的子目录和文件全部显示出来。

这些超好用的Unix/Linux 命令技巧大神为你详细解读

我在生产服务器上有一个很大的200GB的日志文件需要删除。我的rm和ls命令已经崩溃，我担心这是由于巨大的磁盘IO造成的，要删除这个大文件，输入：

mac软件-Gemini 2 for Mac(最好用的重复文件查找工具) 中文版

作为Mac操作系统的用户，相信您一定会遇到存储空间不足的问题。随着时间的推移，我们的硬盘上积累了越来越多的文件，有些文件可能已经被我们遗忘，而这些文件却占据了宝贵的存储空间。针对这个问题，Mac上的Gemini 2软件为我们提供了一种快速而有效的解决方案。

测一测你的linux基础能力合格吗？

“努力，让日子更从容、更愉悦、更优雅一些。”——马哥运维人员想要生活更从容、更愉悦、更优雅必须有更扎实的linux技术支撑才可以。我们学了这么就的linux，那到底我们处在一个什么样的水平呢？下面一起来测试一下吧！测试规则：本次测试不设分数，只为让大家测试知识点（Linux博大精深测试如有不全面不到位的地方在所难免，请大家在留言区评论指正，我们会进行整理，让我们一起进步）本次测试共30题，作答时间为 45 分钟回答方式：可以文章底部、微信公众号、51CTO博客、178、以及个人电脑进行答题请

100台机器上海量IP如何查找出现频率 Top 100？

其实，一开始我有往布隆过滤器那边考虑，但是布隆过滤器只能大致的判断一个 ip 是否已经存在，而不能去统计数量，不符合该场景。

100台机器上海量IP如何查找出现频率 Top 100？

其实，一开始我有往布隆过滤器那边考虑，但是布隆过滤器只能大致的判断一个 ip 是否已经存在，而不能去统计数量，不符合该场景。

Nginx 高性能优化配置轻松实现10万+并发访问

今天要说的是Nginx服务器高性能优化的配置，如何使Nginx轻松实现10万+并发访问量。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐