进程和线程 Linux 属于多用户、多任务的操作系统 , 其特性在于 : 1.多用户是:指多个用户在同一时间使用计算机系统; 2.多任务是:指Linux 可以同时执行几个任务,它可以在还未执行完一个任务时又执行另一项任务...u 查看进程的 UID 或账户名 w 列加宽 , 可显示更多的信息 , 可重复使用 e 选择所有的进程。 f 列示完整的列表 l 显示进程的所属者,进程号和父进程号。...服务分配给虚拟机上的任务占用 CPU% 第 4 行 : 内存 ( 单位 kb) 物理内存总数 使用的内存总数 空闲内存总数 缓存总数 第 5 行 :swap( 单位 kb) swap 总数 使用 swap...的内存总数 swap 空闲内存总数 缓冲交换区总数 第 7 行 : 各进程的状态监控 PID: 进程 ID USER: 进程使用者 PR: 进程优先级 NI: 优先级值 VIRT: 使用的虚拟内存总量...+>: 高亮向右排序列 (2)shift+<: 高亮向左排序列 M: 根据 MEM 使用率大小进程排序 P: 根据 CPU 使用率进行排序 T: 根据时间 / 累计时间进行排序 W: 将当前设置写入 ~
Flink 任务 State 的 exactly-once ⭐ Sink 算子支持两阶段或者可重入,保证产出结果的 exactly-once 其中前两项一般大多数引擎都支持,我们需要关注的就是第 3 项...ClickHouse 的底层数据按建表时指定的 ORDER BY 列进行排序,并按 index_granularity 参数切分成数据块,然后抽取每个数据块的第一行形成一份稀疏的排序索引。...⭐ 有提到将用户心跳日志借助 Session Window Dynamic Gap 计算的 博主认为其中第一种方案大家基本都能答上来,第二种和第三种是相对比比较创新的,但是实现逻辑较复杂,大家可以学习对应的思想...举例: 比如计算 DAU 使用 Flink MapState 进行去重,到第二天的时候,第一天的 MapState 就可以删除了,就可以用 Flink State TTL 进行自动删除(当然你也可以通过代码逻辑进行手动删除...因为 TTL 过滤器需要解析上次访问的时间戳,并对每个将参与压缩的状态进行是否过期检查。对于集合型状态类型(比如 ListState 和 MapState),会对集合中每个元素进行检查。
但是此控件使用之前要求必须先对数据进行排序,对数据排序用的控件是排序记录,排序记录控件可以按照指定字段的升序或者降序对数据流进行排序。因此排序记录+去除重复记录控件常常配合组队使用。...排序记录+去除重复记录对比的是每两行之间的数据,而唯一行(哈希值)是给每一行的数据建立哈希值,通过哈希值来比较数据是否重复,因此唯一行(哈希值)去重效率比较高,也更建议大家使用。...但是需要注意的是行扁平化控件使用有两个条件: 1)使用之前需要对数据进行排序 2)每个分组的数据条数要保证一致,否则数据会有错乱 任务:将09_行扁平化.xlsx的数据按照hobby字段进行扁平化...如同转换的步骤,作业项也可以使用图标的方式图形化展示。 但是,作业项和转换步骤有下面几点不同: 1.转换步骤与步骤之间是数据流,作业项之间是步骤流。...这是一种红色的连接线,上面有一个红色的停止图标。 在图标上单击就可以对跳进行设置。
【题目3】使用辅助列将以下左表变为右表形式 如图,要将左表变为右表的形式,其实就是将表里的姓名列,每隔一行插入空白行。如何实现呢?我们可以通过添加辅助列的方法来实现。...通过观察籍贯列,可以发现,“北”字在不同的籍贯里,可能是位于第1位,也可能是位于第2位,或第5位等,总之,“北”字字符位置是不确定的。 在excel里,可以使用通配符来进行模糊查找。...单击下拉箭头,就可以对该列的内容进行筛选:如单击“文化程度”的下拉箭头,就会在下拉菜单里看到有“大学本科”“大专”“研究生”。按照案例要求,要筛选出本科及以上,所以,把“大专”的勾选开。...(1)把部门列复制出来,删除重复项,取得各部门名称 (2)用条件平均函数averageif,计算各部门的平均值。averageif,对指定区域内满足条件的值进行求平均。...继续增加条件格式,重复上一步操作,我们还要对“部门”列是否是二车间,其“发生额”列是否大于二车间的平均值进行判断,如两条件同时满足,则填充绿色。
8 list.reverse()反向列表中元素 9 list.sort(cmp=None, key=None, reverse=False)对原列表进行排序 (8)创建一个有规律的二维列表...2 len(dict)计算字典元素个数,即键的总数。 3 str(dict)输出字典可打印的字符串表示。 4 type(variable)返回输入的变量类型,如果变量是字典就返回字典类型。...12 popitem()随机返回并删除字典中的一对键和值。...2*1*4与B运算;这样的要求就是B有一维是1,其他维和A一致; 或 A:2*3*4 与 B:3*4可以运算,A的每个3*4和B运算;但B:2*4则不能;...行第0列,第3行第1列,第5行第2列的那个数组成的数组; [ 0 13 22] arr12[np.ix_( [0,3,5] , [0,1,2] ) ] #有索引器,返回3
为了进行【合并】,最好有一个列,在一个表中包含唯一的值,在另一个表中可以有重复的记录,这被称为一对多关系结构,该结构是确保最终得到的结果与所期望的一致的最好方法。...在这种情况下,解决这个问题的方法非常简单:在 “Months” 表中,右击 “Month” 列并选择【删除重复项】。这样做应该是安全的,因为不应该两次预测同一个月。...为了避免意外产生的笛卡尔积,最好使用列分析工具来检查 “非重复值” 和 “唯一值” 的统计数据是否匹配如果 “非重复值” 和 “唯一值” 两个统计数据匹配,像本案例中 “SKU” 列一样(都是 “12”...创建 Excel 或 DAX 公式,以计算异常表中未知项目(行)的数量,并将其返回到报表页面,以便于查看(每次刷新时,将能够看到未知项的计数是否为 0 ,或者转换表是否需要添加其他项)。...刷新后,将拥有一种检验机制,不仅可以提醒是否存在任何未知项,同样的解决方案还可以准确列出未知项。
List(列表):集合中的元素按索引位置排序,可以有重复对象,允许按照对象在集合中的索引位置检索对象。...Map(映射):集合中的每一个元素包含一对键对象和值对象,集合中没有重复的键对象,值对象可以重复。他的有些实现类能对集合中的键对象进行排序。 ?...在Java中,散列表用链表数组实现,每个列表称为桶(bucket)。要想查找表中对象的位置,就需要计算它的散列码,然后与桶中的总数取余,所得到的结果就是保存这个元素的桶的索引。...在对集合进行遍历的时候,每个值将自动地按照排序后的顺序呈现。...然而,使用Comparable接口定义排列顺序显然有局限性,对于一个给定的类,只能实现这个接口一次。如果在一个集合中需要按照部件编号进行排序,在另一个集合中却要按照描述信息进行排序,该怎么办?
这项指令会一列列地比较两个已排序文件的差异,并将其结果显示出来,如果没有指定任何参数,则会把结果分成3行显示:第1行仅是在第1个文件中出现过的列,第2行是仅在第2个文件中出现过的列,第3行则是在第1与第...egrep执行效果与"grep-E"相似,使用的语法及参数可参照grep指令,与grep的不同点在于解读字符串的方法。...操作的复杂度要比Pico高一点,但是功能较为齐全。Joe一次可开启多个文件,每个文件各放在一个编辑区内,并可在文件之间执行剪贴的动作。...Linux sort命令 Linux sort命令用于将文本文件内容加以排序。 sort可针对文本文件的内容,以行为单位来排序。...Linux uniq命令 Linux uniq命令用于检查及删除文本文件中重复出现的行列。 uniq可检查文本文件中重复出现的行列。 Linux wc命令 Linux wc命令用于计算字数。
❞ 排序(第3课) 建议使用排序的时候尽量让排序字段和查询的列对应,最理想的状态是只包含order by 列的查询让他可以使用「覆盖索引」的查询方式,不能忽视order by带来的性能问题和影响。...删除唯一约束可以删除约束但是对应的索引结构不会一并删除,所以对应列在删除约束之后依然不能删除,但是如果约束和索引一起删除就可以插入重复值。...「主键约束和唯一约束的区别」: 表可包含「多个唯一约束」,但每个表「只允许一个主键」。 「唯一约束列可包含 NULL 值。」 唯一约束列可修改或更新。...唯一约束列的值可重复使用,主键值则不可以二次使用。 与主键不一样,「唯一约束不能用来定义外键」。...另外的一种情况是在使用case when的语句中通常会有AS的用法,当然更多的写法是在某些列需要计算的产生的case when临时结果需要对于列进行重命名方便ORM进行映射。
排序(第3课) 建议使用排序的时候尽量让排序字段和查询的列对应,最理想的状态是只包含order by 列的查询让他可以使用覆盖索引的查询方式,不能忽视order by带来的性能问题和影响。...视图(第 18课) 虽然创建视图的语法类似,但是很可惜视图不仅在不同的数据库实现细节差别很大,在同一个数据库的不同版本也可能会有很大差别,建议根据自己所用的数据库官方文档确认具体有哪些限制和操作方法。...唯一索引和唯一约束的不同点: 唯一约束通过唯一索引实现。 删除唯一约束可以删除约束但是对应的索引结构不会一并删除,所以对应列在删除约束之后依然不能删除,但是如果约束和索引一起删除就可以插入重复值。...主键约束和唯一约束的区别: 表可包含多个唯一约束,但每个表只允许一个主键。 唯一约束列可包含 NULL 值。 唯一约束列可修改或更新。 唯一约束列的值可重复使用,主键值则不可以二次使用。...另外的一种情况是在使用case when的语句中通常会有AS的用法,当然更多的写法是在某些列需要计算的产生的case when临时结果需要对于列进行重命名方便ORM进行映射。
nano有很多人性化的功能设计,如语法高亮、正则表达式搜索和替换、平滑滚动、多个缓冲区、自定义快捷键、撤销或重复编辑。 优点: 易于使用,操作简单,适用于简单文本编辑。...用户学习了各种各样的文本间移动/跳转的命令和其他的普通模式的编辑命令,并且能够灵活组合使用的话,能够比那些没有模式的编辑器更加高效的进行文本编辑。在普通模式中,有很多方法可以进入插入模式。...[file]... sort常用的选项有: -b:忽略每行前面开始的空格字符 -c:检查文件是否已经按照顺序排序 -d:排序时,处理英文字母、数字及空格字符外,忽略其他字符 -f:排序时,将小写字母视为大写字母...c:反选设定字符,也就是符合set1的部分不做处理,不符合的剩余部分才进行转换 -d:删除字符 -s缩减连续重复的字符成指定的单个字符 -t:削减set1指定范围,使之与set2设定长度相等 文本操作工具...sed是一种在线编辑器,可以对来自文件、以及标准输入的文本进行编辑。执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。
,但是形参类型或者个数 不同的方法 封装:是一种信息隐蔽技术,目的是使对象的使用者和生产者分离, 使对象的定义和实现分开 继承:是父类和子类之间共享数据和方法的机制,一个父类可以有多 个子类,这些子类都是父类的特例...喷泉模型是一种以用户需求为动力,以对象作为驱动的模型,适合与 面向对象的开发方法 喷泉模型克服了瀑布模型不支持软件重用,和多项开发活动集成的局 限性 喷泉模型的开发过程具有迭代性和无间隙性 无间隙是指在开发活动...队列的定义:一种先进先出的线性表,只允许在表的一端插入值,在 另一端删除元素 顺序队列:使用顺序存储的队列,需要设置队头指针和队尾指针 循环队列:可处理顺序队列中插入值溢出越界,只需要改变队头和队 尾指针即可...,v2) 完全图:每个顶点都与其他顶点有一个边,则称为完全图 98第 1 章 计算机系统知识 假设无向完全图有 n 个顶点,那完全图的边一共有 n(n-1)/2 有向完全图的边总数则为 n(n-1) ,...网的一个拓扑排序就是工程 顺利完成的可行方案 拓扑排序计算方式: 在 AOV 网中选择一个入度为 0 的顶点,且输出它 在网中删除该顶点及与该顶点相关的所有弧 重复上述两步直到不存在入度为 0 的顶点为止
缺失值的常见处理方式有三种:删除缺失值、填充缺失值和插补缺失值,pandas中为每种处理方式均提供了相应的方法。...keep:表示采用哪种方式保留重复项,该参数可以取值为’first’(默认值)、 'last '和 ‘False’,其中’first’代表删除重复项,仅保留第一次出现的数据项;'last '代表删除重复项...inplace:表示是否放弃副本数据,返回新的数据,默认为False。 ignore_index:表示是否对删除重复值后的对象的行索引重新排序,默认为Flase。...如果需要从箱形图中获取异常值及其对应的索引,那么可以根据箱形图中异常值的范围计算,具体计算方式为:首先对数据集进行排序,然后根据排序后的数据分别计算Q1、Q3和IQR的值,最后根据异常值的范围(Q1 –...在计算数据集的四分位数时,除了要先对数据集排序外,还要根据其中数据的总数量选择不同的计算方式:当数据的总数量为偶数时,数据集被中位数划分为个数相等(每组有n/2个)的两组数,其中第一组数的中位数为Q1,
分组统计,查出各部门中男女的个数: 3. 行转列: 4. 列转行 5. 综合练习 6. 查询顾客的购买明细及月购买总额 7. 将每个顾客的cost按照日期进行累加 8....求前20%的订单数据 13. percent_rank():这条数据在这个数据中的百分之多少,一般也是配合有序窗口使用 14. rank():排序函数(排序相同时会重复,总数不会变) 15. dense_rank...()【排序相同时会重复,总数会减少】、row_number()【会根据顺序计算】 16. current_date() 返回当前时间 17. date_add(current_date(),100) 返回当前日期后...: 将每个顾客的cost按照日期进行累加: 求明细,以及每个月有哪些顾客来过: 查询每个顾客上次的购买时间: lag(col,n,default_val):某一列往前第n行数据,他一般配合有序窗口使用...):这条数据在这个数据中的百分之多少,一般也是配合有序窗口使用 rank():排序函数(排序相同时会重复,总数不会变) dense_rank()【排序相同时会重复,总数会减少】 、row_number
需要清除过滤器的列 可选重复第1参数 column B....返回 表——包含已经删除过滤器后的一列或多列的表。 C. 注意事项 通常和filter组合,如果是列名需要是filter处理的列名 1个参数只能写1个条件,列和表不能同时出现。...函数不单独使用,必须和其他函数配合 D. 作用 忽略指定过滤器后进行计算。 E. 案例 如果要忽略全部筛选条件,则第一参数使用表名来进行。...返回 表——包含已经删除过滤器后的一列或多列的表。 C. 注意事项 第1参数是表,第2参数是列,而All函数的第1参数是表或者列。...重复数据删除哪家强?
数据清洗 数据去重 用删除重复项功能 删除重复项是Excel提供的数据去重功能,可以快速删除重复项。...•选中要计算的区域 •在数据菜单下点击删除重复值按钮 •选择要对比的列,如果所有列的值均相同则删除重复数据 •点击确定,相容内容则被删除,仅保留唯一值 条件格式删除重复项 使用排序的方法删除重复项有一个问题...数据->删除重复项->选择删除条件 缺失值处理 三种处理缺失值的常用方法 1.填充缺失值,一般可以用平均数/中位数/众数等统计值,也可以使用算法预测。...单元格名称加上运算符号可以进行单元格数值的简单计算。 如第B列的第3个单元格,名称为“B3”。...理解字段 字段勾选完后,就需要对字段进行设置。 字段设置有以下两个要点:即,透视表的列和行分别显示什么数据、数据的统计方式是什么。
数组的特点是:寻址容易,插入和删除困难 链表的特点是:寻址困难,插入和删除容易。 那么我们能不能综合两者的特性,做出一种寻址容易,插入删除也容易的数据结构?...元素特征转变为数组下标的方法就是散列法 除法散列法 最直观的一种,上图使用的就是这种散列法,公式: index = value % 16 学过汇编的都知道,求模数其实是通过一个除法运算得到的,所以叫...很明显,用斐波那契散列法调整之后要比原来的取模散列法好很多。 适用范围 快速查找,删除的基本数据结构,通常需要总数据量可以放入内存。...,只能把大文件化成(取模映射)小文件 HashMap统计:当大文件转化了小文件,便可以采用常规的HashMap(ip,value)进行频率统计 堆/快速排序 统计完了之后,进行排序(可采取堆排序),得到次数最多的...扫荡完毕后,查看BitMap,把对应位是01的整数输出即可 方案2 也可采用与第1题类似的方法,进行划分小文件的方法。然后在小文件中找出不重复的整数,并排序。
; (3)类型:被支持不同类型的文件系统所使用; (4)位置:指向设备和设备上文件的指针; (5)大小:文件当前大小(用字节、字或块表示),也可包含文件允许的最大值; (6)保护:对文件进行保护的访问控制信息...(5)截断文件:如果一个文件的内容已经陈旧需要全部更新时,一种方法是删除此文件然后新建,另一种方法则是截断文件,即允许文件名和所有属性不变时,可将原有文件的长度设为0,放弃原有文件的内容,并释放其空间。...系统在对用户所释放的存储空间进行回收时,也采取类似于内存回收的方法,即考虑回收区是否与空闲表中插入点的前区和后区相邻接,对相邻接者应该予以合并。...为适应这种算法,空闲分区表(空闲区链)中的空闲分区要按地址由低到高进行排序。该算法优先使用低址部分空闲区,在低址空间造成许多小的空闲区,在高地址空间保留大的空闲区。...(3)将每一组含有的盘块总数N和该组所有的盘块号记入其前一组的第一个盘块S.free(0)~S.free(99)中,这样,由各组的第一个盘块可链接成一条链。
领取专属 10元无门槛券
手把手带您无忧上云