首页
学习
活动
专区
工具
TVP
发布

文渊之博

专栏成员
183
文章
320350
阅读量
38
订阅数
K-means分箱
各行各业的打工人,经常会面对一种令人尴尬的质疑:为什么你把15-25归为一类,10-20不行吗?13-23不行吗?
用户1217611
2023-03-06
7250
shell 脚本执行带参数的hivesql
原文连接:https://issues.apache.org/jira/browse/HIVE-2020
用户1217611
2022-05-06
4K0
python内存回收的问题
举例,a=range(10000*10000),会发现内存飙升一个多G,del a 或者a=[]都不能将内存降下来。。 del 可以删除多个变量,del a,b,c,d 办法:
用户1217611
2022-05-06
1.2K0
在clickhouse中更新和删除
ck 目前支持了更新和删除,但是与传统sql语法 略有不同,我也记录下来,防止后面忘记。
用户1217611
2021-12-31
2.9K0
ES 复合查询
  ES在查询过程中比较多遇到符合查询,既需要多个字段过滤也需要特殊情况处理,本文简单介绍几种查询组合方便快捷查询ES。
用户1217611
2020-06-19
5.3K0
排序算法小结
排序是工作和生活中非常常见的一个问题。现在已经有比较成熟的排序技术,被广泛地应用于各种程序语言或数据库中。不同的排序算法有不同的性能和适用场景,下面的视频对比了 9 种排序算法的性能表现。排序算法依次为选择排序、希尔排序、插入排序、归并排序、快速排序、堆排序、冒泡排序、梳排序、鸡尾酒排序。
用户1217611
2019-05-25
3310
Apache kylin概览
Apache kylin 能提供低延迟(sub-second latency)的秘诀就是预计算,即针对一个星型拓扑结构的数据立方体,预计算多个维度组合的度量,然后将结果保存在hbase中,对外暴露JDBC、ODBC、Rest API的查询接口,即可实现实时查询。
用户1217611
2019-05-25
6150
大数据脱敏
大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用户的隐私和敏感信息,如用户在酒店的入住纪录,用户支付信息等,这些数据存在可能泄漏的风险。大数据平台一般通过用户认证,权限管理以及数据加密等技术保证数据的安全,但是这并不能完全从技术上保证数据的安全。严格的来说,任何有权限访问用户数据的人员,如ETL工程师或是数据分析人员等,均有可能导致数据泄漏的风险。另一方面,没有访问用户数据权限的人员,也可能有对该数据进行分析挖掘的需求,数据的访问约束大大限制的充分挖掘数据价值的范围。数据脱敏通过对数据进行脱敏,在保证数据可用性的同时,也在一定范围内保证恶意攻击者无法将数据与具体用户关联到一起,从而保证用户数据的隐私性。数据脱敏方案作为大数据平台整体数据安全解决方案的重要组成部分,是构建安全可靠的大数据平台必不可少的功能特性。本文首先分析了数据泄露可能带来的风险,然后详细介绍了数据脱敏技术的理论基础与常用算法,最后介绍了一个基于大数据平台的数据脱敏解决方案。
用户1217611
2018-09-28
2.3K0
webconfig 文件加密处理
前几日正好遇到配置文件加密解密的问题,简单记录下流程。 1.首先运行cmd然后打开Framework。cd C:\Windows\Microsoft.NET\Framework\v4.0.30319 2.加密(需要将web.config文件放到指定目录下,如C:\1): aspnet_regiis -pef "connectionStrings" C:\1 3.解密(需要将web.config文件放到指定目录下,如C:\1): aspnet_regiis -pdf "connectionStrings" C
用户1217611
2018-01-30
9360
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档