首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我发现我的数据被操纵了……

限制数据滥用并且努力解决偏见数据和问题数据,正成为解决科技对社会基石产生影响的重要条件。 简而言之,我认为大家应该重新考虑,安全、公平到底意味着什么。...令这位参议员不寒而栗的是,无数公众参与了将网站链接推送到搜索引擎首条的行动中。 这种众包形式的搜索引擎优化行为被称作“谷歌爆炸”,一种媒体炒作形式,旨在干扰数据和信息环境。...Latanya Sweeney在谷歌上搜索自己的姓名时惊讶地发现,有广告邀请她查询自己是否有犯罪记录。...忽略了这些数据从一开始就不具有代表性这一个重要的点,绝大多数用着这些API工程师都相信他们可以清洁抓到的数据、并去除所有的问题内容。我向你保证,没门儿。...我眼睁睁地看着无数人或者组织用尽各种方式想要混淆公共数据,大公司的系统也在他们的目标范围之列。他们试图通过低空飞行避开雷达监管。

55830

久违了,我我我我的童年照!

少年的肩应该担起清风明月和草长莺飞 眼里应该藏下星辰大海和万丈光芒 而当少年已成人 虽已忘却了诗篇和牧笛 但心中偶尔也会渴望那片原野 不管当年的风在不在 他们心中仍保留着少年最灿烂的样子 恰逢儿童节,我们发自心底的问...如《少年》所唱: “我还是从前那个少年,没有一丝丝改变 时间只不过是考验,种在心中信念丝毫未减 眼前这个少年,还是最初那张脸......” 不管几岁,好奇万岁 未来一万年的人类生活会是什么样?...我可能被偷袭了...... | 那个心心念念的盛世美颜来了 | 后疫情时代的智慧旅游景区,从打造入口开始!| 提到盛世美颜,你最先想到的是?...| 一张报销单引发的"吐槽大会" | 初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS | 抠图,令我苦不堪言! | 戳中打工人的爽点,3步就够了 | AI会是考试作弊的终结者吗?...| 腾讯云AI「 承包了一片海 」| 腾讯云智媒体AI中台,获奖了!| 「可以转发给家人朋友们一起回到童年时代哦!」

1.6K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    我攻克的技术难题 - 我宣布,Java Json再也不用定义实体类了

    数据接入是我在大数据工作中的一部分,定长、csv、json是比较常见的几种数据格式。...通常我都是使用Flume来完成数据的接入,根据对端数据源配置source,在数据源配置Interceptor(拦截器),将channel设置为kafka(通常是memory,为了流计算所以放在kafka...随着接入的Json数据越来越多,每接入一种格式的json,都要定义一个实体类,然后定义一个Interceptor,来将Json解析成CSV。...javassist说起自动生成类,就想起了我在2017年自学Java时学到的javassist类。javassist提供了动态生成class的功能,接下来就看看如何使用javassist来创建一个类。...当然,我在18年开始使用flume,不仅仅是做一些数据接入,也做过大数据量的应用场景,有着使用flume从Kafka落地到HDFS超过8000亿条/天(存储500T/天)的实践,所以还略有一些心得,所以对

    40820

    “我30岁了,我还能转行大数据吗?”

    ,当你30岁的时候你有了更多的责任,所以你想要转行到一个充满“钱”途的行业里。...当你已经有了转行的念头,看完这篇文章之后再仔细的分析一下也不迟 4a5925040f2c207e32dd893bbb4c480.jpg 一、转行前问自己几个问题 1....仅仅只是一个跳槽就尚且如此,那么你需要转行面对的风险可能就更大,你当然得更加慎重...... 既然转行是一件如此慎重的事,那在此之前你可能就更有必要问自己几个问题了: 我为什么想要转行大数据?...我期望通过转行大数据获得什么? 我现目前的工作做得如何,当我遇到瓶颈的时候是想要回避困难,还是我真正热爱 当我把这个行业了解得足够透彻之后,我还会热爱吗?...30岁,并不应该是让你产生年龄焦虑的时候,此时的你更应该去追求更好的生活更高的薪资承担更多的责任。所以,大数据行业依然可以是你最好的选择。

    40300

    监视我的手机:数据都去哪儿了?

    监视我的手机:数据都去哪儿了? “现在的人几乎是全部透明的。我心里就想,马化腾肯定天天在看我们的微信,因为他都可以看的,随便看,这些问题非常大。”...这些数据包括微信聊天记录、地理位置、通讯录、通话记录、QQ消息,甚至短信 内容... 我一直想知道我的数据都去了哪里?哪些 App 在源源不断上传数据?...受到 Kushal 的启发,我决定使用部署 ss 的方式截获我个人的手机数据。...首先我想到的是手机要通过 Wi-Fi 路由器上网,那么如果在路由器端截取数据包,会比较容易。但是无法获取手机的移动基站流量。...全球分布 国内各省份分布 可以看到俺的流量大多去往了广东、上海和北京这样的地方,中国台湾这么高的原因是谷歌的服务器在那边,DNS 解析谷歌的域名都指向了中国台湾

    1.3K50

    我的项目延期了。。。

    我负责的项目延期了,我记录了项目中的一些时间点,算是对我负责的两个项目的复盘总结吧。...5、人员流动,结构、硬件离职,这两个关键岗位空缺; ——这里可能是由于每个人的设计思路不同,新来的结构人员对部分结构进行了重新设计。...产品经理更换,等待确认外观设计,大概用了3天时间; 2、手板回来后,发现太大,外观设计需要重新做; ——外观设计有圆弧,导致机芯需要抬高,导致整个整机尺寸太大,另外,发手板之前没有评审; 3、机芯只给了3D...的轮廓图,细节部分看不到,导致外观设计有的地方不合理; ——应该要给到设计公司完整的3D图或者实物图。...4、重新设计外观,涉及到商务合同之类的手续,大概用了15天。 ——————END——————

    36510

    我和JSON Schema的那些事

    哈喽,我是 树酱。...是因为我在左侧定义的birthday字段需要为date格式,而我们右侧定义的JSON数据中字段数值并不是date格式,所以校验出异常 再补充一个:前后端先把数据接口约定好,等后端把接口输出完毕,直接用JSON...除了上文的介绍:支持定义类型、对字段类型的校验之外,JSON Schema还支持以下几种特征 判断字段是否必填 支持正则表达式校验 支持枚举 字段个数、值最大最小值约束等等 总结:JSON Shema...)然后我们再通过这个模式去校验用户输入的数据 data 是否符合我们的约束 Validator工具还有很多,包括开源组件库中常使用的async-validator,感兴趣的同学可以阅读树酱君之前写的下面这两篇文章...本质上也是结合了 JSON Schema 对可视化搭建感兴趣的同学,可以阅读树酱君之前写的 从0到1开发可视化数据大屏 其他开源low-code项目可借鉴 百度 - amis vue-layout

    1.5K10

    我的网站被攻击了,我该怎么防护?

    如果您的网站已经被攻击,以下是一些建议来加强您的网站安全并保护它免受未来攻击的影响: 保持软件更新:确保您的操作系统、服务器软件、应用程序和插件等软件都是最新版本。更新通常包括修补已知漏洞的补丁。...强密码和多因素认证:使用强密码,并启用多因素身份验证(MFA)来保护您的账户。 防病毒软件和防火墙:使用安全软件来保护您的服务器免受病毒和恶意软件的侵害,并使用防火墙来限制对服务器的访问。...加密:对您的网站上的所有敏感信息进行加密,特别是在数据传输时。可以使用 HTTPS 和 SSL/TLS 证书来保护用户数据和信息。 限制访问权限:限制对服务器的访问权限,并只授权必要的人员来访问。...建立备份:定期备份您的网站和数据,以便在攻击或数据丢失时能够恢复。 培训员工:培训所有员工如何保护自己的账户和密码,并识别和报告潜在的网络威胁。...如果您的网站已经受到攻击,请尽快采取必要的步骤,如停止服务器和清除受感染的文件。最好请专业人员来处理,以确保安全并最大限度地减少损失。

    63020

    我问volatile的作用,ChatGPT的回答惊艳了我!

    大家好,前几天,我发了一篇看雪的文章,给大家看了一下编译器优化导致的一些好玩的事情。 当天,在知识星球群里开始讨论起来,聊着聊着,就聊到了volatile关键字。...然后我突发奇想,来问问最近的网红ChatGPT,看看它给我们如何讲解。 然后这家伙又一次惊艳到了我,不信你接着往下看。 首先,和面试一样,让它来讲讲这个关键字的作用。...讲的还不错,但只是套话,来继续往深了问: 回答的依旧很不错,看我继续给它出难题: 有那意思了,但还是不够,我们继续深挖本质,从汇编层面来看: 回答的非常细致了,再来额外考它一下: 经过ChatGPT...话说回来,这ChatGPT还真是好用,其他领域我不清楚,但是对咱们程序员来说,用熟悉了以后真是爱不释手,有这么一位学贯古今的老司机带路,学习和工作效率都提升了不少。...PS:插一句,这玩意儿也不可全信,有时候还是有一些错误的。 比如,你们去问它:GCC-G++是从哪个版本开始支持C++11的,然后在评论区留言,我估计就能得到不同的答案。

    39030

    我用注解优雅的实现了数据的脱敏

    2数据脱敏 数据脱敏又称数据去隐私化或数据变形,是在给定的规则、策略下对敏感数据进行变换、修改的技术机制,能够在很大程度上解决敏感数据在非可信环境中使用的问题。...但这里有个问题这里我们调用了getUserInfo()后,采用了大量的代码去专门处理脱敏数据,而实际上我们只是要获取userInfo的信息而已,为此我决定采用注解的形式,将数据进行数据脱敏即可。...我们来看看具体的脱敏方法,脱敏方法我主要写在这个SensitiveInfoUtils工具类中。这里我们来看一个手机号脱敏方法。 简单来说,就是字符串的截取和替换。...因此我决定将其改造成策略模式。...我们同样获取了想要的结果。 使用策略模式,我们需要增加类型时,只需要新增一个策略类,在里面重写好对应的方法,其他地方都不需要修改。 以上就是今天的全部内容了

    2K21

    不装了,我摊牌了!人像卡通化的功能我实现了

    不装了,我摊牌了!辰哥实现了人像卡通化的功能,玩了绝对上瘾! 今天咱们来搞点有趣的事情:人像卡通化。...这样得到的人像卡通化的功能可以顺便使用,并且还可以通过提高数据集的质量或者调整参数,让生成的卡通人像更加逼真!...辰哥告诉你,实际很简单,看完本文之后,你也可以自己动手直接生成你自己喜欢的动漫头像。 01、搭建环境 这里辰哥使用的是开源平台github的源码,里面有完整的模型结构、模型文件、数据集等。...文件夹: dataset:存放训练数据集 images:存放测试数据集(预测模型效果所使用的图片存放文件夹) models:训练好的模型存放在该目录下 utils:里面存放一些处理图片,模型结构等py文件...Py文件: train.py:训练模型 test.py:测试模型(生成一张动漫人像图片) 主要就是这两个py文件需要去了解,即如何训练模型和使用模型(生成动漫人像图) 在项目中已提供了训练好的模型和数据集

    79420

    自从有了它,我终于能完成我的学术论文了

    今天偶然和朋友抱怨了一下,朋友马上给我推荐了一个方案,就是上次的在线VScose加上LaTeX,这两个完全开源,且搭配起来非常好用,简直神器,那我们接下来赶紧开整吧!...准备一台已经部署好在线VScode的服务器,具体部署方案可以看我上一篇文章,可以 登录服务器的SSH客户端,这里我采用orcaterm。...话不多说,我们马上开始进行部署阶段,首先我们需要准备一个服务器,这里我选用的是腾讯云的轻量应用服务器,如果你想选用同款,可以点击链接:https://url.cn/eUVMuTlG部署登录服务器登录服务器控制台...设置图片输入下面的配置json{ "settingsSync.ignoredSettings": [ "vslilypond.general.pathToLilypond" ]...活动链接:https://qmoe.me/lhtw新老同享新购:两周年新购福利,诚意而来:1、新购Lighthouse低至5.5折,境内境外多地域享受优惠;2、轻量数据盘低至 99 元/年,全场 0.95

    3.2K42

    不装了,我摊牌了!人像卡通化的功能我实现了

    大家好,我是辰哥! 不装了,我摊牌了!辰哥实现了人像卡通化的功能,玩了绝对上瘾! 今天咱们来搞点有趣的事情:人像卡通化。...这样得到的人像卡通化的功能可以顺便使用,并且还可以通过提高数据集的质量或者调整参数,让生成的卡通人像更加逼真! 先来看一下效果: ? 看完效果之后,是不是觉得很神奇?...辰哥告诉你,实际很简单,看完本文之后,你也可以自己动手直接生成你自己喜欢的动漫头像。 01 搭建环境 这里辰哥使用的是开源平台github的源码,里面有完整的模型结构、模型文件、数据集等。...文件夹: dataset:存放训练数据集 images:存放测试数据集(预测模型效果所使用的图片存放文件夹) models:训练好的模型存放在该目录下 utils:里面存放一些处理图片,模型结构等py文件...Py文件: train.py:训练模型 test.py:测试模型(生成一张动漫人像图片) 主要就是这两个py文件需要去了解,即如何训练模型和使用模型(生成动漫人像图) 在项目中已提供了训练好的模型和数据集

    89030

    转行大数据 1 个月,我麻了。。。

    因为种种原因,最近我接手了组内部分大数据开发工作,对我来说是一个几乎完全陌生的领域;大学虽然也自学过,但也都是浅尝辄止,面对企业项目还是有点虚的,所以最近抽了很多时间在自学大数据,很少写文章了。...自学过程 其实工作中很难有机会利用上班时间去学习,感觉会有种摸鱼的负罪感。而且虽然说我接手了大数据的工作,但并不是说就不做后台开发,我还要接着维护之前负责的系统。...我之前写 Java 比较多,现在开发大数据用 Scala 和 Python,我就对自己很不自信了。...优雅,太优雅了!(用一个变量来判断感觉会更可读一些) 后台 VS 大数据 都说隔行如隔山,我却觉得后台和大数据开发有很多相似之处。...当然了,以上只是我自己的感受啊,仅仅是记录一下,供大家参考,也许我的心态和看法会随着未来的工作而发生变化吧~

    77120

    我的网站苟活半年了!

    大家好,我是小林。 自从 3 月份上线了网站后,我的小破站苟活了半年了。...我是把网站的文章当作「项目」来维护的,并不是上线网站后就没做其他事情了。我在本地维护了一个 git 仓库,专门用于记录网站的修改,读者反馈的错别字,完善&新增的文章我都会提交一个 commit。...我也对自己增加的「加行数,删减行数,剩余行数」做了统计,这半年来共新增了 9w 行, 如果这个行数是代码行数的话,还是挺夸张的。...其中迭代次数最多的文章,是我写图解的第一篇文章「HTTP 常见面试题」,目前已经修改过 21 次,有的是修改错别字的 commit,也有继续补充内容的 commit 。...还有大家提问,最好不要发微信给我,在网站留言会比较好,因为每天微信信息很多,有时候可能会疏漏,在网站留言还有一个好处,大家都能看到你的问题,说不一定你的疑惑也是别人的疑惑,这样就一起解决了。

    32520

    GitHub的这个彩蛋我居然才知道,我OUT了

    搞开发的哪个还没有GitHub账户?作为一个GitHub的资深用户,今天居然才发现GitHub还有这个彩蛋。什么彩蛋呢?...比如我的GitHub是: https://github.com/NotFound403 我可以建立一个同名的仓库 NotFound403。最终是这个效果: github 主页 它是怎么做到的呢?...只需要在同名仓库(我的为NotFound403)建立一个README.md,里面写Markdown,Github会自动将你写的Markdown文件渲染出来并放在你Github首页的顶部,就像上面展示的那样...不管是日后工作需要、学习需要都可以很方便的去检索,编程能力的提高其实也是一个积累的过程,而Github,包括国内的Gitee给你我提供了很好的辅助环境,所以要利用起来。...没有了人人影视,春节刷片就靠它了! 我们是移动的韭菜么?似乎程序员去哪里上班,哪里房价就贵起来了?扎心... 打工与创业残忍的区别 退休是不可能的,90岁还要继续干! 23 种设计模式的通俗解释

    23120

    我滴个乖乖,我复现了Spring的漏洞,害怕!

    你好呀,我是歪歪。 前天发布了《我想问问:你昨晚吃到 Spring 的惊天大瓜了吗?》这篇文章,没想到阅读量居然这么高。...于是我边写边吃瓜,吃着吃着,时间就来到了第二天零点。 看着时间,又看着没写几个字的文章,当时我就想:哎,这特么的拖延症也来越严重了.......反正都已经到凌晨了,要不打几把欢乐斗地主,欢乐欢乐?...必须是以 war 的形式打包。 必须是依赖了 spring-webmvc 或 spring-webflux。 我想第一个条件,就让一大批人放心了。 至少这波,不用加班加点的升级修复了。...而且,我能写 jsp 了,难道我就不能多写点其他的什么东西.... 但是我必须要补充一句,如果你也想复现这个漏洞,最关键的是前面提到的“五个请求”。...然而在 pdf 里面,这五个请求的内容其实是不全的,大概缺失了 30% 的内容。 我不知道为什么,但是我猜测是作者故意的。 但是,凭借我超强的悟(瞎)性(猜),我花了一点时间,补全了这部分的请求。

    39820

    Github的这个彩蛋我居然才知道,我OUT了

    搞开发的哪个还没有GitHub账户?作为一个GitHub的资深用户,今天居然才发现GitHub还有这个彩蛋。什么彩蛋呢?...比如我的GitHub是: https://github.com/NotFound403 我可以建立一个同名的仓库 NotFound403。最终是这个效果: ? github 主页 它是怎么做到的呢?...只需要在同名仓库(我的为NotFound403)建立一个README.md,里面写Markdown,Github会自动将你写的Markdown文件渲染出来并放在你Github首页的顶部,就像上面展示的那样...不管是日后工作需要、学习需要都可以很方便的去检索,编程能力的提高其实也是一个积累的过程,而Github,包括国内的Gitee给你我提供了很好的辅助环境,所以要利用起来。...好了我是 码农小胖哥 ,多多关注,获取更多原创编程干货。

    42520

    我的文章上榜首了!

    后面我就补充了这部分内容,发布到博客园了,没想到还被推荐到榜首了,评论区好评很多,截图纪念一下 所以,在公众号也重发一下,这次补充了很多内容,比如介绍 swap 的作用和 swap 的实验。...缺页中断处理函数会看是否有空闲的物理内存: 如果有,就直接分配物理内存,并建立虚拟内存与物理内存之间的映射关系。...内核缓存的文件数据,因为都有对应的磁盘文件,所以在回收文件数据的时候, 直接写回到对应的文件就可以了。 但是像进程的堆、栈数据等,它们是没有实际载体,这部分内存被称为匿名页。...此时我的笔记本电脑的磁盘开始出现“沙沙”的声音,通过查看磁盘的 I/O 情况,可以看到磁盘 I/O 达到了一个峰值,非常高: 有了 Swap 分区,是不是意味着进程可以使用的内存是无上限的?...linux 系统里的 /var/log/message 系统日志文件,所以无法通过查看日志确认是否发生了 OOM)。

    91920

    扶我起来我还能打:NBA新赛季开打,历史数据看勇士是否无敌?

    从各项数据上来看,也确实印证了这一点。 碾压式的总决赛数据:是骑士太低迷?还是勇士太无敌?...不知道大家是否还记得去年总决赛最后一场时,詹姆斯的夺命盖帽,没错,去年的詹姆斯,进攻火力出色,而防守同样是历史级别的。 而今年,如果硬要从詹姆斯的全面中找到一丝缺点,可能就是防守了。...拥有OK组合的湖人,在那年的季后赛前三轮保持不败,仅仅在总决赛第一场输给了76人队。与今年的勇士相比,进攻火力和净胜分勇士胜出,防守效率湖人更胜。 如果这两支球队相遇,湖人是否能抵挡勇士的三分火力?...不过可以肯定的一点是,看着如今联盟的小球盛行和勇士的无法阻挡,那些当年就永不服输的 “老流氓”们一定很想说一句“扶我起来,我还能打!”。...然而不管怎么说,勇士也不可能与当年的公牛和湖人打比赛了,这样的对比只是球迷们的饭后谈资而已。数据能告诉我们很多,可只看数据却也是万万不能的。

    34120
    领券