首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

158万张图像数据集

但限制级图像很难收集,也很少会开源。在这个项目中,作者构建了一个大型高质量图像数据集,它有超过 158 万张图像,共分为 159 个大类别,且每一个类别还有若干子类别。...项目地址:https://github.com/EBazarov/nsfw_data_source_urls 在这篇文章中,我们将介绍一个新的图像开源项目,它的 158 万数据量足够训练一个大型分类模型或生成模型...总体而言,我们会发现该项目的图像分类比较准确,至少我们采样的一些图像都属于 NSFW 和对应的类别。...下载之后最好清洗一下数据集,如: 删除重复图像 移除被禁止/删除的图片(它们会产生一个特殊的图像占位符) 找出损坏的数据并将其移除 2....注意噪声,一些资源提供了 NSFW 和中性图像的高度混合的数据。 3. 该库可以帮助检索 NSFW 图像,整个项目没有针对中性图像内容的专用 URL。

2.6K20
您找到你想要的搜索结果了吗?
是的
没有找到

Python人工智能师的自我修养

❈ 前阵子在设计一个智能反识别的方案,查阅了已有Paper,结合自己的一点想法,现对不良图像的识别进行以下梳理: 方案1:皮肤区域检测法 与正常图片相比,不良图片的最大特征就是一张图像里包含了大量暴露的皮肤区域...主要方法如下: 1) 将RGB通道的图像转为HSV或YCbCr通道的图像: 2) 分析转换后三通道的图像信息,目前对皮肤区域的定义区间如下: ? 3) 皮肤区域统计: ?...5) 总结: 该方法通过对图像通道的变化分析,可快速检测出嫌疑色情图像,操作简单,但是对于“性感——如女性泳装照”、“正常——如男性裸露上身、裸体婴儿皮肤”等均会误判为少儿不宜的图像。...方案2:机器学习方法 对于一张图像,我们可以广义地定义为3类:“正常”、“性感”、“色情”。因此,可以利用机器学习的方法来对训练集图像进行训练,将训练后的模型用于预测。...将其转换为基于深度学习的 图像分类(Classification) 或 图像检测(Detection)(关键部位检测)问题。 总结:该方法准确率和鲁棒性均可以达到最高,但需要海量标记样本。

1.6K80

你觉得人工智能这事,靠谱不?

目前多家人工智能公司已开始布局业务,阿里巴巴和腾讯分别拥有阿里绿网、万象优图两大系统。而在创业公司方面,较为知名的有图普科技、飞搜科技、深图智服等公司。...直播(如花椒、映客)、在线视频(如优酷、爱奇艺)、图片的区别在哪儿?直播的难度是否最大?要解决哪些技术问题?...至于技术问题,其实在算法层面难度并不高,利用深度学习算法训练后,就能达到不错的效果。...至于如何收集这些数据,一般情况下很多视频直播都已经有现成的,包括中心等都有非常大量的此类图片。 直播是不是要识别里面的每一帧图像,这样计算量岂不是很大?...综合上述内容,AI 科技评论把人工智能总结为以下几点: 实时视频影像分析大致要从三个方向鉴定:是否有人物、人形轮廓的肤色比例、姿态分析。

1.8K50

ICIP2018 | 图像做得好,健康上网少烦恼

不同于文字图像目前仍大量依赖人类师,一方面存在审核标准的主观误差,另一方面也不利于师这一职业人员的长期心理健康。随着人工智能浪潮的涌动,机器领域也在不断呈现出令人耳目一新的硕果。...现有解决方案 目前,现有的敏感图像的鉴别技术方案主要分为两种。第一种是基于卷积神经网络 CNN(Convolution Neural Network)的敏感图像分类方法 [1]。...我们提出的解决方案 目前现有的技术无法解决图像中存在敏感区域大小各异情况下的分类问题。而且针对图像的分类没有把各个语境下的特征整合起来进行分类,需要分段训练各个语境的网络再拼接起来,训练过程繁琐。...论文地址:https://ieeexplore.ieee.org/document/8451366 摘要:在打造一个健康有序的网络环境的过程中,「」已经成为一个重要命题。...本发明专利结合深度学习,建立了鉴定敏感图片的模型及其终端,一方面,为类似于师等职位的人提高工作效率,另外一方面,通过自动化的手段在第一时间有效的制止了敏感图片在有些网站的流传。

76130

精炼师背后的故事

精炼师背后的故事 ——大蛇智能师版正式发布 用AI来鉴别黄色图片,已经不是什么新鲜的事情。然而能够训练出一个可用的图像识别模型,其中所需要的细节知识还是值得学习的。...本文就来从师的训练细节说起,为大家介绍一下训练出高质量的可用模型所需要的具体步骤。可以帮助大家举一反三,在其它领域训练出高质量的商用模型。...一、数据集的选取 在GitHub上有一个20万张图片的原始数据集,直接使用该数据集可以使我们节约很多时间。这份资源的贡献者是一位名叫Alexander Kim的数据科学家。...四、师产品的迭代实战 师产品被部署到了lab.aianaconda.com网站上,同时也在公众号“相约机器人”下面的“AI实验室”菜单中,以小程序的形式对外开放。...AI师界面 其背后使用的是tf-serving技术,有关tf-serving的方法,也可以在《深度学习之TensorFlow:工程化项目实战》一书中找到教程和对应的代码实例。

2.4K20

【机器学习看裸照】谷歌、微软、亚马逊,哪家图像API能力强?

智能手机时代,手机上装有一个、两个甚至更多的摄像头,图像(和视频)已经成为用户与社交媒体互动的最常见方式。...开发、构建上述ML解决方案是一件非常困难的任务,所以像谷歌、微软这样的大型技术公司或Clarifai这样的小公司都会提供api来帮助用户完成这项工作。...我们比较了AWS rekognition、Microsoft moderation services、Google vision 和Clarifai的API的性能。...数据集介绍 我们使用了YACVID数据集的180幅图像,其中90张图像人工标记为非裸照,90张图像为裸照。我们用这4个API分别去测试这180张图像,并记录它们的分类的情况。 ?...该API将NSFW值大于或等于0.85的图像分类为NSFW, NSFW值小于或等于0.15的图像分类为SFW。而处于0.15到0.85范围之间的图像被视为未知状态(因为召回率非常低)。

1.8K30

智能云上手指南:如何使用腾讯云开放的图片能力?

6月21日,深圳,腾讯云+未来峰会,腾讯云发布2017战略新品——智能云,定义人工智能进“AI即服务的智能云”时代,宣布腾讯云在AI领域全线布局,将腾讯积累近20年的AI能力向政府、企业和开发者开放,腾讯云将首先开放腾讯在计算机视觉...腾讯云本次开放的三项核心能力(计算机视觉、智能语音识别、自然语言处理)有由上述3个团队提供的技术。...对于普通开发者而言,现在可以通过腾讯云开发者实验室0门槛体验优图鉴等能力。...SDK for PHP git clone https://github.com/tencentyun/image-php-sdk-v2.0 /data/image-php-sdk 3.使用万象优图的...AI虽然很高大上,通过这样一个小小的腾讯云上实验,开发者15分钟就可以体验到腾讯云提供的智能服务PHP SDK的便利。

5.6K21

“软色情”事件频发,专家揭秘AI“技术|上云那些事

据了解,如今不少内容平台纷纷开始利用AI技术来为内容审核提供支持,但是随着内容信息从图文向视频等形式的发展,AI“技术也迎来了新的挑战。...腾讯安全内容风控专家杨红在接受采访时就表示,对于如今的AI“技术挑战,主要来自于三个方面: “第一,从以前的裸露色情,发展到了现在的低俗色情;第二,以前的主播是单向输出,现在的语音房间是多人互动,...杨红坦言,对于技术平台而言,技术发展到今天,高度利用了AI和大数据模型,而非纯人力投入。 杨红建议,对于企业而言,在进行内容风控时要围绕内容生产、传播、存储这三个环节,建立起高效的内容审核流程。

1.2K40

原来师的KPI是这样的

为了大家的身心健康,我们有必要来探讨一下,如何才能科学有效地。 ? 人类行不行? 评判一个人类师行不行,首先要考虑知识渊博程度。 毕竟对于人类来说,是个经验驱动型工作。...很遗憾,AI在一开始,就遇到了重重困难。 AI难在哪? 简单来说,AI的过程是这样的: 最开始,由算法工程师给AI模型喂入大量已标注性感/色情的图片。...然后,AI会在图像数据的特征空间上学习一个决策面,将色情及性感两类数据划分开来。 ? △分类器完成决策面 完成这种“分类”,也即AI学习一个分类函数的过程。...那么这时,AI师哪怕完全不会,也能达成“高正确率”的目标—— 只需要全判断成“正常图片”就行! ? 这可比错夹了艺术作品严重多了。 如何让AI科学?...二作许倩倩,是中国科学院计算技术研究所副研究员。 当然,除了以外,这个指标还能被用在更多的AI安全模型上。

1.4K50

界的“Master”,其实是“他”

随手一搜 师年薪20万? 师一天看多少部小电影? 师身体变差惨遭分手? 那么,身体变差这是否对工作者的一个理解误区?今天安小妹拉你们一起与一位“师”交谈下,看看他如何说。...后来这位“师”告诉我,腾讯云天御的技术界的“Master”,这一听,我当然假装质疑这是在吹牛,于是软磨硬泡之下,剧情反转,“师”终于答应带安小妹见识下工作环境了。...他继续介绍到:“因为天御服务是引入人工智能,通过机器从海量的截图中筛选出可疑的图片,并将其推送到多屏监控系统,师们只要动动鼠标就可以对房间进行封停操作,原本上千万的图片需要上百的师才能搞定,...使用人工智能挑选几千张图片,3个师轮班即可处理过来,大大节约时间成本与人力成本。”...“ 当你们谈论伤身的时候 可能是你们的姿势不正确 当我们谈论的时候 我们谈论的是人工智能在图片识别的应用 by 天御师 所以其实你不是师,我也不是师,我们今天说到的真正师是天御

2K40

UCloud 云服务内容 Java 版本实现

无她,API还没有这么智能,毕竟是自己训练的,不是那么专业!为了更好的服务广大网友,撸主决定接入更加智能快速的服务。...UCloud UCloud内容审核产品,基于海量训练数据,结合深度学习识别技术,基于UCloud底层云服务,提供99.9%的服务稳定性保障。...能够精准识别图片、视频中的低俗内容,适用于各类用户的审核需求,帮助您在业务层面降低违规风险,同时应用算法服务,也大大减轻了人工审核的投入成本。...最主要的是,识别服务在2020年6月30日前,均免费试用。即使到期以后,小伙伴们也不用太担心,识别服务定价采取阶梯定价方式,每日2000张免费调用额度,剩余部分不累积。...接入新的服务,和自建一起使用双重保驾护航,同时小伙伴们可以自由的上传喜欢的动图了。

1.8K10

AI让“0”误差,从此涉师们不再被掏空

人工智能市场也是愈发竞争激烈,目前阿里绿网、腾讯万象优图、图普科技等团队已占据大量市场份额,那么人工智能究竟发展到了什么程度,又能为市场贡献多少光和热呢?...智能的生成具体步骤如下图所示。 智能模型生成步骤 直播一般从哪些方面进行鉴定? 通常情况下,直播通过视频截图、图像识别、语音技审、弹幕监控、关键字抽取等能力智能识别色情内容。...智能相对于人工、成本下降多少? 以一家月直播10万小时的中小直播平台为例,如果采用传统的内容审核技术,100人的内容管理团队每月所花费的成本在80万上下。...随着技术的逐渐成熟,智能已经显示出巨大的优势。即便在目前的过渡阶段,机器也可以很好地与人工配合,减少工作量,提高准确度。...事实上,无论是智能还是人工,其目的都是为了营造一个更健康的网络环境。相对于人工耗费大量的人力、财力,以及对员工身心的影响,依托大数据和云计算的智能显得更为“现代化”。

2.6K20
领券