首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏作者
1328
文章
2437099
阅读量
326
订阅数
基于机器学习的GitHub敏感信息泄露监控
现在很多公司都会面临,内部敏感信息,比如代码,内部系统服务器地址,账号,密码等等泄露到GitHub上的风险,有恶意的也有非恶意的。这个问题有时很难完全规避掉,为了降低可能的恶劣影响,一般都是会内部搭建一个GitHub敏感信息泄露的监控系统。
机器学习AI算法工程
2021-12-05
9750
Unet车牌分割,矫正
我们可以通过图像分割算法对一张输入图片进行分割,分割后的图形其实是对原图中的区域进行的分类标注,例如这里我们可以将原图标注为2类,一类就是车牌区域,还有一类就是无关的背景区域。说到标注图形就不得不说labelme了,我们可以在cmd界面通过命令 pip install labelme 进行labelme库的安装,安装结束在cmd界面输入labelme即可打开lablem软件的标注界面如下:
机器学习AI算法工程
2021-01-27
1.2K0
keras版Mask-RCNN来训练自己的目标检测数据集
1、下载好cuda9跟cudnn7,然后在安装好后,cuda其会自动添加到环境变量里,所以使用keras进行GPU加速的时候会自动使用这些库。
机器学习AI算法工程
2020-06-28
1.2K0
对美食评语进行情感分析
Yelp Reviews是Yelp为了学习目的而发布的一个开源数据集。它包含了由数百万用户评论,商业属性和来自多个大都市地区的超过20万张照片。这是一个常用的全球NLP挑战数据集,包含5,200,000条评论,174,000条商业属性。 数据集下载地址为:
机器学习AI算法工程
2019-10-29
2K0
大规模中文自然语言处理语料(百科,问答、新闻,翻译)
中文的信息无处不在,但如果想要获得大量的中文语料,却是不太容易,有时甚至非常困难。在2019年初这个时点上,普通的从业者、研究人员或学生,并没有一个比较好的渠道获得极大量的中文语料。笔者想要训练一个中文的词向量,在百度和github上上搜索了好久,收获却很少:要么语料的量级太小,要么数据过于成旧,或需要的处理太复杂。
机器学习AI算法工程
2019-10-28
3.1K0
darknet图像定位+tornado实现票据识别API,3w张发票识别率达到95以上
此项目用于对中国购车发票进行内容识别,目前完成的是身份证,vin,发动机号,价格的识别 提供了展示的demo页,以及提供了传入文件,路径,base64码的多种方式调用的api,返回识别出来的json数
机器学习AI算法工程
2019-10-28
8510
京东商品评论情感分析:数据采集与词向量构造方法
最近实习期间在做一个对新闻文本情感分析的项目。在此,用京东的商品评论练手,从数据采集到模型实现完整地写一遍,以备未来回顾所需。事实上,我采用的方法并不困难,甚至有点naive,所以权且作为练手吧。 本文代码在公众号 datadw 里 回复 京东 即可获取。 数据采集 在这里为了避免人工标注的麻烦,使用的是京东iPad的用户评论 https://item.jd.com/4675696.html#none 事实上,NLP情感分析中最花时间的就是人工标注。 仔细查看调试台可以很容易地发现商品的评论信息都是用
机器学习AI算法工程
2018-03-15
1.7K0
P2P网站(人人贷)散标投资数据和借贷人的信息数据爬取
有一篇有关爬取P2P网站上散标投资数据和借贷人的信息数据的博文,整合前人资料(http://sanwen8.cn/p/156w57U.html),说一下爬取中遇到的问题: (一)首先分析"散标投资"这
机器学习AI算法工程
2018-03-14
1.6K0
用python获取天气数据,并作定时播报
思路 1.调用和风天气的API,获取天气数据 2.用百度语音API,将天气数据合成语音 3.用树莓派每天早上定时播报天气(定时任务crontab + Python脚本 + mpg123播放器) Pyt
机器学习AI算法工程
2018-03-14
2.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档