首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏作者
1330
文章
2441013
阅读量
326
订阅数
python抠图(去水印)开源库lama-cleaner
Lama Cleaner 是由 SOTA AI 模型提供支持的免费开源图像修复工具。可以从图片中移除任何不需要的物体、缺陷和人,或者擦除并替换(powered by stable diffusion)图片上的任何东西。
机器学习AI算法工程
2023-09-27
1K0
PyTorch 2.0 实操,模型训练提速!
PyTorch 2.0 官宣了一个重要特性 —— torch.compile,这一特性将 PyTorch 的性能推向了新的高度,并将 PyTorch 的部分内容从 C++ 移回 Python。torch.compile 是一个完全附加的(可选的)特性,因此 PyTorch 2.0 是 100% 向后兼容的。
机器学习AI算法工程
2023-02-28
1.4K0
yolov7-keras源码,可以用于训练自己的模型
向AI转型的程序员都关注了这个号👇👇👇 YOLOV7目标检测模型在keras当中的实现 支持step、cos学习率下降法、支持adam、sgd优化器选择、支持学习率根据batch_size自适应调整、新增图片裁剪、支持多GPU训练、支持各个种类目标数量计算、支持heatmap。 性能情况 训练步骤 全部 代码 获取方式: 关注微信公众号 datayx  然后回复 yolov7  即可获取。 a、训练VOC07+12数据集 数据集的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集
机器学习AI算法工程
2022-09-28
1.1K0
命名实体识别工具,支持BertSoftmax、BertCrf、BertSpa,开箱即用
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx nerpy实现了BertSoftmax、BertCrf、BertSpan等多种命名实体识别模型,并在标准数据集上比较了各模型的效果。 https://github.com/shibing624/nerpy Evaluation 说明: 结果值均使用F1 结果均只用该数据集的train训练,在test上评估得到的表现,没用外部数据 shibing624/bert4ner-base-chinese模型达到同级别参数量SOT
机器学习AI算法工程
2022-08-26
1.1K0
NLP推理与语义相似度数据集
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx Chinese NLP Toolkits 中文NLP工具 Toolkits 综合NLP工具包 THULAC 中文词法分析工具包 by 清华 (C++/Java/Python) NLPIR by 中科院 (Java) LTP 语言技术平台 by 哈工大 (C++) pylyp LTP的python封装 FudanNLP by 复旦 (Java) BaiduLac by 百度 Baidu's open-source lexi
机器学习AI算法工程
2022-08-26
1.5K0
手写实现李航《统计学习方法》书中全部算法
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 监督部分 第二章 感知机: 博客:统计学习方法|感知机原理剖析及实现 实现:perceptron/perceptron_dichotomy.py 第三章 K近邻: 博客:统计学习方法|K近邻原理剖析及实现 实现:KNN/KNN.py 第四章 朴素贝叶斯: 博客:统计学习方法|朴素贝叶斯原理剖析及实现 实现:NaiveBayes/NaiveBayes.py 第五章 决策树: 博客:统计学习方法|决策树原理剖析及实现 实现:
机器学习AI算法工程
2022-08-26
7470
yolov7-pytorch可用于训练自己的数据集
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx YOLOV7:You Only Look Once目标检测模型在pytorch当中的实现 所需环境 torch==1.2.0+ 为了使用amp混合精度,推荐使用torch1.7.1以上的版本。 全部 代码  ,预训练模型 获取方式: 关注微信公众号 datayx  然后回复 v7  即可获取。 训练步骤 a、训练VOC07+12数据集 数据集的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集,
机器学习AI算法工程
2022-07-26
2.1K0
DBnet检测加分类,提取身份证要素
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx DBnet文本检测网络加入多分类,可以实现模型很小又能够区分类别的功能,然后可以根据检测框的标签快速提取目标字段,在端侧部署的话就能达到非常高的精度和效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg 或者下载工具  labelImg.exe链接:https://pan.baidu.com/s/14
机器学习AI算法工程
2022-07-18
1.6K0
华为官宣:免费培养5000位Python+深度学习开发者,结营可领取证书
NLP中的算法复杂,应用场景多变,涉及数学、语言学、计算科学多门学科,理解起来很抽象,单靠自学、看课程难以理解晦涩难懂的逻辑。即使你已经看过很多深度学习、人工智能、自然语言处理理论知识,依然难以着手开发项目。 为此,华为云上线了Python+NLP实战营,帮助学习者掌握自然语言处理理论和应用,提升NLP相关编程能力,低门槛入门开发AI项目。重要的是,由华为专家授课教学,全程免费报名学习。 适 合 人 群 01 在校学生 ① 计算机、人工智能专业 ② 0门槛入门NLP领域知识 ③ 希望从事企业AI工程师 0
机器学习AI算法工程
2022-07-18
7120
【建议收藏】CV学习路径推荐
我跟几位BATJ现职的CV算法工程师聊了聊学习路径的话题—— 学习CV要具备哪些基础? CV算法工程师应当掌握哪些技能? 01 学习CV要具备哪些基础 01 编程与数理基础 掌握Python基础理论知识、了解第三方数据科学库,能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。 02 机器学习基础 了解线性回归、逻辑回归、决策树等机器学习经典模型、能够基于Python语言上手机器学习算法实践。 03 深度学习基础 熟练卷积神经网络和循环神经网络、了解简单的Pytor
机器学习AI算法工程
2022-07-12
6540
高质量中文预训练模型汇总
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型。 NLU系列 BERT RoBERTa ALBERT NEZHA XLNET MacBERT WoBERT ELECTRA ZEN ERNIE RoFormer StructBERT Lattice-BERT Mengzi-BER
机器学习AI算法工程
2022-06-02
2.5K0
使用sklearn的cross_val_score进行交叉验证
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 在构建模型时,调参是极为重要的一个步骤,因为只有选择最佳的参数才能构建一个最优的模型。但是应该如何确定参数的值呢?所以这里记录一下选择参数的方法,以便后期复习以及分享。 (除了贝叶斯优化等方法)其它简单的验证有两种方法:1、通过经常使用某个模型的经验和高超的数学知识。2、通过交叉验证的方法,逐个来验证。 很显然我是属于后者所以我需要在这里记录一下 sklearn 的 cross_val_score: 我使用是cross_
机器学习AI算法工程
2022-05-25
1.3K0
基于CNN实现对摄像头捕捉的人脸进行性别和年龄的预测
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 实现思路 📷 数据处理 原始数据来源于 https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/static/wiki_crop.tar 原始数据集包含的图片数量很多,我从中筛选了大约10000张图片(筛选条件为:由OpenCV识别出的face数目为1、性别已知、男女各约5000张) 图片尺寸统一为 100x100,文件名格式统一为 编号-年龄-性别.png,其中性别1
机器学习AI算法工程
2022-04-22
1.4K0
文本数据标注工具doccano【介绍最详细的一遍文章】
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx doccano是一个开源文本标注工具。它提供了文本分类,序列标注和序列到序列的标注功能。因此,您可以为情绪分析,命名实体识别,文本摘要等创建标记数据。只需创建项目,上传数据并开始标注。 总结下来就3步,上传数据,标注,下载带有标签的数据。 官网:http://doccano.herokuapp.com/ 📷 📷 命名实体识别 第一个演示是序列标记任务之一,命名实体识别。您只需选择文本跨度并对其进行标注即可。由于doc
机器学习AI算法工程
2022-04-13
4.3K0
opencv如何读取仪表中的指针刻度
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 最近遇到一个问题,如何读取仪表中的指针指向的刻度 📷  解决方法有多种,比如,方案一:模板匹配+边缘检测+霍夫直线检测,方案二:神将网络(CNN)目标定位等, 其中CNN就有点麻烦了,需要一定数量的训练样本,太麻烦,而方案一太普通,最后我采用了方案三, 方案三:模板匹配+k-means+直线拟合 具体做法如下: 首先说一下模板匹配,它是OpenCV自带的一个算法,可以根据一个模板图到目标图上去寻找对应位置,如果模板找
机器学习AI算法工程
2022-04-11
1.7K0
各种机器学习和深度学习的中文微博情感分析
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx "情感分析"是我本科的毕业设计, 也是我入门并爱上NLP的项目hhh, 当时网上相关语料库的质量都太低了, 索性就自己写了个爬虫, 一边标注一边爬, 现在就把它发出来供大家交流。因为是自己的项目,所以标注是相当认真的,还请了朋友帮忙校验,过滤掉了广告/太短/太长/表意不明等语料,语料质量是绝对可以保证的 带情感标注的微博语料数量: 10000(train.txt)+500(test.txt) 数据格式 文档的每一行代
机器学习AI算法工程
2022-03-21
8650
Keyphrase Extraction 一个快速从中文里抽取关键短语的工具
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存。 1.抽取关键短语 在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。 这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。 For example: >>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...' >>> keywords = ['俄罗斯', '朝鲜', '普京',
机器学习AI算法工程
2022-03-17
2.5K0
yolov5鱼苗检测计数:从数据标注到训练
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 目标检测yolov5 v6.0版,pytorch实现,包含了目标检测数据标注,数据集增强,训练自定义数据集全流程。 一.环境 Python >= 3.7 Pytorch >= 1.7.x 二.标注工具 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg 或者下载工具 labelImg.exe  项目全部代码,数据集,标注工具,预训练模型获取方式: 关注
机器学习AI算法工程
2022-03-04
2.2K0
以图搜图:Python实现dHash算法
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 期研究了一下以图搜图这个炫酷的东西。百度和谷歌都有提供以图搜图的功能,有兴趣可以找一下。当然,不是很深入。深入的话,得运用到深度学习这货。Python深度学习当然不在话下。 这个功能最核心的东西就是怎么让电脑识别图片。 这个问题也是困扰了我,在偶然的机会,看到哈希感知算法。这个分两种,一种是基本的均值哈希感知算法(dHash),一种是余弦变换哈希感知算法(pHash)。dHash是我自己命名的,为了和pHash区分。
机器学习AI算法工程
2022-03-04
1.5K0
基于keras实现多标签分类(multi-label classification)
之后简要讨论SmallerVGGNet,我们将实现的Keras神经网络架构,并用于多标签分类。
机器学习AI算法工程
2022-02-28
2.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档