首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏成员
1348
文章
2599360
阅读量
335
订阅数
一文搞懂卷积神经网络(CNN)的原理(超详细)
卷积神经网络(Convolutional Neural Network,CNN)是一种在计算机视觉领域取得了巨大成功的深度学习模型。它们的设计灵感来自于生物学中的视觉系统,旨在模拟人类视觉处理的方式。在过去的几年中,CNN已经在图像识别、目标检测、图像生成和许多其他领域取得了显著的进展,成为了计算机视觉和深度学习研究的重要组成部分。
机器学习AI算法工程
2024-02-26
8.1K0
深度学习模型的训练总结
在我们训练模型时,会经常使用一些小技巧,包括:模型的保存与加载、断点的保存与加载、模型的冻结与预热、模型的预训练与加载、单GPU训练与多GPU训练。这些在我们训练网络的过程中会经常遇到。
机器学习AI算法工程
2023-12-19
5910
ChatOCR:文心一言/千帆API实现关键信息提取
现在的任务是从OCR文字识别的结果中提取我指定的关键信息。OCR的文字识别结果使用符号包围,包含所识别出来的文字,顺序在原始图片中从左至右、从上至下。我指定的关键信息使用[]符号包围。请注意OCR的文字识别结果可能存在长句子换行被切断、不合理的分词、对应错位等问题,你需要结合上下文语义进行综合判断,以抽取准确的关键信息。输出为json格式。
机器学习AI算法工程
2023-11-24
1.4K0
大模型时代下智能文档处理核心技术大揭秘
随着人工智能技术的发展,智能图像处理成为了一种风靡全球的热门技术。智能图像处理可以帮助我们从大量的图像数据中提取最有价值的信息,为医疗、军事、安防等领域带来了重大的贡献。然而,图像处理的难点也随之而来,下面我们来简单介绍一下图像处理的难点以及解决方式的比对。
机器学习AI算法工程
2023-11-22
5050
大模型(LLMs)算法工程师相关的面试题和参考答案
需要注意的是,复读机问题是大型语言模型面临的一个挑战,解决这个问题是一个复杂的任务,需要综合考虑数据、训练目标、模型架构和生成策略等多个因素。目前,研究人员和工程师们正在不断努力改进和优化大型语言模型,以提高其生成文本的多样性和创造性。
机器学习AI算法工程
2023-11-13
5.2K0
深度学习--CLIP算法(文本搜图片,图片搜图片)
  CLIP全称Constrastive Language-Image Pre-training,是OPAI推出的采用对比学习的文本-图像预训练模型。CLIP惊艳之处在于架构非常简洁且效果好到难以置信,在zero-shot文本-图像检索,zero-shot图像分类,文本→图像生成任务guidance,open-domain 检测分割等任务上均有非常惊艳的表现,本文将对CLIP做一些初步的介绍。
机器学习AI算法工程
2023-09-04
1.3K0
《深度学习调优指南.系统性优化模型》中文版
机器学习开发的最终目标是最大化模型的效用。尽管不同应用场景的开发流程有所不同(例如时间长度、可用计算资源、模型类型等),基本步骤和原则都是相似的。
机器学习AI算法工程
2023-09-04
3030
XGBoost+LightGBM+LSTM:一次机器学习比赛中的高分模型方案
作为世界第一大清洁能源的太阳能相对煤炭石油等能源来说是可再生、无污染的,只要有太阳就有太阳能,所以太阳能的利用被很多国家列为重点开发项目。但太阳能具有波动性和间歇性的特性,太阳能电站的输出功率受光伏板本体性能、气象条件、运行工况等多种因素影响,具有很强的随机性,由此带来的大规模并网困境严重制约着光伏发电的发展。通过对未来光伏发电功率的短期准确预测并设定调度计划是解决此问题的关键。目前,光伏发电功率预测技术多仅围绕气象条件和历史数据建模,而忽略了光伏板本体性能和实际运行工况对发电效率的影响,因此无法保障短期发电功率预测精度。
机器学习AI算法工程
2023-02-28
1.5K0
yolov7-keras源码,可以用于训练自己的模型
向AI转型的程序员都关注了这个号👇👇👇 YOLOV7目标检测模型在keras当中的实现 支持step、cos学习率下降法、支持adam、sgd优化器选择、支持学习率根据batch_size自适应调整、新增图片裁剪、支持多GPU训练、支持各个种类目标数量计算、支持heatmap。 性能情况 训练步骤 全部 代码 获取方式: 关注微信公众号 datayx  然后回复 yolov7  即可获取。 a、训练VOC07+12数据集 数据集的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集
机器学习AI算法工程
2022-09-28
1.2K0
知乎高赞:AI算法工程师走下神坛了?
AI算法工程师走下神坛了? 这几年来,圈子内越来越卷的话题持续不下,再加上大厂程序员“被毕业”、“再就业”的新闻层出不穷,贩卖给人们的焦虑也越来越多: 2016年——深度学习的春天是不是要来了?
机器学习AI算法工程
2022-09-27
1.3K0
基于深度学习方法的图像分割,差距不止一点点
图像分割(image segmentation)技术是计算机视觉领域的一个重要的研究方向,图像分割是计算机视觉中的一个关键过程。它包括将视觉输入分割成片段以简化图像分析。片段表示目标或目标的一部分,并由像素集或“超像素”组成。图像分割将像素组织成更大的部分,消除了将单个像素作为观察单位的需要。图像分析有三个层次: 分类 - 将整幅图片分成“人”、“动物”、“户外”等类别 目标检测 - 检测图像中的目标并在其周围画一个矩形,例如一个人或一只羊。 分割 - 识别图像的部分,并理解它们属于什么对象。分割是进行目标
机器学习AI算法工程
2022-09-22
8680
文字识别助力智能运营,加速金融业务流转效率
背景 智慧金融在金融服务的业务流程中不断深入,金融行业数字化建设的过程除了面向外部客户的服务与销售外,行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中,促使数据沉淀,加速流程效率,实现数字化建设闭环。 在智能运营覆盖的各个场景中,计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术(OCR)作为计算机视觉的主要方向之一,其识别对象包括扫描合同、印章、卡证、表格与票据信息结构化,在业务办理、风险控制、内部数
机器学习AI算法工程
2022-09-15
1.5K0
《交通大数据理论与方法》
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 随着信息通讯技术的不断发展,各行各业都产生了海量的数据,与此同时,一门新的学科应运而生—— 数据挖掘。数据挖掘是从大量数据(包括文本数据)中挖掘出隐含的、先前未知的、对决策有潜在价值的信 息、知识和关联关系,并基于这些信息和相应规则建立可用于决策支持与优化分析的模型,提供可支持预测 性决策的方法和工具。此外,数据挖掘还可帮助企业和科研团体发现业务与学科中的新趋势,揭示已知的 事实,预测未知的结果,因此“数据挖掘”已成为其
机器学习AI算法工程
2022-09-08
9040
智慧课堂实时监测系统
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 项目简介 本项目基于PaddlePaddle和EasyDL平台,以教务处和学工为一级用户,高校教师为二级用户,针对提升整体课堂教学质量为目的开发的一款实时课堂监测系统。 本项目主要监测课堂的出勤人数、学生的上课状态、教师的语速、情感,以及语言的用词方面。项目中语音的模型均采用EasyDL平台进行训练,调用在线API进行预测分析。而图像模型由于在线API无法达到实时性的要求,采用本地训练Paddle模型库中的模型并使用。
机器学习AI算法工程
2022-08-26
2K0
BERT大火却不懂Transformer?
前段时间 Transformer已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等 Transformer为什么这么有实力? 因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer 更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研
机器学习AI算法工程
2022-08-26
2560
疫情期间网民情绪识别top1~3解决方案
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 任务 给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极的还是中性的。 全部 代码  ,方案详情 获取方式: 关注微信公众号 datayx  然后回复 情绪识别  即可获取。 A榜第二,B榜第一方案 1.数据处理 我们把数据编码转换为utf-8,把所有英文标点符号转换为中文标点符号,繁体转换为简体。把数据划分为5折。 使用训练集、测试集和90万条语料训练GloVe词向量,在分词阶段把
机器学习AI算法工程
2022-08-26
9270
小红书都在研究的多模态学习 , 到底有多强?
什么是多模态? 多模态指的是多种模态的信息,包括:文本、图像、视频、音频等。 它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样,希望充分利用文本、图像、语音和视频等多种模态,这就是「多模态学习」。多模态学习的研究时间不算太长,但应用前景非常广泛,如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。 不过, 要说多模态技术真正实现了落地,似乎还太早,从多模态数据标注到跨模态转化,该领域都面临着众多挑战。这就需要研究社区和业界持续
机器学习AI算法工程
2022-08-26
9700
yolov7-pytorch可用于训练自己的数据集
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx YOLOV7:You Only Look Once目标检测模型在pytorch当中的实现 所需环境 torch==1.2.0+ 为了使用amp混合精度,推荐使用torch1.7.1以上的版本。 全部 代码  ,预训练模型 获取方式: 关注微信公众号 datayx  然后回复 v7  即可获取。 训练步骤 a、训练VOC07+12数据集 数据集的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集,
机器学习AI算法工程
2022-07-26
2.2K0
DBnet对非固定格式核酸报告要素检测提取
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 核酸检测报告已经是疫情这些年很多人出行必备的材料,而且很多机关单位、政府部门都需要检查核酸报告才能让相关的人员进出场所。如果有一个模型能够快速的识别并提取核酸报告里的关键信息,则能很大程度上提升那些需要提交核酸报告的OA流程审核效率,提升企事业的服务效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg
机器学习AI算法工程
2022-07-26
7500
一键中文数据增强工具
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 使用:pip install nlpcda https://github.com/425776024/nlpcda 介绍 一键中文数据增强工具,支持: 1.随机实体替换 2.近义词 3.近义近音字替换 4.随机字删除(内部细节:数字时间日期片段,内容不会删) 5.NER类 BIO 数据增强 6.随机置换邻近的字:研表究明,汉字序顺并不定一影响文字的阅读理解<<是乱序的 7.中文等价字替换(1 一 壹 ①,2 二 贰 ②)
机器学习AI算法工程
2022-07-21
8540
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档