首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏作者
1328
文章
2430668
阅读量
325
订阅数
图解自注意力机制(Self-Attention)
传统的Attention机制发生在Target的元素和Source中的所有元素之间。
机器学习AI算法工程
2024-04-11
2920
chatGPT技术体系梳理+本质探寻
这周时间看了两本书,一本是大神斯蒂芬·沃尔弗拉姆学的《这就是ChatGPT》,另外一本则是腾讯云生态解决方案高级架构师宋立恒所写的《AI制胜机器学习极简入门》,收获还是很大的。
机器学习AI算法工程
2024-03-05
1820
算法工程师-机器学习面试题总结(3)
FM(因子分解机)模型和逻辑回归是两种常见的预测建模方法,它们在一些方面有不同的优缺点
机器学习AI算法工程
2023-09-04
3990
算法工程师-机器学习面试题总结(2)
线性回归是一种用于建立和预测变量之间线性关系的统计模型。其基本思想是假设自变量(输入)和因变量(输出)之间存在线性关系,通过建立一个线性方程来拟合观测数据,从而进行预测和推断。
机器学习AI算法工程
2023-09-04
3490
算法工程师-机器学习面试题总结(1)
损失函数是在机器学习和优化算法中使用的一种衡量模型预测结果与真实值之间差异的函数。其目标是最小化模型的预测误差,从而提高模型的性能。
机器学习AI算法工程
2023-09-04
4180
XGBoost+LightGBM+LSTM:一次机器学习比赛中的高分模型方案
作为世界第一大清洁能源的太阳能相对煤炭石油等能源来说是可再生、无污染的,只要有太阳就有太阳能,所以太阳能的利用被很多国家列为重点开发项目。但太阳能具有波动性和间歇性的特性,太阳能电站的输出功率受光伏板本体性能、气象条件、运行工况等多种因素影响,具有很强的随机性,由此带来的大规模并网困境严重制约着光伏发电的发展。通过对未来光伏发电功率的短期准确预测并设定调度计划是解决此问题的关键。目前,光伏发电功率预测技术多仅围绕气象条件和历史数据建模,而忽略了光伏板本体性能和实际运行工况对发电效率的影响,因此无法保障短期发电功率预测精度。
机器学习AI算法工程
2023-02-28
1.1K0
神了,用 Python 预测世界杯决赛,发现准确率还挺高
通过对2018年之前世界杯各个国家球队的表现以及比分结果进行数据分析,并结合以往各个球队在历届世界杯中的表现,通过机器学习算法建立模型,并对其进行评价以及模型优化之后,进行模拟2022年卡塔尔世界杯的冠军球队的归属。
机器学习AI算法工程
2022-12-13
9850
《交通大数据理论与方法》
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 随着信息通讯技术的不断发展,各行各业都产生了海量的数据,与此同时,一门新的学科应运而生—— 数据挖掘。数据挖掘是从大量数据(包括文本数据)中挖掘出隐含的、先前未知的、对决策有潜在价值的信 息、知识和关联关系,并基于这些信息和相应规则建立可用于决策支持与优化分析的模型,提供可支持预测 性决策的方法和工具。此外,数据挖掘还可帮助企业和科研团体发现业务与学科中的新趋势,揭示已知的 事实,预测未知的结果,因此“数据挖掘”已成为其
机器学习AI算法工程
2022-09-08
8380
疫情期间网民情绪识别top1~3解决方案
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 任务 给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极的还是中性的。 全部 代码  ,方案详情 获取方式: 关注微信公众号 datayx  然后回复 情绪识别  即可获取。 A榜第二,B榜第一方案 1.数据处理 我们把数据编码转换为utf-8,把所有英文标点符号转换为中文标点符号,繁体转换为简体。把数据划分为5折。 使用训练集、测试集和90万条语料训练GloVe词向量,在分词阶段把
机器学习AI算法工程
2022-08-26
8800
联邦学习助力人工智能新模型进化(附:金融隐私计算实战项目)
2016年是人工智能(ArtificiaIntelligence,AI)成熟的一年。随着AlphaGo击败人类顶级围棋手,我们真正见证了人工智能的巨大潜力,并开始期待更复杂、更尖端的人工智能技术可以应用在更多的领域,包括无人驾驶、生物医疗、金融等。 如今,人工智能技术在各行各业都显示出了优势。人们自然希望像AlphaGo这样的由大数据驱动的人工智能技术能够很快在生活中应用起来。然而,现实有些令人失望:除了少数行业,大多数领域只拥有有限的数据或质量较差的数据,这使AI技术的落地比我们想象的更困难。是否通过跨组
机器学习AI算法工程
2022-08-26
7140
yolov7-pytorch可用于训练自己的数据集
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx YOLOV7:You Only Look Once目标检测模型在pytorch当中的实现 所需环境 torch==1.2.0+ 为了使用amp混合精度,推荐使用torch1.7.1以上的版本。 全部 代码  ,预训练模型 获取方式: 关注微信公众号 datayx  然后回复 v7  即可获取。 训练步骤 a、训练VOC07+12数据集 数据集的准备 本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集,
机器学习AI算法工程
2022-07-26
2.1K0
DBnet对非固定格式核酸报告要素检测提取
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 核酸检测报告已经是疫情这些年很多人出行必备的材料,而且很多机关单位、政府部门都需要检查核酸报告才能让相关的人员进出场所。如果有一个模型能够快速的识别并提取核酸报告里的关键信息,则能很大程度上提升那些需要提交核酸报告的OA流程审核效率,提升企事业的服务效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg
机器学习AI算法工程
2022-07-26
7090
一键中文数据增强工具
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 使用:pip install nlpcda https://github.com/425776024/nlpcda 介绍 一键中文数据增强工具,支持: 1.随机实体替换 2.近义词 3.近义近音字替换 4.随机字删除(内部细节:数字时间日期片段,内容不会删) 5.NER类 BIO 数据增强 6.随机置换邻近的字:研表究明,汉字序顺并不定一影响文字的阅读理解<<是乱序的 7.中文等价字替换(1 一 壹 ①,2 二 贰 ②)
机器学习AI算法工程
2022-07-21
7750
DBnet检测加分类,提取身份证要素
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx DBnet文本检测网络加入多分类,可以实现模型很小又能够区分类别的功能,然后可以根据检测框的标签快速提取目标字段,在端侧部署的话就能达到非常高的精度和效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg 或者下载工具  labelImg.exe链接:https://pan.baidu.com/s/14
机器学习AI算法工程
2022-07-18
1.6K0
【baseline】Kaggle新赛!信用违约预测大赛
日前,Kaggle发布了American Express - Default Prediction 信用违约预测大赛。要求参赛者: 运用机器学习技能来预测信用违约 这是一个金融风控场景下的结构化数据挖掘任务,对本领域感兴趣的小伙伴,千万不要错过。 下面是本场比赛的baseline。 加我回复“运通”获取baseline+数据集 01 PART 赛题分析+baseline 1、赛题链接 https://www.kaggle.com/competitions/amex-default-predictio
机器学习AI算法工程
2022-07-06
1.3K0
YOLOv6训练运行教程,鱼苗检测
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 精度与速度远超 YOLOv5 和 YOLOX 的新框架 YOLOv6关键技术介绍 YOLOv6 主要在 Backbone、Neck、Head 以及训练策略等方面进行了诸多的改进: 我们统一设计了更高效的 Backbone 和 Neck :受到硬件感知神经网络设计思想的启发,基于 RepVGG style[4] 设计了可重参数化、更高效的骨干网络 EfficientRep Backbone 和 Rep-PAN Neck。
机器学习AI算法工程
2022-07-01
1.5K0
唐宇迪128集课程一套搞定,PyTorch从入门到实战(附带课程学习资料
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 。 。 。 。 。 。 。 全部 代码  ,视频,数据集 获取方式: 关注微信公众号 datayx  然后回复 唐宇迪  即可获取。 机器学习算法AI大数据技术  搜索公众号添加: datanlp 长按图片,识别二维码 ---- 阅读过本文的人还看了以下文章: TensorFlow 2.0深度学习案例实战 基于40万表格数据集TableBank,用MaskRCNN做表格检测 《基于深度学习的自然
机器学习AI算法工程
2022-06-27
3.5K0
基于各种机器学习和深度学习的中文微博情感分析
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 中文微博情感分类语料库 "情感分析"是我本科的毕业设计, 也是我入门并爱上NLP的项目hhh, 当时网上相关语料库的质量都太低了, 索性就自己写了个爬虫, 一边标注一边爬, 现在就把它发出来供大家交流。因为是自己的项目,所以标注是相当认真的,还请了朋友帮忙校验,过滤掉了广告/太短/太长/表意不明等语料,语料质量是绝对可以保证的 带情感标注的微博语料数量: 10000(train.txt)+500(test.txt)
机器学习AI算法工程
2022-06-24
1.1K0
推荐安利5月最新30篇GAN论文【附资料】
这5年里深度学习领域最亮的崽(仔)就是GAN。GAN具备非常广泛的应用场景,目前抖音里面生成人物卡通头像,人脸互换以及自动驾驶中通过传感器采集的数据生成逼真的图像数据,用于仿真测试等。 学习和掌握GAN,论文是必不可少的部分。前沿论文能够帮助大家快速了解领域内新的技术、算法、方向。 下面是给大家分享5月最新30篇GAN论文。 01.A deep learning approach to halo merger tree construction[2022-05-31] 02.Adversarial synt
机器学习AI算法工程
2022-06-20
5410
中医药领域的问题生成,阿里天池算法大赛Top1
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 任务是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq模型来端到端地实现问题生成,而模型的输入为篇章和答案,输出为问题。 文本长度分布 篇章文本长度在100以
机器学习AI算法工程
2022-06-16
7310
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档