每个人从本科到硕士,再到博士、博士后,甚至工作以后,都会遇到做研究、写论文这个差事。论文通常是对现有工作的一个总结和展示,特别对于博士和做研究的人来说,论文则显得更加重要。
作者 | 施方圆 编辑 | 陈彩娴 2022 年 11 月 7 日,第 31 届国际人工智能联合会议-中国会议(IJCAI 2022 China )在深圳市坪山燕子湖国际会展中心拉开帷幕。 众所周知,从 1969 年开始, IJCAI 就一直是汇集国际人工智能研究者的重要会议,是大家交流人工智能研究最新进展和成果的重要平台。 今年的IJCAI-ECAI 2022在奥地利维也纳召开,但因受到新冠疫情影响,许多中国学者仅能在线上展示自己的研究成果。为了让众多中国学者有机会线下交流,因此 IJCAI 理事会授权I
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 。 。 。 。 。 。 。 全部 代码 ,视频,数据集 获取方式: 关注微信公众号 datayx 然后回复 唐宇迪 即可获取。 机器学习算法AI大数据技术 搜索公众号添加: datanlp 长按图片,识别二维码 ---- 阅读过本文的人还看了以下文章: TensorFlow 2.0深度学习案例实战 基于40万表格数据集TableBank,用MaskRCNN做表格检测 《基于深度学习的自然
一年前,Datawhale开源项目南瓜书发布,受到全网转发,一年后,南瓜书完整版正式撒花完结。从基础公式解析到难点探讨,无论你数学功底如何,都可以在南瓜书里找到你想要的。
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 所有论文 包括已经录制完成和之后将要介绍的论文。选取的原则是10年内深度学习里有影响力文章(必读文章),或者近期比较有意思的文章。当然这十年里重要的工作太多了,不可能一一过一遍。在选取的时候我会偏向一些之前 直播课 中没讲到过的。 总论文数 67,录制完成数 32 全部 代码 ,预训练模型 获取方式: 关注微信公众号 datayx 然后回复 论文 即可获取。 机器学习算法AI大数据技术 搜索公众号添加: d
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型。 NLU系列 BERT RoBERTa ALBERT NEZHA XLNET MacBERT WoBERT ELECTRA ZEN ERNIE RoFormer StructBERT Lattice-BERT Mengzi-BER
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 安装依赖 pip install requests 使用方法 浏览器打开:https://order.jd.com/center/list.action 没登录就登录 F12 控制台 console 栏输入 console.log(_JdJrTdRiskFpInfo, _JdEid) 参数依次对应: _JdJrTdRiskFpInfo => self._JdJrTdRiskFpInfo _JdEid => self.
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx nerpy实现了BertSoftmax、BertCrf、BertSpan等多种命名实体识别模型,并在标准数据集上比较了各模型的效果。 https://github.com/shibing624/nerpy Evaluation 说明: 结果值均使用F1 结果均只用该数据集的train训练,在test上评估得到的表现,没用外部数据 shibing624/bert4ner-base-chinese模型达到同级别参数量SOT
机器之心报道 机器之心编辑部 内存友好的深度森林软件包开源了。现在,普通设备也可以跑得动深度森林。 周志华等人一直在推动的深度森林,是探索神经网络以外 AI 领域重要的研究方向之一,在表格数据建模任务中已初现锋芒。但是,由于基于决策树的集成模型在具体实现当中,经常会遇到内存不足,硬件效率不如神经网络等问题,是推动其大规模应用的主要瓶颈之一。 经过 LAMDA 徐轶轩等人的不懈努力,2021 年 2 月 1 日,新的深度森林软件包 DF21 在 GitHub 与开源中国同时开源了。该软件包尝试解决了这一方向
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 最近遇到一个问题,如何读取仪表中的指针指向的刻度 📷 解决方法有多种,比如,方案一:模板匹配+边缘检测+霍夫直线检测,方案二:神将网络(CNN)目标定位等, 其中CNN就有点麻烦了,需要一定数量的训练样本,太麻烦,而方案一太普通,最后我采用了方案三, 方案三:模板匹配+k-means+直线拟合 具体做法如下: 首先说一下模板匹配,它是OpenCV自带的一个算法,可以根据一个模板图到目标图上去寻找对应位置,如果模板找
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 实现思路 📷 数据处理 原始数据来源于 https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/static/wiki_crop.tar 原始数据集包含的图片数量很多,我从中筛选了大约10000张图片(筛选条件为:由OpenCV识别出的face数目为1、性别已知、男女各约5000张) 图片尺寸统一为 100x100,文件名格式统一为 编号-年龄-性别.png,其中性别1
作者 | 周翔,鸽子 对周志华教授来说,最近真是忙得不可开交。 8月底,在澳大利亚墨尔本举行的 IJCAI 上,南京大学周志华教授当选 IJCAI 2021 的程序委员会主席。据悉,这是中国内地首位担任此职位的学者。 近日,欧洲科学院公布 2017 年院士增选结果,周志华教授又当选欧洲科学院外籍院士。 让我们来看看欧洲科学院是何方神圣。 据南京大学新闻网报导,欧洲科学院(The Academy of Europe)由欧洲35国科学部长倡导创立,并由英国皇家学会等代表欧洲最高学术水平的国家科学院共同发起,是国
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 基于Flask RESTful api的图像特征检索方案,api传入url/base64即可在毫秒内返回数据库匹配结果,主要用于图像去重,后续拓展使用范围。 1. 项目说明: 本项目基于开源框架PyRetri进行二次开发,同时结合facebook开源项目Facebook AI Similarity Search,设计出基于Flask的RESTful api接口,目的是为了解决以下几个场景问题: 1)本地已经存储大规模
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 中文微博情感分类语料库 "情感分析"是我本科的毕业设计, 也是我入门并爱上NLP的项目hhh, 当时网上相关语料库的质量都太低了, 索性就自己写了个爬虫, 一边标注一边爬, 现在就把它发出来供大家交流。因为是自己的项目,所以标注是相当认真的,还请了朋友帮忙校验,过滤掉了广告/太短/太长/表意不明等语料,语料质量是绝对可以保证的 带情感标注的微博语料数量: 10000(train.txt)+500(test.txt)
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 在构建模型时,调参是极为重要的一个步骤,因为只有选择最佳的参数才能构建一个最优的模型。但是应该如何确定参数的值呢?所以这里记录一下选择参数的方法,以便后期复习以及分享。 (除了贝叶斯优化等方法)其它简单的验证有两种方法:1、通过经常使用某个模型的经验和高超的数学知识。2、通过交叉验证的方法,逐个来验证。 很显然我是属于后者所以我需要在这里记录一下 sklearn 的 cross_val_score: 我使用是cross_
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 项目描述 本项目是一个带有超级详细中文注释的基于GPT2模型的新闻标题生成项目。 本项目参考了GPT2-Chinese、GPT2-chitchat、CDial-GPT、GPT2等多个GPT2开源项目,并根据自己的理解,将代码进行重构,添加详细注释,希望可以帮助到有需要的人。 本项目使用HuggingFace的transformers实现GPT2模型代码编写、训练及测试。 本项目通过Flask框架搭建了一个Web服务,将新
车牌的检测和识别的应用非常广泛,比如交通违章车牌追踪,小区或地下车库门禁。在对车牌识别和检测的过程中,因为车牌往往是规整的矩形,长宽比相对固定,色调纹理相对固定,常用的方法有:基于形状、基于色调、基于纹理、基于文字特征等方法,近年来随着深度学习的发展也会使用目标检测的一些深度学习方法。该项目主要的流程如下图所示:
本项目是利用YOLOv4进行口罩佩戴检测,使用PyTorch实现。虽然现在国内疫情基本得到有效遏制,但防控仍不可过于松懈,在一些公共场合佩戴口罩还是必不可少的。基于此,自己做了该项目,后续打算继续改进,争取将其运行到边缘设备上。希望本项目能给疫情常态化防控出一份力,也希望真正的新年早日到来。
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx "情感分析"是我本科的毕业设计, 也是我入门并爱上NLP的项目hhh, 当时网上相关语料库的质量都太低了, 索性就自己写了个爬虫, 一边标注一边爬, 现在就把它发出来供大家交流。因为是自己的项目,所以标注是相当认真的,还请了朋友帮忙校验,过滤掉了广告/太短/太长/表意不明等语料,语料质量是绝对可以保证的 带情感标注的微博语料数量: 10000(train.txt)+500(test.txt) 数据格式 文档的每一行代
本文介绍了机器学习入门书籍,从机器学习的定义、发展历程、算法、数学、编程等多个角度推荐了一些经典书籍,并对每本书籍进行了简要介绍。
在之前的案例使用网络爬虫自动抓取图书信息中,我们通过简单的爬虫抓取了当当网的机器学习相关的图书数据,并保存为 ./input/books_total.csv 文件。通过爬虫采集原始数据,但是由于各种原因,原始数据往往会存在许多问题,例如数据格式不正确,数据存在冗余等等。因此第一手获得的原始数据不能直接使用,需要进行数据清洗。本案例基于爬取的书籍数据进行数据清洗,使其称为符合我们要求的数据。
周志华,南京大学教授、计算机系主任、人工智能学院院长、欧洲科学院外籍院士、ACM/AAAS/AAAI/IEEE/IAPR Fellow、CCF会士。主要研究方向为人工智能、机器学习、数据挖掘。
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 上采样与上池化 图示理解,使用三张图进行说明: 📷 图(a)表示UnPooling的过程,特点是在Maxpooling的时候保留最大值的位置信息,之后在unPooling阶段使用该信息扩充Feature Map,除最大值位置以外,其余补0。 Unpooling是在CNN中常用的来表示max pooling的逆操作。 鉴于max pooling不可逆,因此使用近似的方式来反转得到max pooling操作之前的原始情
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 之前只用过单线程处理,加载模型进行测试,运行时间上也可以接受。但是现在需要处理比较大量的数据,如果进行线性处理,可能测试一次就花10个小时,而且还不知道结果怎么样,所以多线程就必须使用上了。有关线程部分主要参考:https://junyiseo.com/python/211.html 1 多线程 多线程类似于同时执行多个不同程序,线程在执行过程中与进程还是有区别的。每个独立的进程有一个程序运行的入口、顺序执行序列和程
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 监督部分 第二章 感知机: 博客:统计学习方法|感知机原理剖析及实现 实现:perceptron/perceptron_dichotomy.py 第三章 K近邻: 博客:统计学习方法|K近邻原理剖析及实现 实现:KNN/KNN.py 第四章 朴素贝叶斯: 博客:统计学习方法|朴素贝叶斯原理剖析及实现 实现:NaiveBayes/NaiveBayes.py 第五章 决策树: 博客:统计学习方法|决策树原理剖析及实现 实现:
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 此项目可监控近千家中国企业的官方网站的新闻动态,如有更新,系统能在最短2分钟之内通过邮件发送更新的标题和链接。更新的信息流也可通过浏览器查看。监控的公司和站点可以添加删除。 原理:定期抓取网站html, 使用difflib比对新旧页面源码,发现增加的部分,提取url和text,过滤筛选,保存MySQL数据库。定期把更新的url和text,通过邮件发送给订阅者。 全部代码 获取方式: 关注微信公众号 datayx 然
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 精度与速度远超 YOLOv5 和 YOLOX 的新框架 YOLOv6关键技术介绍 YOLOv6 主要在 Backbone、Neck、Head 以及训练策略等方面进行了诸多的改进: 我们统一设计了更高效的 Backbone 和 Neck :受到硬件感知神经网络设计思想的启发,基于 RepVGG style[4] 设计了可重参数化、更高效的骨干网络 EfficientRep Backbone 和 Rep-PAN Neck。
【导读】斯坦福大学《深度学习理论》《Theories of Deep Learning》 课程邀请相关专家带你探究深度学习背后的理论基础,解开深度学习的黑盒,带你知其然知其所以然。专知内容组特别整理为大家展现,欢迎大家阅读,转发分享!文末查看课程PPT下载! 深度学习理论 深度学习的理论探讨比应用滞后了“好几个量级”。在2017未来科学大奖颁奖盛典,南京大学教授周志华在与深鉴科技联合创始人汪玉对话时表示,深度学习的理论探讨比应用滞后了“好几个量级”,在谈及人工智能近期的热潮时表示,这是源于机器学习在过去1
采访 | 孟岩 导读 周志华教授是蜚声国内外的机器学习专家,也是本届中国人工智能大会的主席之一。他的《机器学习》2016年1月出版之后,迅速成为这个领域的一本权威教材,在一年半的时间里重印十几次,发行逾16万册,并被冠以“西瓜书”的昵称,成为这一轮 AI 热潮的一个重要注脚。周志华教授潜心学术,为人低调,极少接受采访。这次中国人工智能大会上,由会议安排,他破例接受了我们的专访,就很多重要问题坦率的谈了自己的看法。我们特将内容整理成文,以飨读者。 大反转难免会有,盲目追捧深度学习有危险 AI科技大本营:感谢周
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx doccano是一个开源文本标注工具。它提供了文本分类,序列标注和序列到序列的标注功能。因此,您可以为情绪分析,命名实体识别,文本摘要等创建标记数据。只需创建项目,上传数据并开始标注。 总结下来就3步,上传数据,标注,下载带有标签的数据。 官网:http://doccano.herokuapp.com/ 📷 📷 命名实体识别 第一个演示是序列标记任务之一,命名实体识别。您只需选择文本跨度并对其进行标注即可。由于doc
1. MIT脑科学课程视频,虽然跟工程不太一样,但是cognitive science也是很重要
从下棋的 AlphaGo 到预测蛋白质结构的 AlphaFold,从画画的 DALL·E 2 到聊天的 ChatGPT,这些或曾红极一时,或正风头正盛的 AI 模型们,正一步一步将人类幻想中的未来推到了眼前。
向AI转型的程序员都关注了这个号👇👇👇 火爆全网的小游戏羊了个羊到底藏了什么套路?几乎所有人上班下班都在玩,可通关率据说还不到1%。 其实这个游戏和你的策略或技术没啥关系,完全是算法和运气在折磨你。十年前我们玩空当接龙的时候,所有牌都是明牌,理论上可以算出最优解;但羊了个羊不一样,策略再好也不能稳赢,因为你根本不知道一张牌底下藏着什么牌,这和斗地主还不一样,斗地主的牌堆是固定的,但游戏里的牌堆可以被算法改变。 知乎上有人算出了通关概率,游戏一共有14种图案,即使按照逐渐消层的最优解,底下的牌也有200多万
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx DBnet文本检测网络加入多分类,可以实现模型很小又能够区分类别的功能,然后可以根据检测框的标签快速提取目标字段,在端侧部署的话就能达到非常高的精度和效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg 或者下载工具 labelImg.exe链接:https://pan.baidu.com/s/14
2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于在9月21日-22日在青岛胶州召开。
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 核酸检测报告已经是疫情这些年很多人出行必备的材料,而且很多机关单位、政府部门都需要检查核酸报告才能让相关的人员进出场所。如果有一个模型能够快速的识别并提取核酸报告里的关键信息,则能很大程度上提升那些需要提交核酸报告的OA流程审核效率,提升企事业的服务效率。 1.标注数据 标注方法和标注目标检测的数据一样,一个框加一个标签 pip install labelImg ==1.8.6 安装完毕后,键入命令: labelImg
本文介绍了人工智能的概念、发展历史、应用领域、技术流派、职业前景、高校培养方案以及人工智能对数学基础的要求。作者认为,人工智能是未来科技的引擎,希望更多年轻人能投身到人工智能领域,为社会创造更多价值。
因为我这里只是判断 【人没有带安全帽】、【人有带安全帽】、【人体】 3个类别 ,基于 data/coco128.yaml 文件,创建自己的数据集配置文件 custom_data.yaml
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 随着信息通讯技术的不断发展,各行各业都产生了海量的数据,与此同时,一门新的学科应运而生—— 数据挖掘。数据挖掘是从大量数据(包括文本数据)中挖掘出隐含的、先前未知的、对决策有潜在价值的信 息、知识和关联关系,并基于这些信息和相应规则建立可用于决策支持与优化分析的模型,提供可支持预测 性决策的方法和工具。此外,数据挖掘还可帮助企业和科研团体发现业务与学科中的新趋势,揭示已知的 事实,预测未知的结果,因此“数据挖掘”已成为其
向AI转型的程序员都关注了这个号👇👇👇 普通211硕士,方向是内燃机,现在研二,未来想换到自动驾驶,会matlab的编程计算,simulink有一定了解,目前想要深入学习,请问该如何提高自己,才能进去车企的自动驾驶团队,我知道可能我专业不太相符,但是较为喜欢自动驾驶和控制逻辑,请不吝赐教. 自动驾驶学习资料汇总 https://zhuanlan.zhihu.com/p/517710302 1. 课程资料 德国蒂宾根大学的自动驾驶课程 (Self-Driving Cars, lectureed by Pr
微软剑桥联合推出 DeepCoder 近日 AI 研习社获悉,微软和剑桥大学的研究员近日发布了一篇介绍“会编程的机器学习系统——DeepCoder”的论文。据介绍,DeepCoder 系统可以解决编程比赛所涉及到的基础编程题目,为不会编程的人提供了制作简易程序的可能。 DeepCoder 研究人员表示,“DeepCoder 可以让非编程人员通过向计算机描述自己的程序构想来获得想要的程序,系统会自动写就。但这并不意味着程序员就会失业,研究人员表示,DeepCoder 的出现,可以让开发人员将精力放在更复杂、更
机器学习成就智能未来 腾讯-南京大学LAMDA研究所机器学习交流沙龙 机器学习是人工智能的核心,其应用遍及人工智能的各个领域。为促进在AI方向的产学研交流,9月23日,腾讯高校合作部门特邀请南京大学LAMDA研究所(Learning And Mining from DatA http://lamda.nju.edu.cn)主任周志华教授及5位核心研究人员访问腾讯,与腾讯业务团队开展“AI Day犀牛鸟机器学习主题沙龙”活动。 80余位腾讯员工参与了现场活动,充分体现了公司在AI方向的广度与热情。 腾讯技
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 在大数据和人工智能技术加持下,不同行业各种新兴的风险控制手段也正在高速发展。但这些风险信息散落在互联网的海量资讯中,若能从中及时识别出风险事件并挖掘出潜在的风险特征,能够大幅提升识别和揭示风险的能力。而风险事件以文本的形式存在,需要采用自然语言理解模型实现风险事件的高精度智能识别,其本质是属于一个文本分类任务。 NLP(自然语言处理)作为人工智能领域皇冠上的“明珠”,其技术的科研创新一直精进不休。而文本分类在自然
来源:科学出版社 周志华教授 周志华教授主要从事人工智能、机器学习、数据挖掘领域的研究工作, 现任南京大学计算机软件新技术国家重点实验室常务副主任、校学术委员会委员, 2003年获国家杰出青
---- 新智元报道 编辑:Emile, yaxin, 好困 【新智元导读】近日,由周志华教授、俞扬教授和钱超研究员共同完成的新书——《演化学习:理论与算法进展》即将上线!堪称「宝藏级」新书,速来拜读。 很长时间以来,演化学习算法在机器学习领域是一个冷门且充满「玄学」意味的分支。 在线体验遗传算法如何「炼丹」: https://rednuht.org/genetic_cars_2/ 而周志华教授团队近二十年来的一项持续研究,让演化学习不再是「玄学」和「炼丹」,而是拥有坚实的理论基础和丰富的算法
看了很多回答,模棱两可、模糊不清,给岀一番没有意乂的解释,最终也没有给岀自己的意见。
在人工智能的发展历史上,神经网络这一“物种”可谓是经历了起起伏伏,不过时至今日,神经网络总算是修得一段“正果”,而在中国近几年的AI发展中,也有那么几个研究总是时不时撩人心弦,今天要介绍的于2017年被南京大学周志华和其博士生冯霁等人提出的深度森林框架gcForest就是其中之一。
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 递归神经网络 在传统神经网络中,模型不会关注上一时刻的处理会有什么信息可以用于下一时刻,每一次都只会关注当前时刻的处理。举个例子来说,我们想对一部影片中每一刻出现的事件进行分类,如果我们知道电影前面的事件信息,那么对当前时刻事件的分类就会非常容易。实际上,传统神经网络没有记忆功能,所以它对每一刻出现的事件进行分类时不会用到影片已经出现的信息,那么有什么方法可以让神经网络能够记住这些信息呢?答案就是Recurrent
或许你第一个想弄明白的问题是人工智能(AI),机器学习(ML),深度学习(DL)三者的区别和联系,下图清晰明了地告诉你。 1. 什么是机器学习 从小学开始,我们便一直和「函数」打交道,比如一条直线
领取专属 10元无门槛券
手把手带您无忧上云