首页
学习
活动
专区
工具
TVP
发布

机器学习AI算法工程

机器学习,深度学习,大数据 ,公众号:datayx
专栏成员
1348
文章
2600438
阅读量
335
订阅数
自然语言处理的基本问题——分词问题
注:本文选自人民邮电出版社出版的《PyTorch自然语言处理入门与实战》一书,略有改动。经出版社授权刊登于此。
机器学习AI算法工程
2022-12-13
1.2K0
自然语言处理的基本问题——分词问题
注:本文选自人民邮电出版社出版的《PyTorch自然语言处理入门与实战》一书,略有改动。经出版社授权刊登于此。
机器学习AI算法工程
2022-12-13
1.2K0
你怎么看CV-Transformer【秋招面经分享】
秋招来了,跳槽季马上到了,大家多看别人的面经提前积攒经验,多了解几个热门&前沿知识点!别在侃侃而谈的时候,因为一个开放性问题卡壳,真的很社死! 最近面试的时候,面试官问了我一个问题: 你怎么看CV中的Transformer的! 当时我就懵了呢!因为前面还在聊技术问题,立马调整气势,说到: 我知道Transformer在NLP方面非常有实力!因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer更是成了屠榜般的存在,在工业界具有广阔的应用前
机器学习AI算法工程
2022-07-21
3680
华为官宣:免费培养5000位Python+深度学习开发者,结营可领取证书
NLP中的算法复杂,应用场景多变,涉及数学、语言学、计算科学多门学科,理解起来很抽象,单靠自学、看课程难以理解晦涩难懂的逻辑。即使你已经看过很多深度学习、人工智能、自然语言处理理论知识,依然难以着手开发项目。 为此,华为云上线了Python+NLP实战营,帮助学习者掌握自然语言处理理论和应用,提升NLP相关编程能力,低门槛入门开发AI项目。重要的是,由华为专家授课教学,全程免费报名学习。 适 合 人 群 01 在校学生 ① 计算机、人工智能专业 ② 0门槛入门NLP领域知识 ③ 希望从事企业AI工程师 0
机器学习AI算法工程
2022-07-18
7430
ViT杀疯了,10+视觉Transformer模型详解
Transformer 作为一种基于注意力的编码器 - 解码器架构,不仅彻底改变了自然语言处理(NLP)领域,还在计算机视觉(CV)领域做出了一些开创性的工作。与卷积神经网络(CNN)相比,视觉 Transformer(ViT)依靠出色的建模能力,在 ImageNet、COCO 和 ADE20k 等多个基准上取得了非常优异的性能。 正如德克萨斯大学奥斯汀分校的计算机科学家 Atlas Wang 说:我们有充分的理由尝试在整个 AI 任务范围内尝试使用 Transformer。 因此,无论是学术界的研究人员,
机器学习AI算法工程
2022-06-24
8860
【建议收藏】NLP全路径学习推荐
我跟几位BAT老哥聊了下NLP全路径学习的事情,总结出以下内容,包含: 学习NLP需要具备哪些基础 NLP全路径各任务学习的项目 01 学习NLP需要具备的基础 01 机器学习 熟悉简单的机器学习模型。例如:逻辑回归、决策树、朴素贝叶斯、隐马尔科夫模型、K-Means、正则化方法等;有部分高级机器学习基础更好。例如:集成学习(随机森林、GBDT、XGB、Stacking等)、条件随机场CRF、贝叶斯网络、支持向量机、主题模型等。 02 深度学习 熟悉简单的神经网络基础。例如:神经元模型、多层感知机、反向传播
机器学习AI算法工程
2022-06-07
4660
高质量中文预训练模型汇总
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型。 NLU系列 BERT RoBERTa ALBERT NEZHA XLNET MacBERT WoBERT ELECTRA ZEN ERNIE RoFormer StructBERT Lattice-BERT Mengzi-BER
机器学习AI算法工程
2022-06-02
2.6K0
GitHub获星3.4K,顶会SOTA算法开源,为什么Prompt在NLP任务中更有效?
近两年,Prompt范式已经成为NLP研究的第四范式,基于Prompt的小样本能力,吸引了学术界和产业界的广泛研究。近日,百度飞桨PaddleNLP开源基于Prompt的信息抽取技术,以及更多产业落地能力: * 通用信息抽取统一建模技术UIE开源! * 文心大模型ERNIE轻量级模型及一系列产业范例实践开源! 01 通用信息抽取 在金融、政务、法律、医疗等众多行业中,大量文档信息需要进行数字化及结构化处理,而人工处理方式往往费时费力,且容易产生错误。信息抽取技术能很好地解决这个问题。信息抽取(Informa
机器学习AI算法工程
2022-05-17
7470
风险事件文本分类(达观杯Rank4)
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 在大数据和人工智能技术加持下,不同行业各种新兴的风险控制手段也正在高速发展。但这些风险信息散落在互联网的海量资讯中,若能从中及时识别出风险事件并挖掘出潜在的风险特征,能够大幅提升识别和揭示风险的能力。而风险事件以文本的形式存在,需要采用自然语言理解模型实现风险事件的高精度智能识别,其本质是属于一个文本分类任务。   NLP(自然语言处理)作为人工智能领域皇冠上的“明珠”,其技术的科研创新一直精进不休。而文本分类在自然
机器学习AI算法工程
2022-03-30
7560
安利几个优质nlp开源项目
1、OpenNRE OpenNRE 是基于 Tensorflow 开发的,一个用于神经网络关系提取的工具包,由清华大学刘知远老师及其团队贡献的开源项目。在该项目中,关系提取会分为嵌入、编码器、选择器和分类器四步。 Github 地址: https://github.com/thunlp/OpenNRE 2、中文序列标注Flat Lattice 原文《FLAT:Chinese NER Using Flat-Lattice Transformer》,解决的是中文命名实体识别的任务。文章提出的方法在多个数据集上达
机器学习AI算法工程
2022-03-24
9060
使用python多线程加载模型并测试
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 之前只用过单线程处理,加载模型进行测试,运行时间上也可以接受。但是现在需要处理比较大量的数据,如果进行线性处理,可能测试一次就花10个小时,而且还不知道结果怎么样,所以多线程就必须使用上了。有关线程部分主要参考:https://junyiseo.com/python/211.html 1 多线程 多线程类似于同时执行多个不同程序,线程在执行过程中与进程还是有区别的。每个独立的进程有一个程序运行的入口、顺序执行序列和程
机器学习AI算法工程
2022-03-04
1.5K0
简单理解LSTM神经网络
📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 递归神经网络 在传统神经网络中,模型不会关注上一时刻的处理会有什么信息可以用于下一时刻,每一次都只会关注当前时刻的处理。举个例子来说,我们想对一部影片中每一刻出现的事件进行分类,如果我们知道电影前面的事件信息,那么对当前时刻事件的分类就会非常容易。实际上,传统神经网络没有记忆功能,所以它对每一刻出现的事件进行分类时不会用到影片已经出现的信息,那么有什么方法可以让神经网络能够记住这些信息呢?答案就是Recurrent
机器学习AI算法工程
2022-03-04
8890
关系抽取调研——工业界
自动识别句子中实体之间具有的某种语义关系。根据参与实体的多少可以分为二元关系抽取(两个实体)和多元关系抽取(三个及以上实体)。
机器学习AI算法工程
2021-11-10
1.6K0
医学自然语言处理相关资源整理
Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:
机器学习AI算法工程
2021-04-02
1.2K0
fastNLP工具包, 快速实现序列标注模型
fastNLP是一款轻量级的自然语言处理(NLP)工具包,目标是快速实现NLP任务以及构建复杂模型。
机器学习AI算法工程
2021-04-01
1.4K0
文档智能理解:通用文档预训练模型与数据集
预训练模型把迁移学习很好地用起来了,让我们感到眼前一亮。这和小孩子读书一样,一开始语文、数学、化学都学,读书、网上游戏等,在脑子里积攒了很多。当他学习计算机时,实际上把他以前学到的所有知识都带进去了。如果他以前没上过中学,没上过小学,突然学计算机就不懂这里有什么道理。这和我们预训练模型一样,预训练模型就意味着把人类的语言知识,先学了一个东西,然后再代入到某个具体任务,就顺手了,就是这么一个简单的道理。
机器学习AI算法工程
2020-12-15
1.7K0
豆瓣电影短评:Scrapy 爬虫+数据清理/分析+构建中文文本情感分析模型
我们会发现电影评价数和电影的投票数是极强相关的,pearsonr系数达到了0.9:
机器学习AI算法工程
2020-11-03
1.5K0
文本分类的14种算法
之前介绍了14种文本分类中的常用算法,包括8种传统算法:k临近、决策树、多层感知器、朴素贝叶斯(包括伯努利贝叶斯、高斯贝叶斯和多项式贝叶斯)、逻辑回归和支持向量机;4种集成学习算法:随机森林、AdaBoost、lightGBM和xgBoost;2种深度学习算法:前馈神经网络和LSTM。 各篇链接如下:
机器学习AI算法工程
2020-08-12
4.7K0
文本纠错与BERT的最新结合,Soft-Masked BERT
1.http://www.doc88.com/p-8038708924257.html
机器学习AI算法工程
2020-07-14
1.6K0
知识问答KB-QA
这些就是一条条知识,而把大量的知识汇聚起来就成为了知识库。我们可以在wiki百科,百度百科等百科全书查阅到大量的知识。然而,这些百科全书的知识组建形式是非结构化的自然语言,这样的组织方式很适合人们阅读但并不适合计算机去处理。为了方便计算机的处理和理解,我们需要更加形式化、简洁化的方式去表示知识,那就是三元组(triple)。
机器学习AI算法工程
2020-05-15
9970
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档