首页
学习
活动
专区
工具
TVP
发布

大数据智能实战

大数据与人工智能方向的论文复现、技术探索、工程实践的点滴记录和积累。
专栏作者
256
文章
390257
阅读量
56
订阅数
AllenNLP系列文章之二:命名实体识别
The named entity recognition model identifies named entities (people, locations, organizations, and miscellaneous) in the input text. This model is the "baseline" model described in Peters, Ammar, Bhagavatula, and Power 2017 . It uses a Gated Recurrent Unit (GRU) character encoder as well as a GRU phrase encoder, and it starts with pretrained GloVe vectors for its token embeddings. It was trained on the CoNLL-2003 NER dataset. It is not state of the art on that task, but it's not terrible either. (This is also the model constructed in our Creating a Model tutorial.)
sparkexpert
2022-05-07
4930
NasNet实践:图像识别领域最佳模型
  谷歌最近推出的NasNet,是当前图像识别领域的最佳模型,近日对此模型进行复现了下,也大致了解了其原理。这个模型并非是人为设计出来的,而是通过谷歌很早之前推出的AutoML自动训练出来的。该项目目的是实现“自动化的机器学习”,即训练机器学习的软件来打造机器学习的软件,自行开发新系统的代码层,它也是一种神经架构搜索技术(Neural Architecture Search technology)。然而尽管AutoML 能够设计出性能可与人类专家设计的神经网络相媲美的小型神经网络,但仍被限制在 CIFAR-10 等小型学术数据集方面。
sparkexpert
2022-05-07
1.4K0
基于CNN的图像滤境操作之去噪声
  图像去噪声是图像增强、图像重建的重要内容之一,在现实中,很多图像难免存在噪声的问题,从而影响了图像的判别。当然图像去噪声在现有的图像处理软件中也比较成熟。
sparkexpert
2022-05-07
6730
ubuntu matlab中安装MatConvNet工具箱(支持GPU,mexcuda报错问题)
MatConvNet  is a MATLAB toolbox implementing  Convolutional Neural Networks  (CNNs) for computer vision applications. It is simple, efficient, and can run and learn state-of-the-art CNNs. Many pre-trained CNNs for image classification, segmentation, face recognition, and text detection are available.
sparkexpert
2022-05-07
4900
基于Bidirectional AttentionFlow的机器阅读理解实践
机器阅读是实现机器认知智能的重要技术之一。机器阅读任务主要有两大类:完形填空和阅读理解。
sparkexpert
2022-05-07
1900
基于mask-rcnn屏幕图像中指定对象
在很多场景条件下,会有意地将图像中的某些对象进行屏蔽删除处理,传统的抠图的办法需要用到专业的处理软件来处理。看到有基于mask-rcnn的方式来实现屏幕中指定对象的删除,挺有趣的。
sparkexpert
2022-05-07
2240
r-net机器阅读理解实践
        斯坦福大学自然语言计算组发起的SQuAD(Stanford Question Answering Dataset)文本理解挑战赛并不陌生,它也被誉为“机器阅读理解界的ImageNet”。诸多来自全球学术界和产业界的研究团队都积极地参与其中,近期在机器阅读理解上已经取得了不小的突破,因此这两天刚好有时间,对里面涉及的一些开源框架进行学习一下。
sparkexpert
2022-05-07
4380
Toward Multimodal Image-to-Image Translation(BicycleGAN)图像一对多转换测试
CycleGAN、pix2pix、iGAN的主要贡献者最近在NIPS 2017上又推出了一篇文章Toward Multimodal Image-to-Image Translation(见https://junyanz.github.io/BicycleGAN/,https://arxiv.org/pdf/1711.11586.pdf),讨论如何从一张图像同时转换为多张风格不一成对的图像。 从作者摘要第一句可以看出:“Many image-to-image translation problems are ambiguous, as a single input image may correspond to multiple possible outputs. In this work, we aim to model a distribution of possible outputs in a conditional generative modeling setting.” 像pix2pix这样的图像转换(一对一)的方式是存在歧义的,因为不可能只对应一个输出。因此作者提出了一种一对多的输出,即将可能输出的图像是存在一定的分布特性的。
sparkexpert
2022-05-07
3130
Mask R-CNN(目标检测,语义分割)测试
Kaiming He的大作Mask R-CNN( https://arxiv.org/pdf/1703.06870.pdf)已经放出来一段时间了,最近才有空进行代码学习和编译。 
sparkexpert
2022-05-07
3430
spark mlib中机器学习算法的测试(SVM,KMeans, PIC, ALS等)
在学习spark mlib机器学习方面,为了进行算法的学习,所以对原有的算法进行了试验。从其官网(http://spark.apache.org/docs/latest/mllib-guide.html)上进行了相关文档的介绍学习,并通过其给定的例子包中相关进行测试。
sparkexpert
2022-05-07
4320
AI+CV: 谷歌数据增强文章的实践
数据增强是机器学习中常用的Trick,特别是用于样本不足的情况下的一种提升机器学习模型性能的重要手段。看了谷歌开源的数据增强文章,里面已经实现得比较全的,做了简单实验,效果还是不错。
sparkexpert
2019-12-03
5340
AllenNLP系列文章之五:语义角色标注
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sparkexpert/article/details/79868347
sparkexpert
2019-05-27
1.8K0
图像目标检测之cascade-rcnn实践
最近一直在调试目标检测方面的模型,其中mmdetection中就集成了许多的目标检测模型。其中表现比较好的模型中有cascade-rcnn,因此也趁这个机会具体了解一下这个模型的发展脉络。
sparkexpert
2019-05-26
3.2K0
CRNN实现文本的识别测试
自然场景文本提取是图像语义信息抽取的一个重要分支,它的实现需要CV和NLP技术,即既需要使用视觉处理技术来提取图像中文字区域的图像特征向量,又需要借助自然语言处理技术来解码图像特征向量为文字结果。
sparkexpert
2019-05-26
1.9K0
pytorch版本的OpenNMT多任务编译实践
OpenNMT 是哈佛大学 NLP 研究小组开源的产品级翻译工具,在其官网上有多种语言代码,有基于 Torch/Pytorch,也有基于tensorflow的。该框架一经发布便被谷歌采用,是迄今为止最能代表神经机器翻译前沿技术的开源工具之一。
sparkexpert
2019-05-26
1K0
DeepSpeech源码编译及语音识别效果复现
DeepSpeech是国内百度推出的语音识别框架,目前已经出来第三版了。不过目前网上公开的代码都还是属于第二版的。
sparkexpert
2019-05-26
2.5K0
基于Tensorflow.js实现浏览器级别的目标识别应用实践
tensorflow.js 是谷歌于今年推出的浏览器级别的深度学习框架,TensorFlow 团队在其github官网上也公开了表示基于网页的 JavaScript 库 TensorFlow.js 库框架及其相关的例子。基于该应用能训练并部署机器学习模型。
sparkexpert
2019-05-26
9100
CTC模型、安装及其pytorch绑定安装
CTC模型是语音识别模型中常见的模块之一,现有主流的语音识别系统经常采用该模型来实现端到端的语音识别。而CTC出现之前,语音识别模型的端到端识别效果还是相对较弱的,也就是说CTC解决了这一问题。
sparkexpert
2019-05-26
1K0
离群点异常检测及可视化分析工具pyod测试
找到了一个对Outlier Detection (Anomaly Detection) 异常值检测(异常检测)的比较好的工具(https://github.com/yzhao062/Pyod),该工具集成了多个算法。
sparkexpert
2019-05-26
1.4K0
基于Dual Path Networks(DPN)的图像识别模型实践
图像识别模型已经非常多了,但是看到对于DPN的下面表述,动起了将它复现一下的念头:
sparkexpert
2019-05-26
9700
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档