首页
学习
活动
专区
工具
TVP
发布

大数据智能实战

大数据与人工智能方向的论文复现、技术探索、工程实践的点滴记录和积累。
专栏成员
256
文章
410883
阅读量
56
订阅数
AllenNLP系列文章之二:命名实体识别
The named entity recognition model identifies named entities (people, locations, organizations, and miscellaneous) in the input text. This model is the "baseline" model described in Peters, Ammar, Bhagavatula, and Power 2017 . It uses a Gated Recurrent Unit (GRU) character encoder as well as a GRU phrase encoder, and it starts with pretrained GloVe vectors for its token embeddings. It was trained on the CoNLL-2003 NER dataset. It is not state of the art on that task, but it's not terrible either. (This is also the model constructed in our Creating a Model tutorial.)
sparkexpert
2022-05-07
5250
NasNet实践:图像识别领域最佳模型
  谷歌最近推出的NasNet,是当前图像识别领域的最佳模型,近日对此模型进行复现了下,也大致了解了其原理。这个模型并非是人为设计出来的,而是通过谷歌很早之前推出的AutoML自动训练出来的。该项目目的是实现“自动化的机器学习”,即训练机器学习的软件来打造机器学习的软件,自行开发新系统的代码层,它也是一种神经架构搜索技术(Neural Architecture Search technology)。然而尽管AutoML 能够设计出性能可与人类专家设计的神经网络相媲美的小型神经网络,但仍被限制在 CIFAR-10 等小型学术数据集方面。
sparkexpert
2022-05-07
1.5K0
基于CNN的图像滤境操作之去噪声
  图像去噪声是图像增强、图像重建的重要内容之一,在现实中,很多图像难免存在噪声的问题,从而影响了图像的判别。当然图像去噪声在现有的图像处理软件中也比较成熟。
sparkexpert
2022-05-07
7660
ubuntu matlab中安装MatConvNet工具箱(支持GPU,mexcuda报错问题)
MatConvNet  is a MATLAB toolbox implementing  Convolutional Neural Networks  (CNNs) for computer vision applications. It is simple, efficient, and can run and learn state-of-the-art CNNs. Many pre-trained CNNs for image classification, segmentation, face recognition, and text detection are available.
sparkexpert
2022-05-07
5120
基于Bidirectional AttentionFlow的机器阅读理解实践
机器阅读是实现机器认知智能的重要技术之一。机器阅读任务主要有两大类:完形填空和阅读理解。
sparkexpert
2022-05-07
2180
基于mask-rcnn屏幕图像中指定对象
在很多场景条件下,会有意地将图像中的某些对象进行屏蔽删除处理,传统的抠图的办法需要用到专业的处理软件来处理。看到有基于mask-rcnn的方式来实现屏幕中指定对象的删除,挺有趣的。
sparkexpert
2022-05-07
2380
r-net机器阅读理解实践
        斯坦福大学自然语言计算组发起的SQuAD(Stanford Question Answering Dataset)文本理解挑战赛并不陌生,它也被誉为“机器阅读理解界的ImageNet”。诸多来自全球学术界和产业界的研究团队都积极地参与其中,近期在机器阅读理解上已经取得了不小的突破,因此这两天刚好有时间,对里面涉及的一些开源框架进行学习一下。
sparkexpert
2022-05-07
4700
Toward Multimodal Image-to-Image Translation(BicycleGAN)图像一对多转换测试
CycleGAN、pix2pix、iGAN的主要贡献者最近在NIPS 2017上又推出了一篇文章Toward Multimodal Image-to-Image Translation(见https://junyanz.github.io/BicycleGAN/,https://arxiv.org/pdf/1711.11586.pdf),讨论如何从一张图像同时转换为多张风格不一成对的图像。 从作者摘要第一句可以看出:“Many image-to-image translation problems are ambiguous, as a single input image may correspond to multiple possible outputs. In this work, we aim to model a distribution of possible outputs in a conditional generative modeling setting.” 像pix2pix这样的图像转换(一对一)的方式是存在歧义的,因为不可能只对应一个输出。因此作者提出了一种一对多的输出,即将可能输出的图像是存在一定的分布特性的。
sparkexpert
2022-05-07
3400
spark深度学习算法(CNN卷积神经网络)的测试与分析
  卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
sparkexpert
2022-05-07
8980
AI+CV: 谷歌数据增强文章的实践
数据增强是机器学习中常用的Trick,特别是用于样本不足的情况下的一种提升机器学习模型性能的重要手段。看了谷歌开源的数据增强文章,里面已经实现得比较全的,做了简单实验,效果还是不错。
sparkexpert
2019-12-03
5620
AllenNLP系列文章之五:语义角色标注
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sparkexpert/article/details/79868347
sparkexpert
2019-05-27
1.9K0
图像目标检测之cascade-rcnn实践
最近一直在调试目标检测方面的模型,其中mmdetection中就集成了许多的目标检测模型。其中表现比较好的模型中有cascade-rcnn,因此也趁这个机会具体了解一下这个模型的发展脉络。
sparkexpert
2019-05-26
3.3K0
CRNN实现文本的识别测试
自然场景文本提取是图像语义信息抽取的一个重要分支,它的实现需要CV和NLP技术,即既需要使用视觉处理技术来提取图像中文字区域的图像特征向量,又需要借助自然语言处理技术来解码图像特征向量为文字结果。
sparkexpert
2019-05-26
1.9K0
基于Tensorflow.js实现浏览器级别的目标识别应用实践
tensorflow.js 是谷歌于今年推出的浏览器级别的深度学习框架,TensorFlow 团队在其github官网上也公开了表示基于网页的 JavaScript 库 TensorFlow.js 库框架及其相关的例子。基于该应用能训练并部署机器学习模型。
sparkexpert
2019-05-26
9370
CTC模型、安装及其pytorch绑定安装
CTC模型是语音识别模型中常见的模块之一,现有主流的语音识别系统经常采用该模型来实现端到端的语音识别。而CTC出现之前,语音识别模型的端到端识别效果还是相对较弱的,也就是说CTC解决了这一问题。
sparkexpert
2019-05-26
1.1K0
离群点异常检测及可视化分析工具pyod测试
找到了一个对Outlier Detection (Anomaly Detection) 异常值检测(异常检测)的比较好的工具(https://github.com/yzhao062/Pyod),该工具集成了多个算法。
sparkexpert
2019-05-26
1.5K0
基于Dual Path Networks(DPN)的图像识别模型实践
图像识别模型已经非常多了,但是看到对于DPN的下面表述,动起了将它复现一下的念头:
sparkexpert
2019-05-26
1K0
文本生成统一框架Texygen实践
文本生成是自然语言理解的高级阶段,是实现类人智能的重要手段之一。Geek.AI在AAAI2018中推出了LeakGAN后,终于又推出了TexyGen这个开源文本生成框架。由于之前就想对leakgan深入地看一下,不过这回可以通过TexyGen这个框架来实现实现对近几年的所有文本生成模型的直接实现。
sparkexpert
2019-05-26
1K0
textgenrnn 文本生成实战
文本生成是一件很神奇的自然语言处理任务,深度学习给文本生成带来的全新的技术途径,如这篇文章The Unreasonable Effectiveness of Recurrent Neural Networks所讲的,是一种不可思议又高效的方式。textgenrnn就是采用RNN的方式来实现文本生成的一个简洁高效的库,代码量非常少,又非常易于理解。其架构是采用了LSTM+Attention的方式来实现。如下图所示:
sparkexpert
2019-05-26
8350
StarGAN:支持多领域图像生成的生成对抗网络实践
GAN家族在CVPR2018时候迎来一个新强悍的成员,即:StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation 。从这个题目可以看出,它与之前的pix2pix等相比,能够支持一生多。
sparkexpert
2019-05-26
1.2K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档