在MXnet中使用im2rec创建包含png图像的数据集_使用WPF在C#中创建包含文本的图像并将其另存为.png_如何使用xampp创建的mysql中的数据在react中显示图像 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

人脸识别：insightface自定义数据集制作 | 附练手数据集

简单来讲，人脸识别这个问题，就是给定两个人脸，然后判定他们是不是同一个人，这是它最原始的定义。它有很多应用场景，比如银行柜台、海关、手机解锁、酒店入住、网吧认证，会查身份证跟你是不是同一个人。

07

人脸识别：insightface自定义数据集制作 | 附练手数据集

简单来讲，人脸识别这个问题，就是给定两个人脸，然后判定他们是不是同一个人，这是它最原始的定义。它有很多应用场景，比如银行柜台、海关、手机解锁、酒店入住、网吧认证，会查身份证跟你是不是同一个人。

04

您找到你想要的搜索结果了吗？

是的

没有找到

MXnet-arcface数据集准备 - plus studio

众所周知，mxnet是一个沐神主导开发的一个深度学习框架，之前听李沐的讲论文时也听他说过很多次，但是已知没有机会使用，最近接触了一个项目，有机会感受了一些mxnet，但是也踩了很多坑。所有需要的脚本文件可以在https://github.com/StudyingLover/menet-Arcface-tools下载

01

基于MXNET实现的年龄性别识别

年龄性别识别，基于insightface功能模块开发的，支持多张人脸同时检测和识别。

02

业界 | MXNet开放支持Keras，高效实现CNN与RNN的分布式训练

作者：Lai Wei、Kalyanee Chendke、Aaron Markham、Sandeep Krishnamurthy 机器之心编译参与：路、王淑婷今日 AWS 发布博客宣布 Apache MXNet 已经支持 Keras 2，开发者可以使用 Keras-MXNet 深度学习后端进行 CNN 和 RNN 的训练，安装简便，速度提升，同时支持保存 MXNet 模型。感谢 Keras 和 Apache MXNet（孵化）开源项目的贡献者，Keras-MXNet 深度学习后端现已可用。地址：ht

03

解读未知：文本识别算法的突破与实际应用

文本识别是OCR（Optical Character Recognition）的一个子任务，其任务为识别一个固定区域的的文本内容。在OCR的两阶段方法里，它接在文本检测后面，将图像信息转换为文字信息。

02

人脸图像识别实例：使用Keras-MXNet在MXNet模型服务器上部署“笑脸检测器”

AWS最近宣布发布了针对Keras 2的Apache MXNet后端，与使用多GPU的默认后端相比，它可以为你提供高达3倍的速度提升。它可以改进训练和推理性能。在这个版本中，你现在能够将经过训练的Keras（使用MXNet后端）模型导出为本地MXNet模型，而不必依赖于特定的语言绑定。这种新的导出模型功能允许你使用各种工具（这些工具属于MXNet生态系统的一部分）。

02

【DCIC2022】科技金融子赛道验证码识别0.65+ baseline

在传统的文本识别方法中，任务分为3个步骤，即图像预处理、字符分割和字符识别。需要对特定场景进行建模，一旦场景变化就会失效。面对复杂的文字背景和场景变动，基于深度学习的方法具有更优的表现。

02

资源 | 一张速查表实现Apache MXNet深度学习框架五大特征的开发利用

选自AWS blog 机器之心编译参与：Smith Apache MXNet 是一个功能全面，且具有高度可扩展性的深度学习框架，可支持创建和训练最新型的深度学习模型。通过它，你可以创建卷积神经网络，LSTM 网络和其它的模型。它支持多种语言，包括但不限于 Python、Scala、R和 Julia 。本文将对 MXNet 五大特征的实现进行介绍。在本篇文章中，我们对使 MXNet 在 AWS 云中成为开发者友好型框架的一些特征进行了展示。对于更喜欢符号式表现形式的开发者，我们也提供了一张速查表，以在 M

06

教你从零开始检测皮卡丘-CNN目标检测入门教程(上)

本文先为大家介绍目前流行的目标检测算法SSD (Single-Shot MultiBox Object Detection)和实验过程中的数据集。训练、测试过程及结果参见《从零开始码一个皮卡丘检测器-

06

【框架】为降低机器学习开发者门槛，苹果发布了Turi Create框架

近日，苹果在GitHub上发布了Turi Create框架。苹果表示，这个框架旨在通过简化机器学习模型的开发，降低开发者构建模型的门槛。详细说明如下： Turi Create Turi Create简化了自定义机器学习模型的开发。你不需要成为机器学习的专家，即可为你的程序添加推荐，对象检测，图像分类，图像相似度识别或活动分类。易于使用：让你聚焦于任务而不是算法可视化：内置的流式可视化功能可以探索你的数据灵活：支持文本，图像，音频，视频和传感器数据快速和可扩展性：可在单台机器上处理大型数据集易于准备

06

谷歌TPU2代有望取代英伟达GPU？测评结果显示…

去年5月，谷歌推出了第二代TPU芯片，这是一个自定义开发的深度学习加速芯片，不少人认为有望成为英伟达GPU的替代品。

02

PaddleOCR使用指南

这里的PaddleOCR(use_angle_cls=True, lang='ch')中的lang可以是很多种语言，比如`ch`, `en`, `fr`, `german`, `korean`, `japan`。

02

深度学习框架哪家强？MXNet称霸CNN、RNN和情感分析，TensorFlow仅擅长推断特征提取

深度学习框架哪家强：TensorFlow？Caffe？MXNet？Keras？PyTorch？对于这几大框架在运行各项深度任务时的性能差异如何，各位读者不免会有所好奇。微软数据科学家Ilia Karmanov最新测试的结果显示，亚马逊MXNet在CNN、RNN与NLP情感分析任务上性能强劲，而TensorFlow仅擅长于特征提取。测试详情更新在Ilia Karmanov的GitHub项目DeepLearningFrameworks（https://github.com/ilkarman/Deep

03

torch tensor入门

在深度学习中，Tensor是一种重要的数据结构，它可以用来存储和处理多维数组。在PyTorch中，Tensor是一种非常基础且常用的数据类型，它支持很多高效的操作。本篇博客将介绍如何使用torch tensor，让你快速入门。

03

常见公开人脸数据集的获取和制作自定义人脸数据集

开发人脸识别系统，人脸数据集是必须的。所以在我们开发这套人脸识别系统的准备工作就是获取人脸数据集。本章将从公开的数据集到自制人脸数据集介绍，为我们之后开发人脸识别系统做好准备。

01

python与地理空间分析（一）

在气象数据分析中，地理空间要素是一个必须考虑的关键特征项，也是重要的影响因素。例如气温会随着海拔的升高而降低，地形的坡向朝向也会影响风速的分布，此外，典型的地形会形成特定的气候条件，也是数据挖掘中可以利用的区域划分标准。数据分析中，地理空间分析往往能提供有效的信息，辅助进行决策。随着航空遥感行业的发展，积累的卫星数据也成为了数据挖掘的重要数据来源。地理空间分析有好多软件可以支持，包括Arcgis，QGIS等软件平台，本系列文章将会着重分享python在地理空间分析的应用。主要包括地理空间数据的介绍，常用的python包，对矢量数据的处理，对栅格数据的处理，以及常用的算法和示例。地理空间数据包括几十种文件格式和数据库结构，而且还在不断更新和迭代，无法一一列举。本文将讨论一些常用的地理空间数据，对地理空间分析的对象做一个大概的了解。地理空间数据最重要的组成部分：

05

这 25 个开源机器学习项目，一般人我不告诉 Ta

在过去几年中，机器学习开辟了很多新的领域，出现了很多高级应用案例：Facebook的脸部识别、Netflix的电影推荐、PrimaAI的图像风格转移、Siri的语音识别、Google Allo的自然语言处理等等。

02

深度学习算法优化系列十五 | OpenVINO Int8量化前的数据集转换和精度检查工具文档

可以看到在用Calibaration Tool进行Int8量化之前需要先解决如何将我们的原始数据集转为Annotations文件以及我们如何用精度检查工具(Accuracy Checker Tool)去评估我们的量化后模型的表现。其中将原始数据集转换为Annotations文件的时候用命令是比较方便，如果懒得写配置文件的话。而要使用精度检查工具，则必须写配置文件了，具体见本文后面的详细介绍。

01

业界 | 一文概览2017年Facebook AI Research的计算机视觉研究进展

选自skrish13 作者：Krish 机器之心编译参与：路雪、刘晓坤本文概述了 2017年Facebook AI 研究院（FAIR）在计算机视觉上的研究进展，包括基础构建模块创新、CNN、one shot 目标检测模块等，然后介绍实例分割方面的创新，最后介绍用弱半监督方式来扩展实例分割。特征金字塔网络（FPN）首先我们先来介绍著名的特征金字塔网络 [1]（发表在 CVPR 2017 上）。FPN 论文非常棒，要知道，构建一个可在多项任务、子主题和应用领域中使用的基线模型并不简单。FPN 是通用特

05

业界 | 一文概览2017年Facebook AI Research的计算机视觉研究进展

选自skrish13 作者：Krish 参与：路雪、刘晓坤本文概述了 2017年Facebook AI 研究院（FAIR）在计算机视觉上的研究进展，包括基础构建模块创新、CNN、one shot 目标检测模块等，然后介绍实例分割方面的创新，最后介绍用弱半监督方式来扩展实例分割。特征金字塔网络（FPN）首先我们先来介绍著名的特征金字塔网络 [1]（发表在 CVPR 2017 上）。FPN 论文非常棒，要知道，构建一个可在多项任务、子主题和应用领域中使用的基线模型并不简单。FPN 是通用特征提取网络（如

09

Google Colab免费GPU教程

现在，你可以开发深度学习与应用谷歌Colaboratory -on的免费特斯拉K80 GPU -使用Keras，Tensorflow和PyTorch。

05

CML使用Nvidia GPU进行深度学习

在本系列的上一篇博客文章中，我们探索了将GPU用于数据科学工作流的好处，并演示了如何在Cloudera Machine Learning（CML）中设置会话以访问NVIDIA GPU来加速机器学习项目。尽管将GPU用于复杂和大型任务的省时潜力巨大，但设置这些环境和任务（例如整理NVIDIA驱动程序，管理CUDA版本以及为特定项目需求部署自定义引擎）可能既耗时又充满挑战。为了简化这些流程，并使数据科学家更快地在ML用例上工作，我们简化了在CML中本地配置和利用NVIDIA GPU的工作。在接下来的部分中，我们将为您提供三种简单的方法，使数据科学团队可以开始使用GPU来为CML中的深度学习模型提供支持。

02

使用Apache MXNet分类交通标志图像

有许多深度学习的框架，例如TensorFlow、Keras、Torch和Caffe,Apache MXNet由于其在多个GPU上的可伸缩性而受到欢迎。在这篇博文中，我们将解决一个计算机视觉问题:使用卷积神经网络对德国交通标志进行分类。该网络将包含交通标志图像的彩色照片作为输入，并试图识别交通标志的类型。为了完成这个笔记本，我们期望你对神经网络，卷积，激活单位，梯度下降，NumPy,OpenCV有一个非常基本的理解。这些先决条件不是强制性的，但是它会对以后的操作有所帮助。在结束后，你可以: 准备一个训练神

06

MXNet 作者李沐：用深度学习做图像分类，教程+代码

📷 作者：MXNet作者/亚马逊主任科学家李沐【新智元导读】深度学习推动计算机视觉、自然语言处理等诸多领域的快速发展。在AI大热和人才奇缺的今天，掌握深度学习成为进入AI领域研究和应用的必备技能。来自亚马逊主任科学家李沐将以计算机视觉的经典问题——图像分类为例，手把手地教导大家从0到1搭建深度神经网络模型。对于初学者面临的诸多疑问，提供了从环境设置，数据处理，模型训练，效果调优的完整介绍和代码演示，包括使模型快速获得良好效果的常用方法——迁移学习。让大家有一个全景和基础的了解。深度学习

06

教程详解 | 用 PaddleOCR 进行集装箱箱号检测识别

内容一览：基于 PaddleOCR 进行集装箱箱号检测，缩短记录集装箱箱号的时间，提高港口装卸效率。

02

Keras还是TensorFlow？深度学习框架选型实操分享

深度学习发展势头迅猛，但近两年涌现的诸多深度学习框架让初学者无所适从。如 Google 的 TensorFlow、亚马逊的 MXNet、Facebook 支持的 PyTorch、Theano、Caffe、CNTK、Chainer、百度的 PaddlePaddle、DSSTNE、DyNet、BigDL、Neon 等等。

03

超好用的自信学习：1行代码查找标签错误，3行代码学习噪声标签

在大量的数据集中去描述或查找标签错误本身就是挑战性超高的任务，多少英雄豪杰为之头痛不已。

02

Tensorflow2——图像定位

给定一副图片，我们要输出四个数字（x,y,w,h），图像中某一个点的坐标（x,y），以及图像的宽度和高度，有了这四个数字，我们可以很容易的找到物体的边框。

01

超好用的自信学习：1行代码查找标签错误，3行代码学习噪声标签

在大量的数据集中去描述或查找标签错误本身就是挑战性超高的任务，多少英雄豪杰为之头痛不已。

03

MXNet 宣布支持 Keras 2，可更加方便快捷地实现 CNN 及 RNN 分布式训练

AI 研习社按，近期，AWS 表示 MXNet 支持 Keras 2，开发者可以使用 Keras-MXNet 更加方便快捷地实现 CNN 及 RNN 分布式训练。AI 研习社将 AWS 官方博文编译如下。

07

用 Java 训练深度学习模型，原来这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist(https://github.com/keerthanvasist)，为我们讲解 DJL（完全由 Java 构建的深度学习平台）系列的第 4 篇。

01

超好用的自信学习：1行代码查找标签错误，3行代码学习噪声标签

在大量的数据集中去描述或查找标签错误本身就是挑战性超高的任务，多少英雄豪杰为之头痛不已。

01

CycleGAN-Turbo 与 pix2pix-Turbo | 通过对抗性学习实现高效图像转换与生成 !

条件扩散模型[38, 48, 5, 73]使用户能够根据空间条件和文本提示生成图像，实现了对场景布局、用户草图和人体姿态需要精确控制的多种图像合成应用。尽管它们取得了巨大成功，但这些模型面临着两个主要挑战。首先，扩散模型的迭代性质使得推理过程缓慢，限制了如交互式Sketch2Photo等实时应用的可能性。其次，模型训练通常需要整理大规模的成对数据集，对于许多应用来说，这造成了重大的成本负担，而对于其他一些应用来说则是不可行的[77]。

01

绝对不容错过：最完整的检测模型评估指标mAP计算指南(附代码)在这里！

作者: 叶虎编辑: 赵一帆前言本文翻译自Measuring Object Detection models - mAP - What is Mean Average Pr

09

2万元「煤气灶」Titan RTX做深度学习？机器之心为读者们做了个评测

2018 年 12 月，英伟达在加拿大蒙特利尔 NeurIPS 大会上发布最新款产品 Titan RTX，作为 2017 年 Titan V 的「继承者」，Titan RTX 价格更低，显存更大，性能更强，且使用图灵架构，具备强大的光线追踪能力。因此，Titan RTX 的发布对 AI 社区而言，是不是做深度学习的一个不错选择呢？

05

准确率99.9%！如何用深度学习最快找出放倒的那张X光胸片（代码+数据）

大数据文摘作品编译：Zhifu、元元、Molly、钱天培医学图像数据的质量一直是个老大难题。难以清理的数据制约着许多深度学习的应用。而实际上，深度学习本身就是清洗医疗数据的好帮手。今天，我们就来讲一个案例，展示如何用深度学习迅速清洗一个杂乱的医疗图像数据集。案例的主角是胸部X光图像。由于设备制造商的不同，胸部X光的图像有可能是水平的，也可能是垂直翻转的。他们可能会倒置像素值，也可能会旋转。问题在于，当你处理一个庞大的数据集（比如说50到100万张图像）的时候，如何在没有医生查看的情况下发现畸变？

06

资源 | 从VGG到ResNet，你想要的MXNet预训练模型轻松学

选自AWS Blog 作者：Julien Simon 机器之心编译参与：Pedro、路本文介绍了如何利用 Apache MXNet 预训练出的多个模型。每个模型在特定图像上的表现略有不同，训练多个模型旨在找出更适合特定任务的模型。在这篇博文中，你将会了解如何使用 Apache MXNet 预训练出的多个模型。为什么要尝试多个模型呢？为什么不直接选择准确率最高的呢？稍后我们会在文章中看到，尽管这些模型是在相同的数据集上训练的，并且都针对最大准确率进行了优化，但它们在特定图像上的表现略有不同。此外，（不同

04

从FPN到Mask R-CNN，一文告诉你Facebook的计算机视觉有多强

翻译 | 人工智能头条（ID：AI_Thinker）参与 | 林椿眄本文概述了 Facebook AI Research（FAIR）近期在计算机视觉领域的研究进展，内容主要包括基础结构模块的创新、卷积神经网络、one shot 检测模块等，以及一些在实例分割方面的创新方法，并介绍了弱半监督学习方式下实例分割的研究进展。下面将逐一介绍，文中的一些引用可在文末的参考文献中找到。 ▌Feature Pyramid Networks（特征金字塔网络）首先，我们要介绍的是著名的特征金字塔网络[1](这是发表在

03

谷歌出品 | TIGER:生成式检索推荐系统

这篇文章提出了一种新的生成式检索推荐系统的范式TIGER。当前基于大规模检索模型的现代推荐系统，一般由两个阶段的流程实现：训练双编码器模型得到在同一空间中query和候选item的embedding，然后通过ANN搜索来检索出给定query的embedding的最优候选集。相比于当前主流的推荐系统，本文提出了一种新的单阶段范式：一种生成式检索模型。

01

2020年，那些「引爆」了ML社区的热门论文、库和基准

不平凡的 2020 年终于过去了！这一年，由于新冠肺炎疫情的影响，CVPR、ICLR、NeurIPS 等各大学术会议都改为线上举行。但是，机器学习社区的研究者和开发者没有停下脚步，依然贡献了很多重大的研究发现。

02

基于深度学习的自动车牌识别(详细步骤+源码)

本文将重点介绍 ALPR 的端到端实现。它将侧重于两个过程：车牌检测和检测到的车牌的 OCR。（公众号：OpenCV与AI深度学习）

03

GitHub上25个最受欢迎的开源机器学习库

在过去的几年里，机器学习为各行各业开创了新纪元，诞生了许多成功的案例： Facebook 的面部识别，Netflix 的智能电影推荐系统，PrimaAI 的图像风格转换，Siri 的语音识别，Google Allo 的自然语言处理，及其他很多开发中的项目。

01

GitHub上25个最受欢迎的开源机器学习库

在过去的几年里，机器学习为各行各业开创了新纪元，诞生了许多成功的案例： Facebook 的面部识别，Netflix 的智能电影推荐系统，PrimaAI 的图像风格转换，Siri 的语音识别，Google Allo 的自然语言处理，及其他很多开发中的项目。

02

渐进式图像重构网络：像画画一样重构图像

图像重构（IR）对物理与生命科学领域的图像应用软件来说至关重要，其目的在于根据 ground truth 图像抽取出的的各类信息对图像进行重构。

04

基于PaddleOCR的多视角集装箱箱号检测识别

集装箱号是指装运出口货物集装箱的箱号，填写托运单时必填此项。标准箱号构成基本概念：采用ISO6346（1995）标准

01

GitHub上25个最受欢迎的开源机器学习库

在过去的几年里，机器学习为各行各业开创了新纪元，诞生了许多成功的案例： Facebook 的面部识别，Netflix 的智能电影推荐系统，PrimaAI 的图像风格转换，Siri 的语音识别，Google Allo 的自然语言处理，及其他很多开发中的项目。

04

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

这篇文章会从 FAIR 在基本模块上的创新开始，谈到 CNN，再到 one-shot 物体检测。之后会讲实例分割的创新。最后聊聊依靠弱半监督模型来扩展实例分割。 AI 科技评论按：本文为雷锋字幕组编译的技术博客，原标题 Recent FAIR CV Papers - FPN, RetinaNet, Mask and Mask-X RCNN，作者为 Krish。翻译 | 李石羽林立宏整理 | 凡江特征金字塔网络特征金字塔网络 (FPN) [1] 发表在 2017 年的 CVPR 上。如果你

08

10个预训练模型开始你的深度学习（计算机视觉部分）

对于希望学习算法或尝试现有框架的人来说，预训练的模型是一个很好的帮助。由于时间限制或计算资源的限制，不可能总是从头构建模型，这就是为什么存在预训练模型！

02

ICCV2021 | 从SDRTV到HDRTV的新征程

本文是对国际计算机视觉会议ICCV 2021的论文“A New Journey from SDRTV to HDRTV”的解读。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭