展开

关键词

手把手教你实战汉

由TinyMind发起的 #第一届汉挑战赛# 正在火热进行中,比赛才开始2周,便有数只黑马冲进榜单。目前TOP16全部为90分以上,可谓竞争激烈,高手如林。 为此TinyMind特邀战场中奋勇拼搏的两名前锋,为大家整理了一些经验心得,用不同的解题思路,以启发新手们如何开动,参与到本次比赛中。 以下为参赛ID:真的学不会 的经验分享 汉入门 前段时间参加了一次TinyMind举办的汉挑战赛,说是挑战赛其实就是一场练习赛。 10000张图片的测试集 上面的训练集总共有100个汉,每一个汉都有400张不同体的图片,数据量上来看算是一个比较小的数据集。 以下为参赛ID:Link 的经验分享 深度学习入门指南:从零开始TinyMind汉 环境搭建 数据导入 启动网络 环境搭建: 对入门来说,最容易的还是在windows下进行开发。

3.7K40

AI说:你的有咖喱味丨看

一个跨国研究团队通过机器学习的算,让机器从英文手写的迹中判断写者来自中国、印度、马来西亚、孟加拉国和伊朗中的哪个国家。 Cloud of Line Distribution(COLD)是一个分析笔画的软件,可以分解单个母,测量笔画的垂直度和弯曲度,进而判断写者的国。 ? 五国人写的英文描边特征有巨大的区。 准确率比前人算翻倍 在最后的测试中,这套方的确出了不少各种各样的体: ? 研究者们统计了一下这个方的准确率: ? 上图中,下面的表格是前人研究的方测试结果,可以看出,针对数据集中的每个国家,笔迹准确率都在40%左右,没有过半; 上方的表格则是这次研究者们的测试结果,每个国家的笔迹准确率都在60%以上,平均达到了 或许它可以用在刑侦领域,以迹结合人脸、生物等技术来判断犯罪,但迹的只能作为参考,有误判的可能性。 不过,迹作为个人的数据也可以被用来做营销。

33920
  • 广告
    关闭

    腾讯云+社区系列公开课上线啦!

    Vite学习指南,基于腾讯云Webify部署项目。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Baseline | 2019 DCIC《 文化传承—汉多场景

    赛题名称 文化传承 – 汉多场景 (Cultural Inheritance – Recognizing Chinese Calligraphy in Multiple Scenarios) 在全球化、电子化的今天,的外部环境有了非常微妙的变化,对于年轻一代,古代体越来越难以,一些由这些承载的传统文化无顺利传承。 所以利用先进的技术,实时、准确、自动地出这些,对于记录整理艺术和传播背后的中国文化有着重要的社会价值。 赛题任务 是中华民族文化传承的瑰宝,希望此次大赛能够通过人工智能算实现的自动,解决实际场景中有些难以的问题。要求参赛者给出测试数据集中每张图片中文的位置及对应的内容。 本次大赛会提供已标注的训练图片集供参赛者开发训练生成模型和算,参赛者用开发&训练生成的模型和算测试图片集中每张图片的内容以及文对应的位置并提交竞赛平台,以参赛者提交的结果准确率作为竞赛排名成绩的依据

    93720

    【场景文】场景文

    场景文是在图像背景复杂、分辨率低下、体多样、分布随意等情况下,将图像信息转化为文序列的过程,可认为是一种特的翻译过程:将图像输入翻译为自然语言输出。 场景图像文技术的发展也促进了一些新型应用的产生,如通过自动路牌中的文帮助街景应用获取更加准确的地址信息等。 在场景文任务中,我们介绍如何将基于CNN的图像特征提取和基于RNN的序列翻译技术结合,免除人工定义特征,避免符分割,使用自动学习到的图像特征,完成端到端地无约束符定位和。 本例将演示如何用 PaddlePaddle 完成 场景文 (STR, Scene Text Recognition) 。 任务如下图所示,给定一张场景图片,STR 需要从中出对应的文"keep"。 ? 图 1. 输入数据示例 "keep" |2.

    1.8K70

    上篇的内容最后一个案例代码,其实来自官方的手写数案例教程,我自己基于里面的内容自己删减了一些。 这里主要讲一下里面的数据集,sklearn自带了很多数据集,在安装包的data里面,就有手写数数据集。 虽说是数,不过这个数据集里面并没有实际图片。 ,不过前都会通过测试数据测试一下,先看看准确率怎么样,确定效果还不错,就可以用来测试没有见过的数图片了。 2.从图片文件夹中将所有数图片读取出来 这里只是做了数图片的读取,所以只能。 3.定义一个单张图片匹配的方。 4.最后找到最匹配的图片 实际测试: 以上这个方会比较慢,因为会不断通过IO口打开图片,这个是非常影响速度的,可以像自带的案例一样,将所有数据变成数导入到一个csv文件中,同时打上标签,处理速度应该会更快

    20310

    基于符尺度的文

    这里有一篇基于符尺度的文。这是18年发表的文章。

    31530

    基于深度学习的细颗粒度鸟类准确率超过92%

    创视智能科技(南京)有限公司的算团队研发出了一种基于卷积神经网络的深度学习高精度鸟类,有效的解决了鸟类的问题,算准确率超过92%。 创视智能的算团队着力研究和解决对低质量图像的率不高的难题,通过基于FP32高浮点高精度算、饱和预处理等新技术新算子的使用,提升针对低质量监测图像的准确率;同时优化和完善了基于低样本下的鸟类 ,目前深度学习技术大都是基于大的样本库来完成的,但是部分珍稀鸟类监测图像较少,创视智能形成了一种在少量样本的情况下,实现高精度的自动,对野生动物的广泛应用有着重要意义。   基于多尺度卷积神经网络架构搭建的深度学习算模型可以对微小的野生动物进行精确的,同时基于华为昇腾310算力芯片的联合开发,已经可以部署在他们集群环境和边缘盒式产品中,使得速度高且算力性价比高。 在生态学中,这些方先前已用于物种级的动物以及个体灵长类动物,猪和大象。但是,到目前为止,还没有在鸟类之类的较小动物中进行过探索。

    12910

    0730

    条码信息 那天我的手机没电了,然后我到最近的美宜佳超市去借了一个充电宝,借充电宝之前需要扫一下二维码。 但是我的手机已经关机,于是就买了一瓶水,扫描上面的条形码,然后顺便先充个电。 通过微信小程序可以实现条码信息吗?有客户实现过这个案例吗? 微信小程序的顺序是怎么样的呢?

    19820

    0727

    数学公式和物理公式有什么区吗? 新增了二维码 本接口支持条形码和二维码的(包括 DataMatrix 和 PDF417)。 image.png 这个二维码有什么用呢? 条形码,我就是好奇,为什么便利店里扫码,可以直接那么快,还有各种奇形怪状的想,奇思妙想的想

    22120

    opencv +数

    现在很多场景需要使用的数,比如银行卡,以及车牌等,在AI领域有很多图像,大多是居于opencv 或者谷歌开源的tesseract . 以上几种ocr 比较,最后选择了opencv 的方式进行ocr 数,下面讲解通过ocr的基本流程和算. opencv 数流程及算解析 要通过opencv 进行数离不开训练库的支持 ,需要对目标图片进行大量的训练,才能做到精准的出目标数;下面我会分讲解图片训练的过程及的过程. opencv 原理 1.比如下面一张图片,需要从中出正确的数,需要对图片进行灰度 原图 灰度化图 二值化图 寻找轮廓 后的结果图 以上就是简单的图片进行灰度化、二值化、寻找数轮廓得到的结果(==这是基于我之前训练过的数模型下得到的结果==) 有些图片比较赋值 “.”的图片,这样就可以出小数点的数支持. -2 这个分类主要是其他一些无关紧要的图片,也就是不是数和点的都归为这一类中.

    16820

    k-近邻算实现数

    也就是那时候入手Python的机器学习部分啦,喏就是这本红皮 ? 总体来说这本是不错的,对于算的原理概述的比较准确,就是实战的代码过于简略,入门机器学习的话还是值得一看的 进入正题,由于大一一年都在和黑乎乎的终端打交道,感觉c系语言用久了想换一下,就花几天上手了机器学习的 KNN算,着手做一个有关数的部分,一开始的设想很丰满,打算实现一个手写数的,后来只有一周时间,没空看到那么深的部分,不过后来做出01图像模拟的时候发现其实也差不多,最后的成品和设想还是有点差的 ~ 相关项目都已上传至我的Github,如果喜欢可以给个Star噢 k-近邻算实现数 项目大体思路: k-近邻算实现数(01串构成1024个模拟像素点) 1.先用c++随机生成10*200 mTest = len(testFileList) # 循环测试每个测试数据文件 for i in range(mTest): # 提取文件名中的数

    22030

    SVM算实现光学

    OCR (Optical Character Recognition,光学)是指电子设备(例如扫描仪或数码相机)检查纸上打印的符,通过检测暗、亮的模式确定其形状,然后用将形状翻译成计算机符的过程 ;即,针对印刷体符,采用光学的方式将纸质文档中的文转换成为黑白点阵的图像文件,并通过模型将图像中的文处理成文本格式。 光学是OCR的核心,然而对于许多类型的机器学习算来说,这种图像处理都是一项艰巨的任务。 将像素模式连接到更高概念的关系是极其复杂的,而且很难定义。 )来构建光学模型。 =0.01,0.1,1,10,100C=0.01,0.1,1,10,100时模型正确率的变化。

    22230

    OCR光学汇总

    光学(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的符,通过检测暗、亮的模式确定其形状,然后用将形状翻译成计算机文的过程。 02.基于深度学习的OCR技术 目前,基于深度学习的场景文主要包括两种方,第一种是分为文检测和文两个阶段;第二种则是通过端对端的模型一次性完成文的检测和。 3.2.2 CNN + RNN + attention [6] 本方是基于视觉注意力的文。 首先在文网络中加入语义分割分支,获取每个符的相对位置。 其次,在获取每个符位置后对符进行分类,获得文信息。该方采用分类解决问题,并没有像传统方那样使用RNN。 3.3 端对端文 使用文检测加文两步虽然可以实现场景文,但融合两个步骤的结果时仍需使用大量的手工知,且会增加时间的消耗,而端对端文能够同时完成检测和任务,极大的提高了文的实时性

    9430

    KNN算实现手写数

    下面的是KNN案例的应用:手写数。 我这里的案例是文本格式。没有图片转换的步骤。 素材模型:(源码+素材最后会贴上githup的链接) KNN 手写数 实现思路: 将测试数据转换成只有一列的0-1矩阵形式 将所有(L个)训练数据也都用上方转换成只有一列的0-1矩阵形式 #1934个训练集 ## print(len(test)) #945个测试集 trainingDigits =r'D:\work\日常任务6机器学习\day2手写数 \trainingDigits' testDigits = r'D:\work\日常任务6机器学习\day2手写数\testDigits' 第五步: 编写函数: def shibie(): ## 定义一个手写数的函数 label_list =

    11430

    tf22: ocr——不定长数

    上一篇: 身份证——生成身份证号和汉 代码如下: #! /usr/bin/env python2 # -*- coding: utf-8 -*- """ tf CNN+LSTM+CTC 训练不定长数符图片 @author: liupeng """ from = 10000 num_hidden = 64 num_layers = 1 obj = gen_id_card() num_classes = obj.len + 1 + 1 # 10位数 , OUTPUT_SHAPE[1],OUTPUT_SHAPE[0]]) codes = [] for i in range(batch_size): #生成不定长度的串 /usr/bin/env python2 # -*- coding: utf-8 -*- """ tf CNN+LSTM+CTC 训练不定长数符图片 @author: pengyuanjie

    1.4K100

    智能是如何实现的?智能率高吗?

    我国拥有长达上下五千年的文明历史,文的起源是非常早的,从有限的历史中大家就可以知道我国文经历了非常长时间的历程,各种类型的文被发明出来,有些文还传到今日,虽然现在都是使用的汉但是其他文仍然是我国的文化瑰宝 现在社会中人们写文的机会几乎是很少的,不过平时依然需要接触到各种文,还经常会用到智能这项技术,从图片或者其他地方寻找需要的文,那么智能是如何实现的?智能率高吗? 智能属于人工智能中非常重要的领域之一,和图片的地位差不多,不过相对图片技术来说智能技术要成熟的多,毕竟文的形体以及特征是更加明显的,那么智能是如何实现的? 文的过程中会将文的特征与符库中的文进行对比,从而选择最相似的文呈现出来结果,并输出给用户。 智能率高吗? 智能在平时生活中大家也都接触过,很多人会问智能率高吗?文率和的软件以及应用的技术有很大关系,现在技术最为先进的智能软件率能高达99.8%以上。

    35620

    IDEA 无 Nodejs 包中的关键

    但是现在遇到一个问题,就是 IDEA 忽然无我引入的包了,之前和 core 库还有其他的都可以,最近由于业务需求,我多加了一个ejs的包就不行了。 /module/routes.js'); const url = require('url'); const ejs = require('ejs'); 如图,以上是我引入的包,ejs'中的方完全没有提示 ,也就是没有出来。 现在再次回到项目中输入关键即可发现已经有提示了。 ?

    28410

    Tesseract Ocr文

    Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款引擎之一。 tesseract_cmd = 'tesseract' 修改为: tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' 四、代码 text-img.png" text = pytesseract.image_to_string(Image.open(path), lang='chi_sim') print(text) 作为非常优秀的Ocr库 ,tesseract当然可以训练自己的数据模型,从而达到为我所用目的,后续文会介绍如果训练自己的文库。

    2K90

    MNIST__数__SOFTMAX

    本次MNIST的手写数未采用input_data.py文件,想尝试一下用原始的数据集来运行这个DEMO。 例如:图片上的数和标签的值是5,其对应的ONT-HOT编码为[0,0,0,0,0,1,0,0,0,0](分对应数值【0,1,2,3,4,5,6,7,8,9】) ,也就是长度为10的一维数组的第6个元素为 源码结构: 1.读取MNIST 2.创建占位符(用读取的数据填充这些空占位符) 3.选用交叉熵作为损失函数 4.使用梯度下降(步长0.02),来使损失函数最小 5.初始化变量 6.开始计算 7.输出率 correct_prediction_1, "float")) # 计算训练精度 print(sess.run(accuracy_1, feed_dict={x: xs_t, y_: ys_t})) #输出的准确率 可又说不上来~ 参考资料: ONE-HOT使用体会 : https://blog.csdn.net/lanhaier0591/article/details/78702558 训练Tensorflow手写数

    34110

    Tesseract ocr文

    https://blog.csdn.net/haluoluo211/article/details/77776697 前面很早做了图片的文主要用到了开源框架Tesseract,当然做OCR 之前先要定位图片文。 先上个图: 工作中项目组一般使用java因此代码,下面贴出java代码,最简单的图片: package com.recognition; import java.awt.*; import catch (TesseractException e) { System.err.println(e.getMessage()); } } } 图片文提取

    1.6K20

    相关产品

    • 手势识别

      手势识别

      腾讯云神图·手势识别(GR)是基于腾讯音视频实验室推出的新一代人机交互技术,包括静态手势识别、关键点识别、指尖识别、手势动作识别等多种功能,为开发者和企业提供高性能高可用的手势识别服务...... 

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券