展开

关键词

tf28: 手写

本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写数据集,然后训练一个简单的Deep Convolutional Network手写手写要把手写洋文难上很多。 首先,英文符的分类少,总共10+26*2;而中文总共50,000多,常用的就有3000多。其次,有书法,每个人书写风格多样。 , 之后还要解压alz压缩文件$ wget http:www.nlpr.ia.ac.cndatabasesdownloadfeature_dataHWDB1.1tst_gnt.zip 这个数据集由模式国家重点实验室共享 ,它还共享了其它几个数据库,先mark: 行为分析数据库 三维人脸数据库 中文语言资源库 步态数据库 掌纹数据库 虹膜库数据 手写的样子:import osimport numpy as npimport structimport PIL.Image train_data_dir = HWDB1.1trn_gnttest_data_dir = HWDB1.1tst_gnt # 读取图像和对应的def

3.2K90

OCR的测试

最近一直在做信息提取,其中碰到图片中文提取的模块,这里面还真的水也很深。当然文的定位提取是关键一步,但是更重要的还是后面直接输出文模块。

526100
  • 广告
    关闭

    11.11智惠云集

    2核4G云服务器首年70元,还有多款热门云产品满足您的上云需求

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    TensorFlow实例: 手写

    MNIST手写数数据集通常做为深度学习的练习数据集,这个数据集恐怕早已经被大家玩坏了。手写要把英文、数难上很多。 首先,英文符的分类少,总共10+26*2;而中文总共50,000多,常用的就有3000多。其次,有书法,每个人书写风格多样。 从一个基本的任务学习如果在TensorFlow下做高效地图像读取,基本的图像处理,整个项目很简单,但其中有一些trick,在实际项目当中有很大的好处, 比如绝对不要一次读入所有的 的数据到内存(尽管在Mnist这类级的例子上经常出现 )…最开始看到是这篇blog里面的TensorFlow练习22: 手写, http:link.zhihu.com?

    2.1K50

    python方面问题

    usrbinpython # -*- coding: utf-8 -*- 这2句添加到python文件的头部,就不会报方面的问题。

    23010

    获“CAIS紫金奖”,腾讯民翻译践行“科技向善”

    “实时语音+标点断句+翻译+语音合成”的首创。 另外,还融入少数民族语言方向和语种全自动化地OCR拍照翻译技术,支持热词,自定义语法,民族方言自适应等功能。 不仅可以实时日常对话,也可以大部分边疆地区的人名、地名、机构名。切合学习、工作、生活等具体场景,全方位促进民交流。 族人学维语最大的维语吧对产品的报道与应用腾讯云AI语音为民翻译提供更多的出口腾讯云AI语音作为将腾讯内部沉底的语音技术赋能产业互联网的出口,整合腾讯内部的语音优势技术,如腾讯民翻译,提供诸如语音 语音提供语音转文的功能,语音合成提供文转语音功能,机器翻译提供自动翻译功能。后续,腾讯民翻译团队将继续打磨产品并与腾讯云AI语音进行更深度的合作。

    41530

    手把手教你实战书法

    由TinyMind发起的 #第一届书法挑战赛# 正在火热进行中,比赛才开始2周,便有数只黑马冲进榜单。目前TOP16全部为90分以上,可谓竞争激烈,高手如林。 以下为参赛ID:真的学不会 的经验分享书法入门前段时间参加了一次TinyMind举办的书法挑战赛,说是挑战赛其实就是一场练习赛。 先来看数据集~~100个的训练集10000张书法图片的测试集上面的训练集总共有100个,每一个都有400张不同体的图片,数据量上来看算是一个比较小的数据集。 github地址:https:github.comFlyEglechinese_font_recognition好多小伙伴是从开发或者是其他工程上转到AI的,所以下面我给有需要的同学列举出一些必要的基础知点 以下为参赛ID:Link 的经验分享 深度学习入门指南:从零开始TinyMind书法环境搭建数据导入启动网络 环境搭建:对入门来说,最容易的还是在windows下进行开发。

    3.4K40

    技术 | 苹果最新博文剑指手写!专家回应:并没有技术含量

    但是如果想在这些移动设备上实现手写,就必须解决一些特有的问题,因为需要有巨大的符号数据库。 引言手写可以增强移动服务的用户体验,尤其是输入的用户体验,因为输入法相对而言较为复杂。而且手写又独具挑战,因为潜在数据库十分庞大。 AI科技大本营在第一时间联系到离线领域的专家,请他们对苹果刚刚发布的论文略作评析,同时也对手写领域作简要分析。 以下为AI科技大本营根据其观点,以其第一人称总结梳理如下:文章主要讨论了两件事: 一是把目前的类数扩大之后,如何控制模型的大小和计算量;二是再扩大之后,会遇到更多的混淆的问题。 就在线来看,华南理工大学金连文教授算得上最为领先,他与搜狗合作推出的在线手写准确率非常高,这一点应该走在苹果前面。除了在线手写外,还有一种是离线手写

    83040

    腾讯多项AI黑科技亮相SIGGRAPH Asia 2018

    、防遮挡的视频智能弹幕、基于智能物联的微派机器人、自然场景的自动等多项行业顶尖AI体验。 自然场景的自动 清华大学-腾讯联合实验室 在自然场景照片上,文会出现遮挡、透视变换、阴影、体不一致等复杂情况,在此情况下要比在扫描文档上困难得多。 清华-腾讯联合实验室可视媒体智能处理团队利用符级标注的特点,将物体检测和的神经网络(包括AlexNet、OverFeat、GoogleInception、ResNet和YOLOv2等模型)应用到街景检测和中 ,从而实现室外街景的高准确度检测和。 为了给神经网络训练提供大量数据集,清华-腾讯联合实验室在腾讯街景照片中挑选了32285张照片,并标注了超过100万个及其属性信息,共创了迄今为止最大的真实场景数据集。 ?

    61920

    Azure认知服务之使用墨迹功能手写

    墨迹墨迹器认知服务提供基于云的 REST API 用于分析和墨迹内容。 与使用光学 (OCR) 的服务不同,该 API 需要使用数墨迹笔划数据作为输入。 数墨迹笔划是 2D 点(X,Y 坐标,表示数手写笔或手指的动作)的时序集。 然后,墨迹器会输入中的形状和手写内容,并返回包含所有已实体的 JSON 响应。 ? 其实很简单,就是把墨迹数据转换成json后给服务器发生一个put请求,成功后就会返回一个json符串的结果。 在canvas上随便写上几个点击按钮。虽然丑了点,但是结果还是完美的。 ?总结使用Azure墨迹可以轻松的手写输入设备的笔迹。 有了这个API我们可以实现很多创意,比如稍微改进下上面的代码就可以实现手写文的连续功能,一边写一边不断的,封装进平板就是一款可以实时手写板啦。

    23620

    用 keras 建立超简单的模型

    之前看过很多 mnist 的模型,都是的,为啥不做一个模型呢?因为手写的库找不到啊。当时我还想自己从库生成用作(已经做出来了,导出体图片再之)。 压缩文件 $ wget http:www.nlpr.ia.ac.cndatabasesdownloadfeature_dataHWDB1.1tst_gnt.zip 正好用新学的 keras 来尝试建模 其中 3500.txt 是常用的 3500 个,这个我用来跟另外一个根据体生成的脚本配合使用。

    4K10

    身份证——生成身份证号和

    还是直接代码吧(genIDCard.py),代码中有注释很容易读懂,原理跟验证码一样(tf20: CNN—符验证码),都属于定长符串,接下来也会介绍不定长数体(fonts):here。#! usrbinenv python2# -*- coding: utf-8 -*-身份证文+数生成类@author: liupengimport numpy as npimport freetypeimport pos = (0, 0) text_size = 21 image = self.ft.draw_text(img, pos, text, text_size, color_) #仅返回单通道值,颜色对于没有什么意义 gen_id_card() image_data,label,vec = genObj.gen_image() cv2.imshow(image, image_data) cv2.waitKey(0) # 生成

    1.8K90

    灵云平台上线藏、彝、蒙、朝鲜语音SDK

    继推出维吾尔语、粤语,近期,捷通华声联合中国民族语文翻译局,推出藏、彝、蒙、朝鲜语语音技术,为藏族、彝族、蒙古族、朝鲜族同胞的日常办公、沟通交流提供语音服务。 通过应用灵云藏、彝、蒙、朝鲜语语音技术,少数民族企事业单位可以应用语音技术,日常工作会议发言,快速生成会议记录;地区公安、检察、法院等政法机构可以应用语音来转写办案过程中的讯问发言,快速生成办案笔录 不会书写民族语言的同胞,可以用说话的方式进行文录入;不会说语的少数民族同胞,可以用语音互译软件(先将语音成文,再翻译为,最后用语音合成播报出来),与族民众进行语音沟通,极大地便捷了民族间的文化 目前,捷通华声已在灵云平台-AIcloud.com上推出一系列民族语言AI技术: 语音方面,全面支持普通话、藏语、彝语、蒙古语、朝鲜语、哈萨克语、粤语、中国台湾话、维吾尔语等民族语言;  机器翻译方面 ,推出行业顶尖的中英、维翻译技术;  语音合成方面,支持普通话、粤语、维吾尔语语音合成;  OCR方面,支持中文、藏文、维吾尔文等民族文的印刷体;  手写方面,支持中文、维吾尔文、藏文、彝文

    1.8K40

    CNN-RNN-CTC 实现手写

    手写脱机的困难 手写脱机跟印刷系统同属光符阅读器OCR的范畴。它们的对象都是二维的方块,工作原理相同,系统构成也基本相似,但手写脱机问题更多,困难更大。 手写脱机为什么那么困难呢?我们认为:最根本的原因是手写形变化太大!我国有一句俗语:“人心不同,各如其面”。这句话对手写形也完全适用。 我们知道,脱机的对象是方块的图形,用于的特征是根据图形提取的,因而形变化对结果具有决定性的影响。手写的一些特点: ①基本笔画变化。 笔画长短、部首大小及位置等的变化,使我们难以仿照印刷体的办法事先确定它们的位置,按规定区域提取笔画或部首特征。 草书的甚至文化较高的人有时也不认,要求计算机能自动这样的手写显然是不可能,也是不合理的。 因此,对用于计算机自动的手写应有所要求。

    1.9K21

    职播间 | 星图智控:一家消费级无人机公司的 AI 相机人才观

    如今,相机在无人机产品中所占比重日益增加,无人机的自主飞行和执行任务的智能化需求突出,特是在资源受限的小型消费级无人机领域,三维重构、目标检测和长时跟踪三类算法都有广泛应用。 2016 年星图武公司成立的时候,也是接触到无人机这款产品,我觉得 AI(当然,当年没有 AI,华中科技大学有一门学科叫图像处理模式,毕业那会也没有工程师这一说法)这项技术要真正落地应用,被消费者接受 「武星巡 1 周年」这张照片上面的「武星巡」,就是武研发中心的另一个名。这组照片由几张照片组成,基本上涵盖了我们最重要的几次团建,照片也是用无人机拍的。 与武工程大学成立感知智能联合实验室其中 1 位教授「张彦铎」,2 位副教授「卢涛,鲁统伟」,集中研究基于嵌入式平台的人脸算法。 应用层技能:到这个阶段,我们可以看到中间有一块内容:手势、人脸、神经网络芯片。我们公就很关注你是否做过手势、人脸,对嵌入式的技能是否熟悉。

    24330

    深度学习与应用:百度AI平台使用浅谈

    一:注册使用1:如何使用百度AI首先打开http:ai.baidu.com,注册账户就可以注册之后,在控制台创建应用即可注册完成之后,进入管理应用界面:记录好你的APPID API KEY和Secret Key,到现在,我们就可以根据文档进行搭建了二:搭建使用环境在这里我最初的构想是通过图片然后进行翻译再去进行句法的情感分析(中英文)图片也是用的百度AI平台的OCR,操作与上述类似,而翻译因为我们只是做一个 1:图片OCR部分:主要的调用大家可以参考文档,这里我们就简单用正则化匹配了一下OCR的结果,因为OCR后是Unicode编码,因此我们需要将其编码转换为,就进行了一点简单的工作:代码如下 情感分析部分这一部分只是百度NLP开放的一部分,比如分词,DNN语句分析,调用都比较容易,对于一句话的情感分析,改天写一篇文章细说,这方面我认为百度这个api做的还是不够好,准确程度有一些问题,并且英语语的感情分析会差多 ,有些话语就是正向的,翻译成英语大概率就是消极的,并且可信度也比较低。

    34740

    专访 | 德国大神Hans Uszkoreit:语言才是AI的关键,深度学习无法解决NLP的核心问题

    其中的例外,是制造业领域的AI,它是欧洲、特是德国的强项。而今中国在AI领域的下游应用研究与上游资金投入上同美国的大力竞争,则相当耐人寻味。 语言技术是AI的核心CSDN:您是语言技术顶级专家。就语言技术来说,它在AI中的角色是怎样的?前景如何?对于自然语言处理,它是否也存在一个突破性的时刻,正如深度学习之于图像、语音那样? 所以说,语言技术是AI的核心部分,并将在很大程度上同知技术相结合。CSDN:您怎么看当前的消费级语言技术?特是当下大热的智能语音助手,比如亚马逊的Echo、苹果的HomePod等? 这对NLP来说更为棘手:语词汇甚至都没有起始标。除了语言本身所固有的复杂性,语更难于用电脑处理的原因还有另外一个:NLP一直是被以英格兰为中心的研究所主导。 但如果NLP未来的研究方法和算法在处理语和其他东亚语言时的效果能超过英语,我也不会特意外。这有一个先决条件,即找到语义理解上的改进办法,毕竟句法在语中的重要性要远小于西方语言。

    57970

    CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit:深度学习还不足以解决 NLP 核心问题

    其中的例外,是制造业领域的 AI,它是欧洲、特是德国的强项。而今中国在 AI 领域的下游应用研究与上游资金投入上同美国的大力竞争,则相当耐人寻味。 语言技术是 AI 的核心CSDN:您是语言技术顶级专家。就语言技术来说,它在 AI 中的角色是怎样的?前景如何?对于自然语言处理,它是否也存在一个突破性的时刻,正如深度学习之于图像、语音那样? 所以说,语言技术是 AI 的核心部分,并将在很大程度上同知技术相结合。CSDN:您怎么看当前的消费级语言技术?特是当下大热的智能语音助手,比如亚马逊的 Echo、苹果的 HomePod 等? 这对 NLP 来说更为棘手:语词汇甚至都没有起始标。除了语言本身所固有的复杂性,语更难于用电脑处理的原因还有另外一个:NLP 一直是被以英格兰为中心的研究所主导。 但如果 NLP 未来的研究方法和算法在处理语和其他东亚语言时的效果能超过英语,我也不会特意外。这有一个先决条件,即找到语义理解上的改进办法,毕竟句法在语中的重要性要远小于西方语言。

    19420

    前有达摩院,后有罗堂,马云是真创新还是圆武林梦?

    不过,相比较去年高调宣布的达摩院,罗堂的成立显然低调很多,但依然引发不少争议,有不少人认为罗堂是噱头大于实际,就像达摩院一样,从名看就不是一个正经的研究机构。 · 收获的6月6月初,阿里巴巴达摩院机器智能实验室语音团队推出了新一代语音模型——DFSMN,宣称将全球语音准确率纪录提升至96.04%(基于世界最大的免费语音数据库LibriSpeech 据了解,对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、准确率更高。 比如采用全新DFSMN模型的智能音响或智能家居设备,就比前代技术深度学习训练速度提到了3倍,语音速度提高了2倍。目前,该语音模型已经应用在上海地铁的自动售票机上。 确实,擅长营销宣传的阿里很会蹭热点,比如在4月的时间节点对外公布Ali-NPU,强调芯片的性价比,但是对细节和具体发布日期只不提。再比如在罗堂成立前夕,密集地对外公布达摩院的科研成绩。

    27570

    江大桥上的监控 AI,挽救自杀者的生命

    关键词:机器视觉 人文AI 位于韩国的国立首尔科学技术大学,在 2020 年 4 月以来,与首尔的紧急服务部门合作,通过根据布控在江大桥上的监控,来分析和预测行人是否有自杀行为。 AI有自杀倾向的可疑行为,并及时标记和预警AI 目前可以根据摄像头标记有自杀倾向的行人,并通过他们的运动行为来区分他们是否真的有自杀倾向,从而减少误报。 江见证崛起,也送生命贯穿首尔的江,在朝鲜战争后,创造了韩国经济崛起的「江奇迹」。 这条江记录了韩国战后从一片废墟,在资本与资源都极度匮乏的情况下,实现经济迅猛发展,跻身亚洲前列的惊人成果。 还能通过文里的情绪分析对潜在自杀人群进行评估,对救援部门进行预警。 全球的研究机构都尝试用 AI 干预自杀人群 还有类似江救援部门采用的行为预测 AI,装载在高危地段,实时对往来的行人行为动作,进行评估和预警,让救援部门能够快速到达现场进行救援和干预。

    8420

    全国首个无人警局在武推出,腾讯AI加持,全年7*24小时刷脸办证

    无人警局在今日“武交警政务服务迈入 AI 时代”的发布会上,腾讯与武市公安局交通管理局宣称,将携手打造全国第一个无人警局,不久将来就能投入使用。 当然,AI带来的好处还不止于此。腾讯此次为武交警提供的刷脸技术,也意味着刷脸即办证。 腾讯AI加持此次推动武走在AI政务应用最前沿的,是腾讯AI的加持。除了腾讯优图实验室提供刷脸、活体检测和图像方面的“看得见”的技术。 无人警局之外,腾讯还通过集合腾讯云、大数据、卯系统、智能舆情、小微机器人等前沿技术,为武交警智慧服务平台还推出智能推荐、智能管家、智能客服等智能化服务。 腾讯AI+公共领域此次与武在交通方面的合作,是腾讯AI首个在交通政务领域应用的案例。不过,利用AI技术,在公共事务领域发挥影响力,对腾讯来说并非首次。

    590110

    相关产品

    • 内容识别

      内容识别

      内容识别(CR)是由腾讯云数据万象提供的内容识别和理解能力。其集成腾讯云 AI 的多种强大功能,对腾讯云对象存储的数据提供图片标签、人脸智能裁剪、语音识别、人脸特效等增值服务,广泛应用于电商网站、社交软件等多种场景,方便用户对图片进行内容管理。

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭

      扫码关注云+社区

      领取腾讯云代金券