首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8964
文章
6350874
阅读量
278
订阅数
EAST、PixelLink、TextBoxes++、DBNet、CRNN…你都掌握了吗?一文总结OCR必备经典模型(二)
本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
机器之心
2023-08-08
6340
这家从东南亚突围的AI初创独角兽,做对了什么?
《2022 上半年度人工智能行业报告》显示,去年全球人工智能市场收支规模达 850 亿美元,中国 AI 产业规模占全球 9.6%,仅次于美国和欧盟,排名第三。IDC 预测,2022 年全球市场规模将同比增长约 20% 至 1017 亿美元。
机器之心
2022-12-15
3590
用AI让经典重新跳动,这个平台开放了3000万古籍字符
1919 年 12 月,胡适在《新青年》杂志发表《新思潮的意义》一文,提出建设新文化的理论原则:「研究问题、输入学理、整理国故、再造文明。」由此在学术界引起了一场规模较大的「整理国故运动」。
机器之心
2022-12-15
7360
360数科夺得OCR国际技术竞赛冠军,商超小票文本行识别如何做到最佳?
机器之心报道 机器之心编辑部 在 OCR 识别领域最权威的会议之一 ICDAR(国际文档分析与识别会议)上,360 数科在 ICDAR2019- SROIE 榜单上斩获第一。 📷 榜单地址:https
机器之心
2022-06-24
6150
CVPR 2022 | 关注文本阅读顺序,蚂蚁集团、上海交通大学提出多模态文档理解模型XYLayoutLM
机器之心专栏 作者:蚂蚁集团-大安全-机器智能 来自蚂蚁集团 - 大安全 - 机器智能和上海交通大学的研究者提出了一种多模态文档理解新模型 XYLayoutLM。 近年来,多模态文档理解在各类场景得到了广泛的应用。它要求我们结合图像,文本和布局信息对扫描件或者 pdf 文件进行理解。在常见的表单理解的任务中,多模态数据如图 1 所示。 图 1:多模态文档理解数据示例(来自 XFUN 数据集) 除此之外,多模态的模型还被应用于文档自动处理,文本关系提取和网页分类定性等等一系列应用。然而,需要强调的是,这个问
机器之心
2022-05-25
7150
王炸:这个GitHub 20000+ Star的OCR项目迎来四大重磅升级
机器之心发布 机器之心编辑部 PaddleOCR 可称得上 OCR 方向目前最火的 repo。 OCR 方向的工程师,之前一定听说过 PaddleOCR 这个项目,累计 Star 数量已超过 20000+,频频登上 GitHub Trending 和 Paperswithcode 日榜月榜第一,在 Medium 与 Papers with Code 联合评选的《Top Trending Libraries of 2021》,从百万量级项目中脱颖而出,荣登 Top10!在《2021 中国开源年度报告》中被评
机器之心
2022-05-10
4420
集齐五位CTO,来也科技如何回应智能自动化的召唤?
机器之心原创 作者:微胖 未来几年,RPA 市场依然会保持这样的高增速,这也意味着 RPA 产品需要快速迭代、持续进化,才能满足不断变化的市场需求。在几乎所有 RPA 厂商意识到要用 AI 来进一步开拓市场时,来也科技又一次领航智能自动化新征程。 搜索 RPA 厂商,几乎没有一家不在「+AI」。不过,来也科技是一个独特存在。4月19日,公司宣布完成 C++ 轮 7000 万美元融资,C 轮累计融资金额超 1.6 亿美元。 很少有创业公司像它一样集结了五位背景各异的前 CTO。他们当中既有 「RPA 之父」也
机器之心
2022-04-21
4300
告别「复制+粘贴」,基于深度学习的OCR,实现PDF转文本
传统的讲座通常伴随着一组 pdf 幻灯片。一般来说,想要对此类讲座做笔记,需要从 pdf 复制、粘贴很多内容。
机器之心
2021-06-08
1.7K0
Mac用户的福音:OCR新神器,一键转换屏幕上的任意文本
在机器学习和计算机视觉领域,光学字符识别(optical character recognition, OCR)长期以来都是人们研究的重要主题之一。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本。
机器之心
2021-06-08
1.3K0
支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别
OCR(光学字符识别)是是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。目前,这项技术在拍照搜题、拍照翻译等应用中得到广泛使用。
机器之心
2020-07-09
2.2K0
如何构建识别图像中字符的自动程序?一文解读OCR与HTR
光学字符识别和手写文本识别是人工智能领域里非常经典的问题。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本;而 HTR 就是对手写文本进行同样的操作。作者在文章中将这个问题分解成了一组更小型的问题,并制作了如下的流程图。
机器之心
2020-02-24
1K0
AAAI 2020 | 旷视研究院:深度解读文字检测与识别新突破
在最新一期的 AAAI 2020 线上论文分享中,旷视研究院算法研究员万昭祎结合被接收的两篇论文,向我们介绍了旷视提出的高性能实时文字检测算法和更鲁棒的文字识别框架。
机器之心
2020-02-24
1.2K0
Excel狂魔?单元格做计算机视觉:人脸检测、OCR都不在话下
Excel 基本操作会吧?上网搜索公式会吧?基本的数学理解能力有吧?OK,如果以上你都能做到,你也能上手计算机视觉项目了。
机器之心
2020-02-24
1.2K0
英语学习利器:一款词典笔的模型创新与工程实践
8 月 6 日,网易有道发布了一款全新的智能学习硬件:网易有道词典笔 2.0。该词典笔只要扫一扫就能自动识别生词、句子,并提供对应的释义、翻译与读音。重要的是,所有这些功能都可以在离线的情况下完成,包括 NMT 实现的整句翻译。当然,这支笔背后的技术不止这些,ASR(语音识别)和 NLU(自然语言理解)等技术也帮助其实现了在线的语音助手问答功能。
机器之心
2019-08-16
1.1K0
在AI+教育的黄金赛道,网易有道如何践行进阶之路
「未来 30 年,通过吞下一粒药丸你就可以学习一门课程,因为它可以通过血液进入大脑。」两年前,在一次 TED 演讲上,美国计算机专家尼葛洛庞帝曾对未来的教育如是预言。虽然生物科技尚未完成这种颠覆,但近年来红透天的 AI 技术对于教育的改变却已展露苗头。
机器之心
2019-05-07
7140
最好用的文字与公式编辑器,这套数学笔记神器送给你
在我们学习生活中,经常需要记很多笔记,或者发发个人博客网站,那么工具就必不可少了。一般情况下,我们都钟爱使用贼简单、贼优美的 Markdown 标记语言,它的学习曲线并不陡峭,且基本上能 Cover 绝大多数使用场景。
机器之心
2019-04-29
2K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档