ai 能不能识别文字_ai文字识别_文字识别 ai - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

写影评、看图写诗、甚至生成视频，微软亚洲研究院梅涛博士讲解视频理解的最新进展 | CCF-GAIR 2017

AI科技评论按：7月7号，全球人工智能和机器人峰会在深圳如期举办，由CCF主办、雷锋网与中国香港中文大学（深圳）承办的这次大会共聚集了来自全球30多位AI领域科学家、近300家AI明星企业。AI 科技评论最近将会陆续放出峰会上的精华内容，回馈给长期以来支持我们的读者们！本次文章的演讲来自微软亚洲研究院资深研究员梅涛博士，分享主题为「视频内容的生命周期：创作，处理，消费」。 📷 梅涛博士，微软亚洲研究院资深研究员，国际模式识别学会会士，美国计算机协会杰出科学家，中国科技大学和中山大学兼职教授博

07

ChatGPT“克星”：用AI识别AI生成的文本，英语论文阅读笔记都能测出

萧箫发自凹非寺量子位 | 公众号 QbitAI ChatGPT的出现，让不少人看到了交期末大作业的曙光（手动狗头）。无论是英语论文、还是阅读笔记，只要在ChatGPT的知识范围内，都可以拜托它帮忙完成，写出来的内容也有理有据。不过，有没有想过你的老师也准备用“AI文本检测器”一类的东西来防止你作弊？像这样输入一段看起来没毛病的笔记，经过它一番检测，认为这段文字“由AI编写”（Fake）的可能性为99.98%！ △文本由ChatGPT生成换个数学论文试试？ChatGPT的输出看起来没啥问题，

02

您找到你想要的搜索结果了吗？

是的

没有找到

WAIC 2021 | 好未来集团技术副总裁吴中勤：多模态机器学习及大规模自动生成技术算法框架与行业实践

机器之心报道机器之心编辑部在 WAIC 2021 AI 开发者论坛上，好未来集团技术副总裁吴中勤发表主题演讲《多模态机器学习及大规模自动生成技术：算法框架、行业实践》，他主要介绍了多模态深度学习以及大规模自动生成技术在教育领域的实践与应用，并介绍了好未来 AI 研究院的最新研究成果及成功案例。以下为吴中勤在 WAIC 2021 AI 开发者论坛上的演讲内容，机器之心进行了不改变原意的编辑、整理：非常高兴来到上海和大家一起交流人工智能算法和行业实践的一些工作，今天选取了与工作中非常相关的多模态深度学

01

文字图片能不能转换成word 如何提取图片中的文字

现在办公自动化的普及，在办公室工作的人员在制作文案时，会使用到大量的资料，为了保存这些资料，很多人会使用拍照或者是扫描的方式，把内容通过文字图片保存起来，但是在进行编辑时，如果逐字敲成本文格式，会比较麻烦，也容易出错，这时就会遇到文字图片转为本文的情况，下面就来看看，文字图片能不能转换成word文档吧。

03

【华为张宝峰】AI 吓尿指数与终端智慧化未来的三大痛点（PPT）

【新智元导读】华为在人工智能相关领域的发展路径选择，也许将改变中国 AI+ 时代的产业格局和江湖面貌。新智元特别邀请到华为 CBG 软件工程部 VP、终端智慧工程部部长张宝峰参加了 6 月的百人会，详

05

Python爬虫基础教程：验证码的爬取和识别详解

Python现在非常火，语法简单而且功能强大，很多同学都想学Python！所以小的给各位看官们准备了高价值Python学习视频教程及相关电子版书籍，欢迎前来领取！

01

Python爬虫基础：验证码的爬取和识别详解

今天要给大家介绍的是验证码的爬取和识别，不过只涉及到最简单的图形验证码，也是现在比较常见的一种类型。

02

2024年开源大模型有哪些？这篇文章告诉你

最近，国内外开源大模型一直受到研究者的关注，但是种类比较繁多，就单单今年开源的大模型就有10+以上。

00

云从科技 | 从初创企业上位AI“国家队”，看看背后都干了些什么？！

东邪西毒南帝北丐们，各有各的招数：以假乱真的仿生人、跟邓亚萍旗鼓相当的乒乓机器人、还有云从科技御眼重明“关上灯也认识你”、人工智能医疗阅片……

01

500强企业如何用人工智能提升业务效果？

在达观数据主办的“2018长三角人工智能应用创新张江峰会”上，荣幸邀请到了平安金服创新技术部产品总监赵静芝。她分享的主题演讲《弱智能时代，不看特效看疗效》关于如何利用人工智能技术来提升企业的业务效果和财务收入，其中生动具体的案例和多年的经验总结，赢得现场一片好评。

02

清华大学张长水教授：机器学习和图像识别（附视频、PPT下载）

本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。

03

把小程序『颜值检测仪』开源了

9月底的时候，一个同学拉我参加一个比赛，思考了一下之后就报名了（最后一天报的名）。报完名后就开始搞小程序，什么都没考虑，直接就开始写，试了几个方向之后，就决定调用腾讯 AI 的接口进行人脸检测与分析，最后把『颜值检测仪』做出来了。

04

ChatGPT又被「奶奶漏洞」骗了！PS奶奶遗物，骗Bing完美识别验证码

简单来说，这是一个prompt技巧，有些事明说的话ChatGPT会义正言辞的拒绝你。

02

AI量身定制：如何打造符合“中国特色教育”的内容推荐体系？

“新东方、学而思的成功是公立教育失败的产物”，这句话一度成了人们用来指责中国应试教育失败一面的万能语句，不过作为前长春新东方学校的校长，一起教育科技 CEO 刘畅无疑比大多数人的感受更为具体。

02

夸克“凶猛”：一场手机镜头背后的狂野冒险

浅友们好~我是史中，我的日常生活是开撩五湖四海的科技大牛，我会尝试各种姿势，把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友，不妨加微信（shizhongmax）。

03

我代码0基础，5分钟能做一个大模型应用

小张是新技术爱好者，他就想，能不能让AI来回答客服问题，这样他省下的时间可以用来摸鱼学习？

00

感觉身体被掏空？你需要这 5 个「吸猫/狗」小程序来补一补

现在，微博上最受欢迎的网红已经不是漂亮的小姐姐们了，取而代之而是各种各样可爱的小动物们。

02

【银行卡识别】Python批量识别银行卡号码并且写入Excel，小白也可以轻松使用~

昨天我们学习了：【文字识别】基于腾讯云AI，用1行Python代码识别增值税发票，YYDS。

00

在中国，也能一辈子做程序员

由于国内外软件发展起步不同，加上近年来关于程序员遭遇 35 岁职业危机和行业内卷的问题愈发凸显，在中国一辈子当程序员似乎是一件很困难的事情。

02

go实现西瓜视频花椒直播等平台智能答题

本文源码 https://github.com/Chain-Zhang/answer_ai 介绍最近出了很多答题平分奖金的直播，只要能够连续答对12道题，就能与所有答对的人一起平分奖池里的奖金，20万到500万不等。当这个时候，我才体会到“书到用时方恨少”这句至理名言。这时突然想到，咦！我们不是有无所不知的互联网吗，题目拿到百度中一搜不就完了。可是一看答题时间只有10秒，尽管我有着单身20多年的手速，也愣是做不到呀。再一想，我特么是程序猿呀，这种事还需要我亲自动手？于是一通百度，找到了个大神的java智

央视首位AI手语主播亮相，动作精确、实时转译，网友：能接住广权的段子么？

今天，在距离2022年北京冬奥会72天的日子，她正式亮相，成为央视新闻的一位特殊报道员。

03

浪潮集团副总裁胡雷钧：扩展Caffe，从方案、框架、系统、平台应对AI计算挑战

【新智元导读】新智元AI WORLD2017 世界人工智能大会上，浪潮集团副总裁胡雷钧带来《AI计算挑战与应对》的分享。他提到，当前AI算法对计算能力有巨大的需求，针对AI计算能力的挑战，浪潮推出了

贾佳亚加盟腾讯优图后首次公开亮相：计算机视觉有哪三种打开方式？

腾讯优图实验室杰出科学家贾佳亚，香港中文大学计算机科学工程系终身教授，于 2017 年 5 月 15 日公布消息，全职加入腾讯优图实验室，负责计算机视觉、图像处理、模式识别等人工智能领域的研究,及人工智能与各应用场景结合的深度探索。 AI 科技评论了解到，贾佳亚在加入腾讯后鲜少露面，本次在“腾讯云+未来”AI大数据专场做主题演讲，也是为数不多能一窥腾讯优图实验室及研究成果的公开场合。以下是贾佳亚在今日“腾讯云+未来”AI大数据专场所做的主题演讲《计算机视觉前沿与应用》，AI 科技评论对速记做了不改动原意的编

05

杭州小伙用Griefbot「复活」祖父，目前已删除：不想过度依赖AI

借助各种聊天程序、面部识别的AI模型，以及语音识别、动作识别模型，再加上我们保存的亲人们的影音资料，我们就可以尝试复刻已故亲人的性格、记忆。

01

华院数据数据科学家尹相志：智能投顾一定能赚大钱吗？

数据猿导读电脑逐渐可以去做一些我们想不到的事。我不会用替代人力这样的字眼。因为目前来讲，科技取代人类还非常远。最重要的是机器帮助我们从无聊、繁琐的事情中脱身。作者：尹相志如今，随着社会不断发展，

被小米的智能识物感动到哭

小米手机的相机里，隐藏了一个“智能识物”的AI。你只需要拍摄一张照片，这个AI就能识别出来你拍的是什么。

05

蒋涛：人工智能时代，要帮30万家企业走向智能化，你来不来？

——黑马名片—— 蒋涛 CSDN创始人，极客帮基金创始合伙人；黑马营7期营员，黑马连营第5期连长；有24年软件开发经验，其创立的CSDN是全球最大的开发者社区；同时具备投资人身份，先后投资了聚合数据、IT桔子等90余家高科技创业公司。行业☞人工智能关键词☞趋势洞察家、技术达人、极客范儿尽管人类是科技的创造者，却无法掌控其发展。我们所能做的就是掌握科技的发展趋势。人工智能浪潮来临，它将如何颠覆我们的工作和生活呢？近日，黑马营7期营员、黑马连营第5期连长蒋涛与我们分享了他的看法。他认为，未来

05

倪捷：智能语音扩展数字化服务

广义上来讲智能语音技术有各种各样的定义，以上是常见的一些热门的场景。语音识别，刚才罗老师也分享了部分内容。语音合成是文字变成语音，这部分我们后面会详细展开。再往后看，声纹识别，在智能车里面有很多的功能需要人的发音媒介来控制命令的时候声纹就很重要。开一个车门，车上有一个小孩，突然哭闹，下一个不合适的指令，你区别不出来这个人，对语音控制来说不合适的。或者有一些不当的操作，可以通过声纹来做，通过声音来做对人的识别和认证的过程。声纹识别其实在未来的应用场景比较热门，实际应用当中遇到大的挑战点是什么？很多其他的生物识别靠人脸或指纹这类比较稳定的特征，可是声纹不稳定，人高兴的时候，第一天晚上唱了卡拉OK，第二天声音哑了，怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。

02

云+社区分享——腾讯云OCR文字识别

2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动，活动举办期间用户耐心听分享嘉宾的介绍，并提出了相关的问题，智能图像团队的科学家和工程师也耐心解答可用户的疑问。以下就是活动分享的全部内容。

Python实现视频语音和字幕自动审查功能

提取视频文件中的图像然后使用OCR技术识别静态图像中的文本，提取视频文件中的音频然后使用语音识别技术提取其中的文本，如果视频文本或音频文本中包含指定的关键词则进行提示。

03

如何在自动驾驶爱好者愤怒的边缘试探？

自动驾驶行业在经历了前几年的投资热浪之后，也逐渐进入了冷静期。今年4月，主攻L4自动驾驶的明星创业公司Roadstar.ai，被曝出管理层动荡、濒临倒闭。6月，一度闪耀硅谷的自动驾驶初创公司Drive.ai轰然倒下，之后苹果承认收购Drive.ai，但将裁掉过半的员工。自动驾驶行业既有诸如Drive.ai、Roadstar.ai这般的牺牲者，也有谷歌旗下Waymo、通用旗下Cruise和百度这类的奋勇者。资本的热浪褪去、发展中的技术瓶颈、行业内的兼并形势，都考验着自动驾驶创业者的耐心和实力。

02

INTERFACE | 从技术到产品，搜狗为我们解读了神经机器翻译的现状

INTERFACE 分享者：陈伟、李健涛机器之心报道参与：李泽南 3 月 12 日，搜狗正式在线上平台发布了「旅行翻译宝」。这款随身翻译设备结合了搜狗神经网络机器翻译、语音识别、图像识别等多项技术，不仅支持语音、图像翻译等多种翻译模式，还提供中英日韩俄德等 18 种语言互译。在深度学习快速发展的今天，机器翻译系统的能力究竟达到了什么样的水平？机器翻译是否已经可以代替人类翻译？3 月 17 日，机器之心与搜狗共同举办的 INTERFACE 线下分享中，搜狗语音交互技术中心研发总监陈伟、搜狗 IOT 事

04

Altman力推GPT-4新应用：让GPT-4能穿梭时空，过目不忘的私人AI助理

简单来说，这个APP最主要的功能就是帮你寻找到自己在iPhone和Mac上以前看过的所有数据，并以此为基础回答你的所有问题。

02

用 ChatGPT 重构工作流程

如果你第一次听说 ChatGPT，那你要反思一下自己的信息获取渠道是不是出了问题，作为 AI 时代最强代表，你一定要亲自去体验一下，而不是道听途说。

02

清华才女飙泪谈人工智能：这才是我最大的担心！

随着AI时代的到来，“人工智能” “物联网”“云计算”这些看起来高度技术化的名词，正在走入“平常百姓家”。科技驱动未来，也许有不少人的想法，正如《南风窗》写的那样：“今天怎么想象未来，都是幼稚的”。然

06

腾讯元宝，有点东西~

从5月30号正式发布到现在，我使用腾讯元宝有七八天了。结合国内其他的一些大模型产品，综合体验对比下来，元宝给人一种博采众长后青出于蓝而胜于蓝的感觉~

01

访谈 | 从学界到业界，贾佳亚聊了聊加入腾讯优图的初衷与目标

机器之心原创作者：黄小天 2017 年 6 月 21 日，在深圳召开的第二届云+未来峰会上，腾讯云发布了战略新品「智能云」，希望借此推动「人工智能即服务」的发展，像获取水和电一样便捷地使用人工智能。此次峰会以「连接·智能·未来」为主题，围绕备受关注的 AI 技术热点，海内外人工智能领域专家以及各行业领军人物在会上共同探讨了云计算与人工智能浪潮下的产业发展趋势。在峰会上，腾讯优图实验室杰出科学家贾佳亚发表了主旨为《视觉 AI 技术以及其社会价值》的演讲，他在分享中提到：「AI 是一种工具，在于怎么使用」，

04

清华唐杰教授：认知图谱是人工智能的下一个瑰宝（PPT下载）

导读：近日，清华大学计算机系教授、系副主任，智谱·AI 首席科学家唐杰在 MEET 2021 智能未来大会上作了题为《认知图谱——人工智能的下一个瑰宝》的精彩演讲。

02

WPS Office AI实战：Word写作如有“神”助

打开电脑，基本上你就会与文档打交道，是时候升级处理文档的方式了，WPS AI 的出现，给了文档处理提供了新的范式。

05

戴着口罩也能人脸识别，腾讯AI取得突破

随着全国范围的陆续复工，公共场所人流或将持续升高。守住口罩这道健康防线就显得至关重要，但人多了一些难题就会难上加难：比如，谁偷偷摘下了口罩，谁戴错了，单靠人工排查怎么减少疏漏？再比如，在高铁闸机等需要人脸识别的场景，能不能不摘口罩实现人脸识别，降低感染风险？针对这些难题，腾讯优图在近期成立的攻坚小组取得了突破，成功研发出了口罩佩戴识别专用AI。这套AI既能对戴口罩者实现人脸识别，又能发现口罩佩戴错误人员，口罩佩戴识别准确率超过99%。目前该AI能力正在上线，近期将通过腾讯云神图向公众开放。所有

01

【每日精选时刻】一键录音转word文档！智能体元气Agent会掀起新热潮吗？

大家吼，我是你们的朋友煎饼狗子——喜欢在社区发掘有趣的作品和作者。【每日精选时刻】是我为大家精心打造的栏目，在这里，你可以看到煎饼为你携回的来自社区各领域的新鲜出彩作品。点此一键订阅【每日精选时刻】专栏，吃瓜新鲜作品不迷路！ *当然，你也可以在本篇文章，评论区自荐/推荐他人优秀作品（标题+链接+推荐理由），增加文章入选的概率哟~

02

深度学习工程师应该了解点啥

昨天发了一篇叫做《月薪5K和5W的程序员差距在哪儿》的软文，有的小朋友跟我说，能不能发一篇《月薪5K和5W的AI工程师差距在哪儿》的文章。要发这样一个题目的文章我觉得似乎并不能表达我自己想要表达的意思。

02

免费好用OCR软件图片文字识别还能翻译

全称叫做optical character recognition，是对图像领域的文字进行识别。

09

设计师、艺术家会被AI取代吗？

大家好，我是shadow，我是一名智能产品架构师，有10年经验的技术和设计经验；毕业于上海交通大学，同济大学；服务过的企业有中兴通讯、招商银行、ARKIE智能设计等。我每天的工作就是在设计师和程序员的身份之间切换，设计思维和计算机思维之间切换。

03

【AI解梦大师】加州大学用机器学习算法来预测和分析梦境

【导读】梦是神秘的一种主体经验，是哲学、宗教、心理学等最感兴趣的话题，也产生了许多有关的科学猜想。但人类从未真正理解梦的内容、机制和作用。我们能不能设计一种机器学习算法来预测和分析我们的梦境呢？答案是肯定的。在AI的帮助下，理解、预测和控制梦境的技术上已经取得了进展。

02

AI算法起家的今日头条为何败给了色情？一文告诉你机器学习何以搞不定鉴黄

12月29日，国家互联网信息办公室在官网发布消息称，针对今日头条、凤凰新闻手机客户端持续传播色情低俗信息、违规提供互联网新闻信息服务等问题，要求北京市互联网信息办公室分别约谈两家企业负责人，责令企业立即停止违法违规行为。对此，今日头条乖乖表示，依据有关部门的整改要求，今日头条手机客户端“推荐”、“热点”、“社会”、“图片”、“问答”、“财经”6个频道自2017年12月29日18时至次日18时暂停更新24小时，进入维护状态。如此，今日头条遭遇史上最严“整改”，网信办动真格了。其实，今日头条不是第一

08

一文看懂科大讯飞2017年表现：刷新八项国际比赛记录，囊括四大消费场景，推出十大重点产品（3万字长文）

整理 | 刘晶晶 Donna 睢岭润色 | 鸽子 11月9日，科大讯飞2017年度发布会，“顶天立地，AI赋能” 在北京国家会议中心召开，科大讯飞董事长刘庆峰，轮值总裁吴晓如分别在大会就人工智能技术、行业应用做了报告，执行总裁胡郁则向所有人公布了公司在人工智能领域的最新产品。据刘庆峰透露，12月6号，科大讯飞刚刚创造了一个历史性记录：讯飞智医助手，成为第一个通过国家医师资格证的机器人。据刘庆峰透露，讯飞智医考了456分，超过分数线达96分以上，在安微省2万多考生中，名列前100名。刘庆峰提到人工

竹间智能翁嘉颀：人机交互技术探索 | AI 研习社 60 期猿桌会

AI 科技评论按：随着语音识别 ASR 的进步，对话机器人从简单的指令式的语音助手，进化到关键词交互方式，人们能够使用较为完整的句子来表达意图，机器人从中截取关键词判断用户意图。

02

【语音识别】一键实现电话录音转word文档

因从事律师工作，在诉讼业务中，经常会解除到当事人电话录音这一类的证据。苦于当事人提供的电话录音要么普通话不标准，要么直接就是方言，对话中的关键信息也难以定位。而在法庭的质证环节中，仅提交一份电话录音的文件，却不提供转写的文字版内容，显然是不会留给审判席人员好印象的。众所周知，律师最值钱的就是时间了，那么这样一份繁琐的转写录音文件的工作流程，能不能够使用AI的科技手段实现呢？

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭