如何使用Google Cloud Vision API确认图像(包含手写和打印文本)是否包含手写文本？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

留住老照片，谷歌用AI帮纽约时报讲了500万个故事

纸质老照片记录下了当时的珍贵时刻，其中的历史意义也更为重要，但纸质极容易损坏，人类该怎么保存它们，让它们恒久远永流传？

04

盘点 | TOP49人工智能常用 API

【新智元导读】作者Geethika Bhavya Peddibhotla列出了49个人工智能领域常用的API，包括机器学习和预测、人脸和图像识别、文本和情感分析以及翻译。下文只是列举式陈述，有其他推荐

09

您找到你想要的搜索结果了吗？

是的

没有找到

一文告诉你，如何使用Python构建一个“谷歌搜索”系统 | 内附代码

在这篇文章中，我将向您展示如何使用Python构建自己的答案查找系统。基本上，这种自动化可以从图片中找到多项选择题的答案。

01

谷歌新突破：自然语言与翻译加入AutoML，Contact Center AI和TPU 3.0发布

今天在旧金山举行的谷歌Cloud Next大会上，谷歌迎来了全新的突破，发布了一系列关于人工智能的公告。亮点主要包括：AutoML增添了自然语言处理（AutoML Natural Language）和翻译（AutoML Translate）；Contact Center AI和TPU 3.0。

01

2018 最新机器学习 API 推荐清单，快给 APP 加点智能

本篇基于 2017 年的推荐清单做了一些改进——去除了一些不再进行维护的 API，并且更新了一些新的 API。主要覆盖如下方向：

03

TensorFlow Lite，ML Kit 和 Flutter 移动深度学习：1~5

在本章中，我们将探索移动设备上深度学习的新兴途径。我们将简要讨论机器学习和深度学习的基本概念，并将介绍可用于将深度学习与 Android 和 iOS 集成的各种选项。本章还介绍了使用本机和基于云的学习方法进行深度学习项目的实现。

01

Python Web 深度学习实用指南：第三部分

本节将说明 API 在软件开发中的一般用法，并说明如何使用不同的最新深度学习 API 来构建智能 Web 应用。我们将涵盖自然语言处理（NLP）和计算机视觉等领域。

01

从人脸识别到机器翻译：52个有用的机器学习和预测API

人工智能正在成为新一代技术变革的基础技术，但从头开始为自己的应用和业务开发人工智能程序既成本高昂，且往往很难达到自己想要的性能表现，但好在我们有大量现成可用的 API 可以使用。开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中。机器之心在 2015 年底就曾经编译过一篇介绍当前优质人工智能和机器学习 API 的文章《技术 | 50 个常用的人工智能和机器学习 API》，列举了 50 个较为常用的涉及到机器学习、推理预测、文本分析及归类、人脸识别、语言翻译等多个方面的 API。一年多过去了，好用的 API 也出现了一些新旧更迭，现在是时候对这篇文章进行更新了。

01

Gemini演示视频“翻车”后，谷歌接连放大招：向云客户免费提供Gemini Pro，推出AI代码辅助工具，集成25家公司数据集

上周，谷歌公布了该公司有史以来体量最大、功能最强的 AI 模型 Gemini，这也是谷歌在推动 AI 实际落地过程中的重要一步。Gemini 模型共分为三个版本：Ultra 版、Pro 版与 Nano 版。谷歌已经开始在自家产品组合中引入 Gemini：从 Pixel 8 Pro 开始，Gemni Nano 将正式登陆 Android 系统；而经过专门微调的 Gemini Pro 则即将现身 Google Bard。

01

‍Java OCR技术全面解析：六大解决方案比较

在本篇博文中，我们深入探讨了六种主流的Java OCR（光学字符识别）技术解决方案，旨在为Java开发者提供全面的技术对比和实用指南。从开源神器Tesseract到云服务巨头Google Vision API，再到专业的OCR库如ABBYY，每种解决方案都将通过依赖引入、代码实例、GitHub上的数据集链接、应用场景对比以及优缺点分析进行详细介绍。无论是对于OCR新手还是经验丰富的开发大佬，本文都力求提供一份准确、易读、内容丰富的技术分享，确保每位读者都能找到满足其项目需求的最佳OCR解决方案。

01

想快速部署机器学习项目？来看看几大主流机器学习服务平台对比吧

日前，kdnuggets 上的一篇文章对比了三大公司（谷歌、微软和亚马逊）提供的机器学习服务平台，对于想要启动机器学习项目的公司或是数据科学新手来说，提供了非常多的指导和建议。 AI 研习社将原文编译整理如下：对于大多数企业来说，机器学习就像航空航天一样遥远，听起来既昂贵，还需要高科技人才。从某种角度来说，如果你想建立一个像 Netflix 一样好的推荐系统，那确实是昂贵且困难。但是，目前这个复杂的领域有一个趋势：一切皆服务（everything-as-a-service)——无需太多投资，即可快速启动机

50种机器学习和预测应用的API，你想要的全都有

翻译 | Drei 编辑 | Just 出品 | 人工智能头条（公众号ID：AI_Thinker） API 是一套用于构建软件程序的协议和工具。对于应用开发者而言，有了开放的 API，就可以直接调用其他公司做好的功能为我所用，这在很大程度上提升了工作效率。本文整理了以下四大类共 50 种 API，为你节省了寻找资源的时间。总之，你所需要的可能基本都在下面了：人脸和图像识别（Face Image Recognition）文本分析，自然语言处理，情感分析（Text Analysis, NLP, Senti

07

50种机器学习和人脸识别API，收藏好！以后开发不用找啦

API 是一套用于构建软件程序的协议和工具。对于应用开发者而言，有了开放的 API，就可以直接调用其他公司做好的功能为我所用，这在很大程度上提升了工作效率。本文整理了以下四大类共 50 种 API，为你节省了寻找资源的时间。

04

50种机器学习和预测应用的API，你想要的全都有

API 是一套用于构建软件程序的协议和工具。对于应用开发者而言，有了开放的 API，就可以直接调用其他公司做好的功能为我所用，这在很大程度上提升了工作效率。

02

从人脸识别到情感分析，50个机器学习实用API

API是一套用于构建应用软件程序的规范，协议和工具。在本文中，我们从2017年的清单中删除了停用的API，并利用新元素对其进行了更新。并且，所有的API被归类到以下几个领域：

01

人脸识别、情感分析，开发者必备50个机器学习API|值得收藏

该清单按照字母排序，对 API 的概述是基于对应官网所提供的信息整合而成。要是大家发现该清单中错过了某些当前流行的 API，可以在评论中告知。

03

从人脸识别到情感分析，这有50个机器学习实用API！

大数据文摘作品编译：大茜、Shan LIU、云舟还在为找不到机器学习的API而烦恼吗？本篇文章将介绍一个包含50+关于人脸和图像识别，文本分析，NLP，情感分析，语言翻译，机器学习和预测的API列表，快快收藏吧~ API是一套用于构建应用软件程序的规范，协议和工具。在本文中，我们从2017年的清单中删除了停用的API，并利用新元素对其进行了更新。并且，所有的API被归类到以下几个领域：人脸和图像识别文本分析，NLP，情感分析语言翻译机器学习和预测在每组应用中，列表中的元素按字母顺序排列。相

05

【AutoML】当前有哪些可用的AutoML平台？

大家好，欢迎来到专栏《AutoML》，在这个专栏中我们会讲述AutoML技术在深度学习中的应用，这一期讲述现有可用的AutoML平台。

03

使用图神经网络优化信息提取的流程概述

在这篇文章中，我们将介绍票据数字化的问题，即从纸制收据（如医疗发票、门票等）中以标签的形式提取必要和重要的信息。这些类型的模型在现实生活中非常有用，可以帮助用户，为了更好地理解数据，我们日常工作的很大一部分仍然是处理纸制收据（扫描件）。在自然语言处理领域，这项任务称为序列标记，因为我们以某种形式的预定义类标记每个输入实体，例如杂货店购物的正常收据，标签可以是 TOTAL_KEY、SUBTOTAL_KEY、COMPANY_NAME、COMPANY_ADDRESS、DATE、下图描述了这些工作的一般流程，将在接下来的部分中一一描述。

02

还在做着学AI拿高薪的美梦？谷歌新推出神器一巴掌打醒你

整个操作过程，从导入数据到标记和训练模型，都只需要用鼠标拖放界面即可完成。人工智能和深度学习首席科学家李飞飞本周在某个新闻发布会上表示，人工智能和机器学习仍然是一个进入门槛高的领域，需要专业知识和资源，很少有公司自己能雇佣起机器学习和数据科学家。兵贵神速，在今天的凌晨，谷歌就发布了用机器学习来训练机器学习的神器：Cloud AutoML Vision。 AI训练AI 谷歌的Cloud AutoML到底是什么？ Cloud AutoML是一套机器学习产品，其背后的逻辑是用AI制作AI。它能够使具有有限机

00

图像识别的工作原理是什么？商业上如何使用它？

图像识别市场估计将从2016年的159.5亿美元增长到2021年的389.2亿美元，在2016年至2021年之间的复合年增长率为19.5％。机器学习和高带宽数据服务的使用进步推动了这项技术的发展。。电子商务，汽车，医疗保健和游戏等不同领域的公司正在迅速采用图像识别。根据MarketsandMarkets的报告，图像识别市场分为硬件，软件和服务。以智能手机和扫描仪为主的硬件部分可以在图像识别市场的增长中发挥巨大作用。越来越需要具有创新技术（例如监控摄像头和面部识别）的安全应用程序和产品。

02

苹果开放机器学习API，支持面部追踪、面部识别、条码识别等

此次苹果WWDC大会，苹果不仅在iOS的自家应用中更多使用了机器学习，还把机器学习功能作为iOS API的一部分向开发者开放，希望开发者们也用机器学习的力量开发出更好的应用程序。除了新硬件和新系统，

08

Google 发布 Cloud AutoML 降低机器学习门槛，调参民工前景堪忧

翻译 | AI 科技大本营（rgznai100）参与 | 刘畅、林椿眄编辑 | 周翔、Donna 本周三，Google 发布了最新的 Cloud AutoML 技术，该技术能使企业开发者们通过 Google Cloud 平台自动创建机器学习模型。谷歌首先将发布 AutoML Vision，即用于建立机器视觉模型的工具，随后将陆续推出用于机器翻译和自然语言处理等的工具。 Cloud AutoML 将是开发者的利器，即便你不懂机器学习，也能训练出一个定制化的机器学习模型。具体来说，开发者只需要上传一组

04

云+社区分享——腾讯云OCR文字识别

2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动，活动举办期间用户耐心听分享嘉宾的介绍，并提出了相关的问题，智能图像团队的科学家和工程师也耐心解答可用户的疑问。以下就是活动分享的全部内容。

Google 发布 Cloud AutoML 降低机器学习门槛，调参民工前景堪忧

本周三，Google 发布了最新的 Cloud AutoML 技术，该技术能使企业开发者们通过 Google Cloud 平台自动创建机器学习模型。谷歌首先将发布 AutoML Vision，即用于建立机器视觉模型的工具，随后将陆续推出用于机器翻译和自然语言处理等的工具。 Cloud AutoML 将是开发者的利器，即便你不懂机器学习，也能训练出一个定制化的机器学习模型。具体来说，开发者只需要上传一组图片，然后导入标签或者通过 App 创建，随后 Cloud AutoML 就会自动生成一个定制化的机器学

06

52 个有用的机器学习与预测API

随着基于人工智能与机器学习的应用如雨后春笋般不断涌现，我们也看到有很多提供类似功能的 API 悄悄登上了舞台。 API 是用于构建软件应用的程序、协议以及工具的组合；本文是对2015 中这个列表的修正与完善，移除了部分被废弃的 API ；我们也添加了最近由 IBM、Google、Microsoft 这些大厂发布的 API 。所有的 API 可以根据应用场景进行分组：人脸与图片识别。文本分析，自然语言处理以及情感分析。语言翻译。预测以及其他的机器学习算法。在具体的每个分组内，我们根据首字母顺序排序；

50多种适合机器学习和预测应用的API，你的选择是？（2018年版本）

对于做工程项目和搞科研的人来说，有现成的模块或工具使用是一件多么美妙的事情啊，无需访问源码或理解内部工作机制的细节即可完成相应的任务。常用的方法是调用一些API，即一些预先定义的函数，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力。本文总结对于机器学习行业者有用的50多个API，主要涉及的领域如下：

01

教程 | 如何使用Swift在iOS 11中加入原生机器学习视觉模型

选自Hackernoon 机器之心编译作者：Alex Wulff 参与：侯韵楚、李泽南随着 WWDC 大会上 iOS 11 的发布，苹果终于推出了原生机器学习和机器视觉框架，由此开启了许多崭新的可能性，使所有性质的应用程序和游戏有望取得显著进步，本文作者 Alex Wulff 将对在 iOS 11 中加入机器学习模型的方法进行简要介绍。机器学习解决方案在云端的应用已有一些时日，但这类系统需要不间断的网络连接，并且很明显，它通常在 iOS 上会存在显著延迟，也为敏感数据带来了安全隐患。一些第三方的 Sw

05

苹果开放机器学习API，但是没有看到苹果的机器学习开发平台

AI科技评论消息，今天凌晨的苹果WWDC主题演讲无疑是果粉的狂欢，它很有可能被捧为最棒的WWDC。这次大会苹果有6大更新，包括了iOS 11、新macOS、升级版Macbook、惊艳的iMac Pro

06

OpenAI最新大模型曝光：剑指多模态，GPT-4之后最大升级

据The information爆料称，OpenAI即将推出多模态模型GPT-vision。

02

零基础可上手 | 手把手教你用Cloud AutoML做毒蜘蛛分类器

近日，一名叫Matt Fraser的小哥用Cloud AutoML制作了一个分类器，能识别分类澳大利亚的各种毒蜘蛛。

06

我们能用云函数做什么？

04

谷歌重磅：不用写代码也能建模调参，Cloud AutoML要实现全民玩AI

大数据文摘作品编译：钱天培、龙牧雪连发三条推特！今天凌晨时分，李飞飞通过一篇博客文章发布了谷歌最新AI产品——AutoML Vision，可以自动设计机器学习模型。我很荣幸地宣布AutoML Vision面世。无需精通机器学习，每个人都能用这款AI产品定制机器学习模型。这是“AI民主化”的重要进展！ ——李飞飞这个名为Cloud AutoML的宏大项目浮出水面，或标志谷歌发展的战略转型。一直以来面向机器学习人工智能开发者的Google Cloud，这次将服务对象转向了普罗大众。今天面世的AutoM

03

李飞飞和李佳：发布Cloud AutoML，让AI赋能每家企业！

谷歌全新发布Cloud AutoML，预计的语音、图像、NLP、翻译等系列服务中，首先发布的是AutoML Vision，任何人都能上传图片，然后让谷歌的系统自动为他们创建机器学习模型。李飞飞在Twitter连发两条信息说：“在短短的几个月里，将尖端技术转化为数百万的产品，这是一个相当鼓舞人心的旅程！我们希望AutoML Vision是我们客户的第一选择。” 📷 📷 李佳在朋友圈中称：今天我们 CloudAI 团队推出了 Cloud AutoML, 自动生成 ML 模型的技术。这是飞飞和我加入谷歌云以来的一

09

教程 | 如何使用谷歌Mobile Vision API 开发手机应用

机器之心原创参与：QW、李亚洲一年一度的谷歌开发者大会 Google I/O 昨日在山景城开幕，在首日的 Keynote 中，谷歌宣布了一系列新的硬件、应用、基础研究等。而在下午面向开发者的 se

05

谷歌文本转语音系统更新可选择学习模型

据外媒报道，近日，谷歌更新了其云端文本转语音（Cloud Text-to-Speech）API。

00

李飞飞交棒Andrew Moore，告别谷歌云AI回归斯坦福

今年7月的谷歌Next大会上，李飞飞宣布了两年前推进的Contact Center落地、AutoML推出自然语言和翻译服务、TPU 3.0进入谷歌云，这意味着谷歌云拥抱AI First后迎来里程碑式成就，这被外界认为是李飞飞在谷歌的最后“官方发布”。

01

业界 | 李飞飞、李佳宣布发布Cloud AutoML：AI技术「飞入寻常百姓家」

选自Google Blog 作者：李飞飞、李佳机器之心编译参与：路雪、刘晓坤李飞飞一直倡导AI民主化，今日谷歌云发布Cloud AutoML，希望帮助ML/AI专业知识和能力有限的企业也能够使用AI技术构建定制化AI模型。目前已有一万多家企业使用Cloud AutoML。谷歌发布 Cloud AutoML，旨在帮助更多公司构建高质量定制化模型。李飞飞和李佳在相关博客中称：「Cloud AutoML 将帮助 AI 专家更加高产，不断拓展 AI 的新领域，帮助经验不足的工程师构建梦寐以求的强大 AI 系

05

业界 | 对比了六家计算机视觉API，发现最好的竟然是...

选自free Code Camp 作者：Mariya Yao 机器之心编译参与：蒋思源、刘晓坤本文通过吉娃娃与松饼的图像对比了流行的六大计算机视觉API，作者希望能借助这些识别情况帮助读者了解各

06

GCP 上的人工智能实用指南：第一、二部分

在本节中，我们将介绍 Google Cloud Platform（GCP）上的无服务器计算基础。我们还将概述 GCP 上可用的 AI 组件，并向您介绍 GCP 上的各种计算和处理选项。

01

推出 TF Lite Task Library 接口，简化 ML移动端开发流程

作者 | Lu Wang、Chen Cen、Arun Venkatesan 和 Khanh LeViet

04

谷歌发布端到端AI平台，还有用于视频和表格的AutoML、文档理解API等多款工具

谷歌又有了大动作。在大洋彼岸的谷歌Cloud Next conference大会上，谷歌一口气发布了多款AI新品和工具，主要包括：

03

谷歌发布端到端AI平台，还有用于视频和表格的AutoML、文档理解API等多款工具

谷歌又有了大动作。在大洋彼岸的谷歌Cloud Next conference大会上，谷歌一口气发布了多款AI新品和工具，主要包括：

04

机器学习对抗案例 | 愚弄Google图像识别算法

2018年CES在美国拉斯维加斯召开，站在风口浪尖上的科技企业纷纷出动，在会场各显神通地展示自己的科技产品和各种智能算法。近年来，人工智能的浪潮不断拍打着 IT 领域的海岸，各家科技巨头们都喜欢向外骄

09

Google 发布 AutoML Vision，全自动训练 AI 无需写代码

关键时刻，第一时间送达！ 📷 还记得去年5月，谷歌大脑团队对外宣布推出AutoML系统，让人工智能自动编写机器学习程序，试图使机器学习模型的设计变得更为简单。短短三个月后，AutoML在一次图像内容分类的测试中，以82%的准确率击败了编写AutoML的研究人员。 1月17日，基于自身云平台，谷歌又推出了机器学习系统Google Cloud AutoML，为更多正在尝试搭建机器学习模型的开发者、分析人员、企业群体，降低了使用人工智能相关工具和框架的门槛。“目前，全球只有少数企业在ML和AI的研发上投入足够的人

07

超全的OCR数据集

http://www.robots.ox.ac.uk/~vgg/data/scenetext/

01

李飞飞再次告别！卸任斯坦福AI Lab负责人后，她只做一件事！

斯坦福人工智能实验室“SAIL”官方推特宣布：李飞飞正式卸任SAIL主任一职，由斯坦福大学计算机科学和语言学教授Christopher Manning接任。而李飞飞将继续担任由她主导的以人为中心的AI计划“HAI”联合创始人。

03

爬取 2 万多张 Flickr 图片，莫纳什大学复现 10 年间日本樱花开放的时空特征

内容一览：近年来，全球气候变化形势严峻，由此引发的蝴蝶效应，正深刻地影响着人类和大自然。在这一背景下，收集数百甚至数千公里范围内开花模式的数据，了解气候变化如何对开花植物产生影响，成为近年来生态研究的重要课题之一。但传统的方法通常需要耗费大量经费，且需要较长的时间进行采样调查，后勤保障工作也面临着重重困难。而近期发布在《Flora》期刊上的研究，不仅克服了这些问题，同时还揭示出前所未有的细节。

05

谷歌推出了针对企业人才搜索的AI解决方案

谷歌希望客户借助AI更轻松地找到合格的求职者。为此，它今天宣布推出其Cloud Talent Solution（以前称为Cloud Job Discovery）的求职功能。

05

资源 | 百万级字符：清华大学提出中文自然文本数据集CTW

选自arXiv 作者：Tailing Yuan等机器之心编译参与：刘晓坤、李泽南文字识别一直是图像处理领域中的重要任务。近日，清华大学与腾讯共同推出了中文自然文本数据集（Chinese Text in the Wild，CTW）——一个超大的街景图片中文文本数据集，为训练先进的深度学习模型奠定了基础。目前，该数据集包含 32,285 张图像和 1,018,402 个中文字符，规模远超此前的同类数据集。研究人员表示，未来还将在此数据集之上推出基于业内最先进模型的评测基准。资源链接：https://ct

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭