图像识别 linux 开源_图像识别开源_开源图像识别 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在 RK3399 开发板上部署 Tengine AI 框架

Tengine 是 OPEN AI LAB 一款轻量级神经网络推理引擎，它针对 Arm 嵌入式平台进行了专门优化，对 Android、Linux 系统都提供了很好的支持。

03

基于图像识别的AI自动化测试框架：GAME AI SDK平台解析

导语 | GAME AI SDK 是腾讯 TuringLab 研发的首个开源项目，着重解决自动化测试工具中的通用性问题，最初主要用于游戏 AI 自动化测试服务，现在可用于手机 APP、PC 端游戏、软件等专项自动化测试。通过 AI 算法进行大数据训练的网络模型具有良好的通用性，可以直接在同一类游戏（软件）中适用。文章作者：周大军，腾讯 AI 工程组专家工程师。

02

您找到你想要的搜索结果了吗？

是的

没有找到

百度IDL主任林元庆解读：人工智能技术研发的四大支柱

近日，百度深度学习实验室主任林元庆在百度年终媒体分享会上做了《看懂AI-百度技术开放日》的演讲，从客观层面阐述了人工智能技术研发的四大支柱，为我们呈现了让人工智能更深层，更极致的方法论，下面是演讲精华

写给设计师的人工智能指南：图像

“在未来30年，人工智能将取代目前世界上50%的工作。” ——莱斯大学计算机科学教授 Moshe Vardi 不管未来怎么样，我觉得提高设计师的效率是眼前最容易做到的事情。设计师打交道最多是图像

08

谷歌工程师亲自讲解：开源TensorFlow模型在图像、语言和艺术的应用

谷歌2017开发者大会 Google I/O已经落幕，有不少亮点都值得我们学习和回顾，其中相当一部分是机器学习开发的内容。AI研习社精选了其中的精彩视频译制呈现给大家，该视频为中文字幕版首发！来自谷歌TensorFlow技术推广部的Josh Gordon 带来了一场主题为《用于图像、语言和艺术的开源TensorFlow模型》（Open Source TensorFlow Models for images, language and art）的演讲，介绍了最新的从图像识别和语义理解的TensorFlow

04

亚马逊云科技最新赛事思路拓展 | 如何实现超大尺寸图像快速识别？

近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】中，动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、角度各异也导致常见的CV框架难以实现快速精准的目标识别。

02

如何实现超大尺寸图像快速识别

一般情况下，遥感目标检测中，遥感图像的图片尺寸都会很大，且图像中元素极为复杂，近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】也不例外，动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、小而密集、角度各异也导致常见的CV框架难以实现快速精准的目标识别。所以，如何实现遥感图像等超大尺寸图像快速识别？目前比较成熟的卫星图像识别算法并不少，但大多依托于强大的计算资源，为了用有限的计算资源实现大尺寸图像识别，我们找到了一个

03

介绍用于图像识别的五大最佳编程语言！

这段时间垃圾分类相关小程序、APP的上线，让图像识别又一次进入人们的视线，我国图像识别技术在全世界都排在前列。

04

10分钟搭建商品结算平台！商品、车辆识别一网打尽

"商品识别"、"人脸识别"、"以图搜图"有什么难？这个在 GitHub 上狂圈 Star 3100+ 的项目就能轻松帮你实现！

03

18M 超轻量图像识别系统，商品、车辆、人脸识别一网打尽！

图像识别作为深度学习算法的主流实践应用方向，早已在生活的各个领域发挥作用，如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别，这些任务背后的关键技术都在于此。

01

我们做了一个智能零售结算平台

目前在零售行业的实际运营过程中，会产生巨大的人力成本，例如导购、保洁、结算等，而其中，尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中，并且在此过程中，顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低，二来也使得顾客的购物体验下降。

01

GitHub 斩获 3100+ Star，国人开源的这个图像识别系统好用到爆！！！

如果你们想要实现酷炫的"商品识别"、"以图搜图"，进军新消费领域却没有相应技术方案，怎么办？

02

【研究】图像识别及应用

1 图像识别是什么？ 2 图像识别的应用场景有哪些？什么是图像识别图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。根据观测到的图像，对其中的物体分辨其类别

07

图形验证码识别技术

阻碍我们爬虫的。有时候正是在登录或者请求一些数据时候的图形验证码。因此这里我们讲解一种能将图片翻译成文字的技术。将图片翻译成文字一般被成为光学文字识别（Optical Character Recognition），简写为OCR。实现OCR的库不是很多，特别是开源的。因为这块存在一定的技术壁垒（需要大量的数据、算法、机器学习、深度学习知识等），并且如果做好了具有很高的商业价值。因此开源的比较少。这里介绍一个比较优秀的图像识别开源库：Tesseract。

01

基于Sikuli GUI图像识别框架的PC客户端自动化测试实践

最近两天，公司有个PC客户端的测试任务，除了最基础的功能测试外，还包括稳定性测试和兼容性测试需求。刚好去年接触过Sikuli这款基于GUI图像识别框架的自动化测试工具，于是便应用于测试工作中，辅助测试任务。初步试用下来，总体效果还算差强人意，也间接助我发现了一个致命级别的大bug（后续会介绍）。

02

揭秘图像识别，告诉你机器如何“看见”这个世界

看懂一个东西对人类来说很容易，但是对机器来说却是很难的，这个时候图像识别技术就应运而生。今天我们就为大家揭秘图像识别技术原理，告诉你机器如何利用卷积神经网络进行图像识别，从而“看见”这个世界。

02

桌面自动化终极利器开源了，牛逼！

大叔在日常工作的时候，经常会遇到一些繁琐重复的操作，情不自禁的会想到自动化。甚至有的时候会想，什么时候能实现自动化编写文章，自动化剪辑视频？

05

携程2015 Open House获奖项目：银行卡扫描识别

银行卡扫描识别 Ctrip Tech 背景介绍：图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型。图像识别经历了三个阶段的发展：文字识别，数字图像处理与识别，物体识别。文字识别的研究是从1950年开始的，一般是识别字母，数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。随着智能手机兴起，手机支付的行为越来越普及。但是用户在手机上输入银行卡卡号时，速度很慢，需要仔细的校对，用户体验很差。美国的PAYPAL 、苹果公司，中国的阿里公司和腾讯都在

05

OpenCV+深度学习预训练模型，简单搞定图像识别 | 教程

李林编译自 pyimagesearch 作者 Adrian Rosebrock 量子位报道 | 公众号 QbitAI OpenCV是一个2000年发布的开源计算机视觉库，有进行物体识别、图像分割、

06

全球首个「开源图像识别系统」上线了！

父老们，乡亲们！你知道人脸、商品、车辆识别，以图搜图乃至自动驾驶，背后的技术是什么嘛？

03

明厨亮灶监控实施方案 opencv

明厨亮灶监控实施方案算法通过python+opencv网络模型图像识别算法，一旦发现现场人员没有正确佩戴厨师帽或厨师服，及时发现明火离岗、不戴口罩、厨房抽烟、老鼠出没以及陌生人进入后厨等问题生成告警信息并进行提示。明厨亮灶监控实施方案算法中OpenCV模型是一个基于Apache2.0许可（开源）发行的跨平台计算机视觉和机器学习软件库，可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——明厨亮灶监控实施方案算法由一系列 C 函数和少量 C++ 类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。

05

基于TensorFlow和OpenCV的物种识别与个体相似度分析

在计算机视觉领域，图像相似度比较和物种识别是两个重要的研究方向。本文通过结合深度学习和图像处理技术，使用TensorFlow中的预训练MobileNetV2模型和OpenCV，实现了物种识别和个体相似度分析。本文将详细介绍该系统的实现过程，并提供相关代码和使用说明。

01

图像识别在测试中的应用

介绍到这里会有人问，有了webdriver等ui自动化后为什么还要用图像识别呢？我认为主要有以下这几点：

02

canvas图像识取技术以及智能化设计的思考

笔者最近一直在研究前端可视化和搭建化的技术, 最近也遇到一个非常有意思的课题, 就是基于设计稿自动提取图片信息, 来智能化出码. 当然本文并不会介绍很多晦涩难懂的技术概念, 我会从几个实际应用场景出发, 介绍如何通过canvas图像识取技术来实现一些有意思的功能. 最后会总结一些对智能化的思考以及对低代码方向的规划, 希望能对各位有所启发.

02

tesseract-ocr 实现图片识别功能

http://blog.sina.com.cn/s/blog_56d988430102w37c.html

01

零基础快速搭建一个图像检索系统

随着计算机视觉领域的发展，图像识别已经被广泛应用在各个领域，比如在疫情期间各个住宅、办公场所出入口位置广泛使用的人脸识别系统等等。

02

迁移学习

机器视觉领域的问题通常来说是个有很多参数的复杂问题，从零开始自己构造一个神经网络通常来说是非常消耗计算能力和时间的。我们可以站在巨人的肩膀上，用别人训练好的图像识别的卷积神经网络的结构和参数，只改造最后的几层全联接层，并训练这几层，就可以快速得到一个能解决我们问题的专用神经网络。这就是迁移学习的意思，即迁移别人现成的网络结构和参数，嫁接我们自己问题的分类器来训练。例如，当我们在研发一个新的图像识别分类器时（如识别猫的分类器），通常我们不需要从零开始训练一个猫的专用分类器，我们到GitHub下载别人开源的

06

智慧零售产业应用实战，30分钟上手的高精度商品识别

然而，相较更加普遍的人脸识别技术来说，商品识别在实际的产业应用中也面临着其独有的巨大挑战：

03

27.7K Star开源神器,前端开发要危险了?

01

Recorder︱一些图像识别初创公司产品及API搜集ing...

《HelloGitHub》第 66 期

这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等，涵盖多种编程语言 Python、Java、Go、C/C++、Swift...让你在短时间内感受到开源的魅力，对编程产生兴趣！

03

学界 | 最大规模数据集、最优图像识别准确率！Facebook利用hashtag解决训练数据难题

选自code.Facebook 作者：Dhruv Mahajana、Ross Girshick、Vignesh Ramanathan、Manohar Paluri、Laurens van der Maaten 机器之心编译参与：路、张倩人工标注数据需要耗费大量人力成本和时间，对模型训练数据集的规模扩大带来限制。Facebook 在图像识别方面的最新研究利用带有 hashtag 的大规模公共图像数据集解决了该问题，其最佳模型的性能超越了之前最优的模型。图像识别是 AI 研究的重要分支之一，也是 F

05

深度学习动手入门：GitHub上四个超棒的TensorFlow开源项目

问耕编译自 Source Dexter 量子位出品 | 公众号 QbitAI 作者简介：akshay pai，数据科学工程师，热爱研究机器学习问题。Source Dexter网站创办人。 TensorFlow是Google的开源深度学习库，你可以使用这个框架以及Python编程语言，构建大量基于机器学习的应用程序。而且还有很多人把TensorFlow构建的应用程序或者其他框架，开源发布到GitHub上。这次跟大家分享一些GitHub上令人惊奇的TensorFlow项目，你可以直接在你的应用中使用，或者

09

这三篇论文项目开源了！商汤TSD/南开大学SCNet/港中文SAN

近期开源的CV项目真不少，所以CVer的论文项目开源速递系列决定改成周更模式。不过当然前提是累计到3篇 Amusi觉得值得推荐的情况。

03

卷积神经网络如何进行图像识别的

在机器视觉的概念中，图像识别是指软件具有分辨图片中的人物、位置、物体、动作以及笔迹的能力。计算机可以应用机器视觉技巧，结合人工智能以及摄像机来进行图像识别。

02

微软对话语音识别再获突破，首次达到人类专业水平

1 新智元推荐1 来源：微软研究院AI头条【新智元导读】继 9月13日微软将对话语音识别错误率降至6.3%的记录后，前天再次宣布进一步将错误率降至 5.9%，首次达成与专业速记员持平且优于绝大多数人的表现。该成功归功于他们采用了一种神经语言模型，该模型在空间中被表现为连续的向量，计算机能通过该模型得知比如“fast”和“quick”是具有紧密联系的近义词。一个月前，2016年9月14日，微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率（word error rate

06

智慧工地AI视频分析系统

智慧工地AI视频分析系统通过python+opencv网络模型图像识别技术，智慧工地AI视频分析系统自动识别现场人员穿戴是否合规。本算法模型中用到opencv技术，OpenCV基于C++实现，同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API，结合了OpenCV C++API和Python语言的最佳特性。从第一个预览版本于2000年公开以来，目前已更新至OpenCV4.5.3。OpenCV可以在不同的系统平台上使用，包括Windows，Linux，OS，X，Android和iOS。基于CUDA和OpenCL的高速GPU操作接口也在积极开发中。完善的传统计算机视觉算法，涵盖主流的机器学习算法，同时添加了对深度学习的支持。

00

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

翻译 | Serene 编辑 | 阿司匹林出品 | 人工智能头条（公众号ID：AI_Thinker） 2017 年 7 月，最后一届 ImageNet 挑战赛落幕。为何对计算机视觉领域有着重要贡献的 ImageNet 挑战赛，会在 8 年后宣告终结？毕竟计算机系统在图像识别等任务上的准确率已经超过人类水平，每年一次突破性进展的时代也已经过去。近日，FAIR（Facebook AI Research）的 Ross Girshick 、何恺明等大神联手，在 ImageNet-1k 图像分类数据集上取得

04

全球最大开源大模型！马斯克正式开源Grok AI

本号已有原创文章290+篇，以软件工程为纲，DevOps为基，洞察研发效能全貌，涵盖从需求管理、应用/游戏开发、软件测试、发布部署到运营监控的完整流程。无论您是项目经理、产品经理、开发人员、测试人员，还是运维人员，在这里您都可以有所收获，同时深入理解其他角色的工作内容，共同助力DevOps的成功落地。欢迎关注，有任何问题可发送私信~

02

CVPR 2023 | 谷歌、MIT提出统一框架MAGE：表征学习超MAE，无监督图像生成超越 Latent Diffusion

在一篇 CVPR 2023 论文中，来自 MIT 和谷歌的研究人员提出了一种全新的框架MAGE，同时在图像识别和生成两大任务上实现了 SOTA。

04

构建增强现实移动应用程序的六款顶级工具

增强现实已经成为数字世界的新趋势，在Pokemon Go把它带入普通移动用户的生活引发热潮后，您就很难再碰到一个对此不熟悉的人了。尽管很多人认为AR只是一种用于娱乐的技术，但是，事实上，它在多个行业（如医疗保健、电子商务、建筑等等）有着广泛的应用。本文准备打破这种刻板的印象。

01

开源深度学习工具 Kur，不用写代码就能设计、训练和评估 DL 模型

Deepgram 是 YC 投资的一家初创公司，其业务是使用机器学习分析企业的音频数据。近日该公司开源了内部的深度学习工具 Kur（https://github.com/deepgram/kur）。该工具能够进一步帮助那些对音频分析感兴趣的人实现他们的想法。开源内容还包括10个小时的已转录音频，以10秒的片段拼接，目的是加快训练过程。 Kur 与 Keras 相似，但 Kur 进一步节略了建立和训练深度学习模型的过程。通过使深度学习更容易实现，Kur 进一步使图像识别和语音分析更容易进行。 Deepgram

07

TensorFlow 全网最全学习资料汇总之TensorFlow的技术应用【4】

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿，邮件发送至：zhangxian@leiphone.com 随着谷歌2015年发布开源人工系统TensorFlow，让本就如火如荼的深度学习再添一把火，截至现在，TensorFlow已经历了多个版本演进，功能不断完善，AI开发者也能灵活自如的运用TensorFlow解决一些实际问题，下面雷锋网会对一些比较实用的TensorFlow应用做相关整理，让大家对TensorFlow有理性和感性的双层认知。 Tensor

07

收集的网络上大型的开源图像处理软件代码（提供下载链接)

要写好一个图像处理软件，仅靠自己看书是完全不够的，要多方面学习，借鉴前人的经验，要集思广益、多面出击。如今网络发达，图像学的资料其实也到处都是。只是往往个人能力或精力有限，在短时间内无法找到那些也许藏于角落里的金子。本人研究图像至今也历时7年，在慢慢的摸索和累积中也找到了一些相关资料，共享给大家学习。

03

音视频技术开发周刊 | 265

每周一期，纵览音视频技术领域的干货。新闻投稿：contribute@livevideostack.com。 ---- LiveVideoStackCon 2022 北京站祝您国庆快乐！ ⏰ 活动时间：2022年11月4-5日 🌏 活动地点：北京丽亭华苑酒店音视频开发之旅（30) -音视频基础知识从这篇开始我们进入FFmpeg系列的学习实践，作为开篇，我们先来了解下音视频相关的基础知识。 Android FFmpeg系列08--seek和精准seek seek功能的基本实现是比较简单的，不过要做到

03

蔬菜识别系统Python+TensorFlow+Django网页界面+卷积网络算法+深度学习模型

蔬菜识别系统，使用Python作为主要开发语言，基于深度学习TensorFlow框架，搭建卷积神经网络算法。并通过对数据集进行训练，最后得到一个识别精度较高的模型。并基于Django框架，开发网页端操作平台，实现用户上传一张图片识别其名称。

02

用Keras+TensorFlow，实现ImageNet数据集日常对象的识别

王新民编译自 Deep Learning Sandbox博客量子位出品 | 公众号 QbitAI 在计算机视觉领域里，有3个最受欢迎且影响非常大的学术竞赛：ImageNet ILSVRC（大规模

08

九大深度学习框架

开源的深度学习神经网络正步入成熟，而现在有许多框架具备为个性化方案提供先进的机器学习和人工智能的能力。那么如何决定哪个开源框架最适合你呢？本文试图通过对比深度学习各大框架的优缺点，从而为各位读者提供一个参考。你最看好哪个深度学习框架呢？现在的许多机器学习框架都可以在图像识别、手写识别、视频识别、语音识别、目标识别和自然语言处理等许多领域大展身手，但却并没有一个完美的深度神经网络能解决你的所有业务问题。所以，本文希望下面的图表和讲解能够提供直观方法，帮助读者解决业务问题。下图总结了在 GitHub 中最受

06

【干货】快速上手图像识别：用TensorFlow API实现图像分类实例

【导读】1月17日，Arduino社区的编辑SAGAR SHARMA发布一篇基于TensorFlow API的图像识别实例教程。作者通过TensorFlow API快捷地实现一个命令行图像分类例子，详

07

Facebook AI 野心与LeCun的小目标：拥有类人智能的对话助理

【新智元导读】不同于以往的“深度好文”，这篇描写 Facebook AI发展的文章不仅仅聚焦在机器学习技术，更多地强调各种先进的机器学习模型与Facebook 本身的基础架构、大规模部署和产品管道之间的配合，并强调硬件的支撑能力。对于公司来说，得应用者才能得天下，文章列举了 Facebook 从2012年来在图像识别和视频识别等方面的技术应用，强调AI 技术的发展中学术实验与产业应用之间存在显著差异。不管是扎克伯格还是Yann LeCun，他们的目标都是打造具有类似人类智力的对话代理，AI 毫无疑问是F

06

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭