前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >咔嚓,又涨见识了

咔嚓,又涨见识了

作者头像
纯洁的微笑
发布2023-01-05 20:10:21
4010
发布2023-01-05 20:10:21
举报
文章被收录于专栏:纯洁的微笑纯洁的微笑

要不是我早有准备,这次可...

1

如何送礼物?

大家好,我是微笑。

这两天有一件事,着实让我头疼,而且这个事情每年都会来一次,我给它起了一个名字叫做:年发生日综合症

估计我很多老读者,也都有这个症状,说人话就是,每年过生日怎么给老婆送礼物?

经过我多年的实践,发现有一个礼物百送不厌,那就是口红,但是怎么选择适合的口红却是一个难题。

通过之前对老婆买口红的观察,得出选口红的最关键的因素是,找到口红和肤色之间的关系,即什么样的肤色适合什么色系的口红。

对于程序员直男来说,最高效便捷的方式是,能够把口红颜色和肤色信息从试色视频中挨个提取出来,找到肤色相近的人都在用什么样的口红。

就可以让大数据帮忙做购买决策,以找到最合适的口红颜色。

从头开始搭建可太麻烦了,我得找一个支持用图片搜图片,图片搜视频的神器,最好使用起来还很简单。

经过我一番好找,终于找到这个神器 Jina,不需要掌握大量的专业知识和编程技能,这个框架为你提供好了实现复杂模型的简单方式,直接拿来用就行了。

2

多模态 MLOps 框架 Jina

要实现这个想法,其中最关键的条件之一就是以图搜图,读取图片/视频中的口红信息,找出最佳的口红颜色和产品。

作为程序员们,大家应该都了解,我们身边 80%~90% 的数据,都属于非结构化数据。

像图片、视频、音频、PDF 等等,目前解决非结构数据的搜索,一般都要使用深度学习模型来完成。

我查了很多资料,目前市面上解决方案有一些,但其中比较容易上手、功能强大又齐全的好像就只有 Jina 了。

用 Jina 几乎可以搜索任何内容形式(例如文本,图像,视频,音频,3D 模型等等)。

简单来讲,Jina 是一款主打易用性的多模态 MLOps 框架,将深度学习向量索引结合起来,提供了全链路的解决方案,哪怕不懂 AI,用 Jina 也可以快速地构建和部署多模态应用。

在找解决方案时,发现他们官方公众号提供了很多案例,包括[用文字搜索视频][90行代码用声音生成图片]等等,最重要的其中还有一个[口红搜索引擎],可以沿用部分思路,对解决问题起了很大的帮助。

大家如果感兴趣,也可以关注 Jina AI 后阅读。

接下来就和大家聊聊,(程序员直男的)我是怎么使用 Jina 全家桶,来一键解决给老婆选口红的事情。

3

果然很酷

首先使用 Jina 全家桶中提供的 DocArray 设计原型。

DocArray 能够将非结构化数据,统一成同一种数据结构,就是我们用的图片、视频都可以放进去,而且处理、传输、存储和搜索的工具都已经封装好了,开发起来很爽。

使用了 CLIP as service 做为向量服务,来处理相关的图片分类信息。

然后通过 Jina 把算法的每一步,分别拆解到一个个 Executor 执行器之中;再使用 Flow 将多个 Executor 串联起来。

这里稍微解释一下:

Executor 对应 Jina 的算法单元,实现对数据处理的核心功能。 Flow 将多个 Executor 连接起来,构建成一套完整的搜索系统。

用 Jina 搭建这一套以图搜图的口红搜索大概花了我两天,但根据我以往的经验,模型的调优往往要花我 1-2 周甚至更长时间。

但如果你使用的是 Jina ,那就完全不用太担心这个问题了,因为 Jina 全家桶还提供了一个工具 Finetuner。

利用 Finetuner,只需一行代码,即可解决模型调优问题,提升预训练模型的性能,节省我们大量的时间。

最后实现的效果,就是下图这个样子了。

只需要上传一张包含老婆的全脸的照片,系统就会自动帮你检索查询出,最适合的口红产品出来。

是不是感觉很酷呀。

全家桶

经过上面使用案例,大家估计对 Jina 有了一点了解,接下来我给大家详细介绍一下,案例中使用的几个开源产品。

Jina 是搭建多模态、跨模态应用的 MLOps 框架,将深度学习和向量索引结合起来,提供了全链路的解决方案。

开源地址:https://github.com/jina-ai/jina (16.9K Star)

DocArray 能够将非结构化数据,统一成同一种数据结构,可以让多模态的数据存储、流转难题迎刃而解

作为生态位的最底层,DocArray 可以高效地处理、检索、推荐、存储及传输数据,非常便于大型项目的构建。

开源地址:https://github.com/docarray/docarray (1.5K Star)

如果涉及到文本和图片的处理,可以直接用 CLIP-as-service 做为向量服务。

开源地址:https://github.com/jina-ai/clip-as-service (11.1K Star)

最后如果要对系统进行调优,使用工具 Finetuner 就对了。

Finetuner 针对神经搜索的模型微调工具,封装了不同深度学习框架的模型、损失函数和训练过程。

让开发者只需要进行简单的操作,即可一步完成模型调优,大大节省了研发时间。

开源地址:https://github.com/jina-ai/finetuner (759 Star)

目前,Jina 已经在[开放智能问答][电商服装搜索][实时推荐系统][生成式 AI] 等多个领域有使用案例。

在未来,相信还会覆盖更多的场景。

5

最后

机器学习这个领域的发展实在是太快了,应用场景也越来深入,在快速发展的同时,也更深入到具体的使用场景中。

Jina 2020年发布,到现在 Github 上已经有 36K 关注量,可见其在行业影响力。

为什么 Jina 如此受欢迎?

一方面,可以让用户在短短几分钟内,创建一个由深度学习驱动的云原生搜索解决方案。

另一方面,Jina 有着超低的学习、使用门槛,几乎只要会 Python 就会用 Jina,上手贼快。

在我使用 Jina 的过程中,感觉 Jina 应用场景很多。

比如构建企业内部的 PDF 搜索系统,比如实现视频搜索,有时候在网上看到一段小视频,特别感兴趣却不知道来自哪部电影,有点干着急。

针对这样的需求场景,使用 Jina 全家桶的工具,可以非常容易实现(解决)这个问题。

我一直特别佩服这种纯粹做技术的公司。

一方面,技术人做技术创业本来就很少,而且技术的产品也会反哺到技术生态中。

另外一方面,他们做的事情真的很酷,又很有意义,大大降低了多模态应用的开发和使用门槛,更加速了包括神经搜索、生成式AI的多模态应用快速发展。

同时,技术人创业也是孤独的,特别是做开源项目,有时候需要我们程序员给予一点点的支持。

所以,推荐大家关注以下几个开源项目,因为关注也是对他们的一种支持,同时也扩展了我们的技术视野。

欢迎点亮Jina AI的repo!支持开源项目!

https://github.com/jina-ai

(复制链接至浏览器中打开,即可star)

后话:

媳妇看了我选礼物的方式,直言这选礼物的过程比礼物本身要高级太多了,虽然她看不懂.........(#^.^#)

也就这才能够是程序员独有的浪漫吧!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-12-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 纯洁的微笑 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档