首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【干货】手把手教你用苹果Core ML和Swift开发人脸目标识别APP

Swift客户端将图像传到云存储,这会触发Firebase,在Node.js中发出预测请求,并将生成的预测图像和数据保存到云存储和Firestore中。...在我的实验中,因为只有一个标签,它总是1 在函数中,如果检测到Taylor,则使用detection_boxes在图像绘制一个框,给出判断分数。...将带有新框的图像保存到云存储,然后将图像的文件路径写入Cloud Firestore,以便在iOS应用程序中读取路径下载新图像(使用矩形): ? ?...最后,在我的iOS应用程序中,可以监听图像Firestore路径的更新。如果检测到,我会下载图像,并与检测分数一起显示在应用程序中。这个函数将替换上面第一个Swift代码片段中的注释: ?...此请求是由我的Swift应用上传到Firebase存储触发的。在我的函数中,我向Firestore写预测元数据。

14.7K60

如何用TensorFlow和Swift写个App识别霉霉?

为了给我们的照片生成边界框,我用了 Labelling,这是一个 Python 程序,能让你输入标签图像后为每个照片返回一个带边界框和相关标签的 xml 文件(我整个早上都趴在桌子忙活着用 Labelling...Taylor Swift 识别 我其实也可以在自己的笔记本训练模型,但这会很耗时间。...现在我们准备将模型部署到 ML Engine ,首先用 gcloud 创建你的模型: gcloud ml-engine models create tswift_detector 然后通过将模型指向你刚上传到...然后我将添加了边框的新照片保存至 Cloud Storage,写出照片到 Cloud Firestore 的文件路径,这样我就能读取路径,在 iOS 应用中下载新照片(带有识别框): const admin...下面就为你总结一下几个重要步骤: 预处理数据:收集目标的照片,用 Labelling 为照片添加标签,生成带边界框的 xml 文件。然后用脚本将标记后的图像转为 TFRecord 格式。

12.1K10
您找到你想要的搜索结果了吗?
是的
没有找到

骑上我心爱的小摩托,再挂上AI摄像头,去认识一下全城的垃圾!

我们选择Ionic+Angular进行前端开发和谷歌的Firestore坐标实时数据库。...Firebase客户端SDK包括一个通用的API,可用于订阅客户端应用程序,以添加/更新/删除 Firestore数据库运行在VespAI的应用程序产生的活动。...通过这种方式,我们的所有应用程序都可以在检测后几秒钟内显示数据。 谷歌地图目前支持两种不同的可视化: 热图和标记点。热度图可以快速查看区域中的垃圾分布情况,而标记点可以检查单个垃圾检测点的详细信息。...当我们累积越来越多的垃圾图像时,我们将用这些图像用于进一步训练,以逐步获得更精确的检测。 后端改进。...我们计划使用Firestore分布式计数来添加更多的实时统计信息,例如基于区域的每个垃圾类型的每日和每周统计信息。 同样在后端。

10.3K30

Flutter 2.8正式版发布了,还不来看看

由于它是首要的延迟瓶颈,所以 将默认字体管理的初始化延迟 到与首个 Dart isolate 同时运行,降低了启动的延迟,让上述的所有启动优化的表现更加明显。...选择此标签会显示你的应用启动的个人资料数据。...如果你正在使用 google_maps_flutter 插件或 video_player 插件的 Web 版本,或者你正在遵循 Flutter 团队关于 如何优化网络显示图像 的建议,那说明你已经在使用平台视图了...是响应性设计,因此在桌面浏览,它会是这样的效果: 用户可以使用邮箱地址和密码直接完成登陆,如果他们选择使用通过谷歌身份验证登陆,不论是在移动端、Web 端还是桌面端,则将会看到常见的 Google...诚然,我们正在为世界越来越多的开发人员构建 Flutter,但如果没有你和每位开发者的存在,我们也无法维护构建它。Flutter 社区与众不同,感谢你所做的一切

22.3K30

Cesium渲染一帧中用到的图形技术

与平视显示(HUD)相似,覆盖通道的命令最后执行。 ? Cesium当前的渲染管线。 排序和批处理 在每个视锥中,保证按图元返回命令的顺序执行命令。...例如,BillboardCollection在一个顶点缓冲区中存储尽可能多的布告板,使用相同的着色对其进行渲染。 拾取 Cesium使用颜色缓冲区实现拾取。...我们计划创建一个通用的后处理框架,将纹理作为输入,通过一个或多个后处理阶段运行它们,这些通道基本是在视口对齐的四边形运行的片段着色,然后输出一个或多个纹理。...计算通道 Cesium会使用老式的GPGPU来进行GPU加速的图像重投影,在该渲染过程中,它将渲染一个与屏幕视口对齐的四边形,以将重投影推向着色。...潜在的未来Cesium渲染管线(新阶段以粗体显示)。 致谢 我和Dan Bagnell编写了大多数Cesium渲染。要获得娱乐,请参阅我们的Cesium Wiki注释。

2.9K20

STM32使用硬件I2C读取SHTC3温湿度传感显示在0.96寸OLED屏

STM32使用硬件I2C读取SHTC3温湿度传感的数据显示在0.96寸OLED屏 我用的是STM32F103C8T6,程序用的是ST标准库写的。...当 I2C 设备空闲时会输出高阻态,而当所有设备都空闲,都输出高阻态时,由拉电阻把总线拉成高电平。 I2C通信时单片机GPIO口必须设置为开漏输出,否则可能会造成短路。...SHTC3温湿度传感 SHTC3数据手册下载地址:https://url.zeruns.tech/WpLDy 浏览数据手册可以得到一个大概信息,SHTC3是一个可以检测温度和湿度的传感, 温度范围...I2C_CheckEvent(I2Cx,I2C_EVENT_MASTER_BYTE_RECEIVED));//检测EV7事件 return I2C_ReceiveData(I2Cx);//读取数据返回...OLED_WriteCommand(0xD5); //设置显示时钟分频比/振荡频率 OLED_WriteCommand(0x80); OLED_WriteCommand(0xA8

1.1K30

这个机器人太牛了,陌生物体抓取识别成功率高达100%

他们开发了一种“未知物体”的抓取算法,使机器人能够评估一堆随机物体,确定在杂物中抓取或吸附物品的最佳方式,而不必在拾取物体之前了解物体。 一旦它成功抓住了一件物品,机器人将它从箱子中取出。...然后一组摄像机从不同角度拍摄物体图像借助新的图像匹配算法,机器人可以将拾取物体的图像与其他图像库进行比较以找到最接近的匹配。通过这种方式,机器人识别物体,然后将其放到在一个单独的箱中。...然而,Rodriguez正在努力将机器人设计成更灵活、适应性更强并且更智能的拾取,适用于零售仓库等非结构化环境,拾取每天会遇到数百个甚至上千个从未见过的新奇物品,通常还是在杂乱密集的环境中。...该团队已经通过一些技术实现这一目标,为机器人的抓手添加触觉传感通过新的培训体系运行系统。...Rodriguez说,“夹具现在具有触觉传感,并且我们启用了一个系统,机器人一整天都在不断地从一个地方拾取物品到另一个地方。

1.4K80

谷歌教机器人理解语义,像人一样学习复杂技能 | 附3篇论文

△ 人类演示(左)和机器人模仿(右) 在非常小的数据集的无监督学习是机器学习中最具挑战性的场景之一。 为了使这种学习可行,我们从ImageNet预训练过的大型图像识别神经网络中提取特征。...为了学习语义抓取,我们的机器人先像一项研究描述的那样,通过自主尝试拾取各种对象来收集大量数据。有了这些数据,机器人就能够拾取对象,但不能理解如何将它们与语义标签相关联。...然后,这些图像的一个子集由人类进行标注。由于图像中物体的姿势一致,很容易通过训练一个分类,来把这些标签添加到其他图像。...经过标注的图像会告诉机器人该拾取哪些物体,也能告诉机器人实际拾取了哪个对象。 用这个有标记的数据集,我们可以训练一个双流模型,根据当前图像和机器人的动作来预测哪些对象将被抓取。...未来的工作 我们的实验显示了有限的语义标签数据可以与机器人自动收集标记的数据相结合,以使机器人能够理解事件、对象类别和用户演示。

79290

学界 | 看一遍人类动作就能模仿,能理解语义的谷歌机器人登上无监督学习的新高度

左图:人类演示 右图:相应的机器人模拟 在非常小的数据集使用无监督学习是机器学习中最具挑战性的场景之一。...研究者使用这些功能来解释用户提供的演示,结果显示从几个演示中就可以以无监督的方式学习到奖励函数,而无需额外训练。 ?...然后,这些图像的中的一部分由人工进行标注。由于呈现的图像展示了物体在抓取姿态下的标准外观,因此很容易通过在标注的图片训练分类,将这些标签传递给剩余的未标注的图像。...然后标注过的表示图像即可以告诉机器人实际拾取了哪个物体。在此后机器人从箱子拾取物体时,可以将抓取时观察到的图像与标签联系到一起。...将来,机器人系统可以通过用户标注的数据和不断增加自主收集的数据集的组合进行训练,提高机器人能力,减轻设计自主机器人的工程负担。

1.2K80

可视化图表实现揭秘

可视化是利用计算机图形学和图像处理技术,将数据转换成图形或者图像在屏幕显示出来,再进行交互处理的理论、方法和技术。 数据可视化并不是简单的将数据变成图表,而是以数据为视角,看待世界。...2.5.1 Canvas 的拾取方案 绘制时 Canvas 不会保存绘制图形的信息,一旦绘制完成用户在浏览中其实是一个由无数像素点组成的图片,用户点击时无法从浏览自带的 API 获取点击到的图形。...2.5.1.1 使用缓存 Canvas 方案 使用缓存的 Canvas 来进行图形的拾取步骤如下: 在显示的 Canvas 绘制图形 在缓存(隐藏)的 Canvas 重新绘制一下所有的图形,使用图形的索引值作为图形的颜色来绘制图形...在显示的 Canvas 进行点击,获取缓存 Canvas 对应位置的像素点,将像素的颜色转换成数字,这个数字就是图形的索引值 优缺点 优点 实现简单,只需要将图形绘制两遍即可 拾取性能好,核心的拾取算法复杂度...Canvas 绘制的图形都是标准的几何图形,点、线、面的检测在几何算法中比较成熟,每个图形在绘制时都会给其生成一个包围盒保存,当拾取图形时可以直接使用数据运算检测。

1.1K10

基于视觉和惯性传感的移动机器人手遥操作系统

基于关键点的重建损失探索了人类和机器人手在外观和解剖结构的相似之处,丰富了重建图像的局部特征。穿戴式摄像机支架可实现同时的手臂控制,促进整个远程操作系统的移动性。...测试数据集的网络评估结果以及除简单的取放操作之外的各种复杂操作任务,显示了多模式遥操作系统的效率和稳定性。 1.研究问题 拟人化机械手的遥操作以执行灵巧操作仍是挑战。...网络结构如下图所示: 编码-解码模块:编码从各种角度拍摄人手IH的深度图像,并发现人手和机器人手之间的潜在特征Zpose。...为了显示来自机器人自身域的回归结果,研究中训练了一个模型Robotonly,该模型删除了Transteleop中的解码模块,仅提供了机器人手的图像。...为提供输入图像的空间变换功能,研究人员在Transteleop增加了STN网络。

61120

基于视觉和惯性传感的移动机器人手遥操作系统

基于关键点的重建损失探索了人类和机器人手在外观和解剖结构的相似之处,丰富了重建图像的局部特征。穿戴式摄像机支架可实现同时的手臂控制,促进整个远程操作系统的移动性。...测试数据集的网络评估结果以及除简单的取放操作之外的各种复杂操作任务,显示了多模式遥操作系统的效率和稳定性。 1.研究问题 拟人化机械手的遥操作以执行灵巧操作仍是挑战。...网络结构如下图所示: 编码-解码模块:编码从各种角度拍摄人手IH的深度图像,并发现人手和机器人手之间的潜在特征Zpose。...为了显示来自机器人自身域的回归结果,研究中训练了一个模型Robotonly,该模型删除了Transteleop中的解码模块,仅提供了机器人手的图像。...为提供输入图像的空间变换功能,研究人员在Transteleop增加了STN网络。

58820

1小时学会走路,10分钟学会翻身,世界模型让机器人迅速掌握多项技能

3、视觉拾取和放置。研究者训练机械臂从稀疏奖励中学会拾取和放置对象,这需要从像素定位对象并将图像与本体感受输入融合。此处学习到的行为优于无模型智能体,接近人类表现。 ‍4、开源。...这可以在单个 GPU 以 16K 的批大小进行大规模并行行为学习,类似于专门的现代模拟 (Makoviychuk et al., 2021)。...这些实验代表了常见的机器人任务,例如运动、操纵和导航,带来了各种各样的挑战,包括连续和离散的动作、密集和稀疏的奖励、本体感受和图像观察,以及传感融合。 ...Sphero 导航 此外,研究者还在视觉导航任务评估了 Dreamer,该任务需要将轮式机器人操纵到固定目标位置,仅给定 RGB 图像作为输入。...鉴于机器人是对称的,并且机器人只能获得图像观察,它必须从观察历史中推断出航向。 2 小时内,Dreamer 学会了快速且始终如一地导航到目标,保持在目标附近。

76530

MIT突破:自我监督系统DON,机器人可在检查随机物体后理解它们拾取

几十年来,装配线等受控环境中的机器人能够一次又一次地拾取同一物体。最近,计算机视觉的突破使机器人能够在物体之间进行基本区分。...尽管如此,系统并没有真正理解物体的形状,因此机器人在快速拾取后几乎没什么用了。...想象一下,给系统一个整洁的房子的图像,让你在工作时清洁,或使用菜肴的图像,以便系统在你度假时把你的盘子放好。 还值得注意的是,没有一个数据实际被人类标记过。...然后,它可以将不同的点映射到一起,以显示对象的3D形状,类似于从多张照片拼接全景照片的方式。...在训练之后,如果一个人指定一个物体的一个点,机器人可以拍摄该物体的照片,识别和匹配点,然后能够在该指定点拾取物体。

58220

MIT推出拾物机器人「最强辅助」,少量训练样本即可实现自然语言控制

这样一来,在2D图像中构建的图像特征和语义数据,就能被三维的机器人理解使用了。 不仅操作简单,训练过程中需要的样本量也很小。...在基于开放性人工语言指令的任务,成功率在 60%。该结果没有经过人工选择 (cherry-picking),因此对特征场在零微调情境下的表现有客观的描述。...扫描过程会得到多个角度的RGB图像,同时得到图像特征。 利用NeRF技术,对这些图像做2D密度信息提取,投射到三维空间。...图像和密度特征的提取使用了如下的算法: 这样就得到了这一场景的3D特征场,可供机器人使用。 得到特征场之后,机器人还需要知道对不同的物体需要如何操作才能拾取。...自然语言控制的过程与一步骤十分相似。 首先会根据指令从CLIP数据集中找到特征信息,并在机器的知识库检索相似度最高的DEMO。 然后同样是对预测的姿势进行优化,以达到最高的相似度。

16930

我们弃用 Firebase 了

作者 | John Considine 译者 | 平川 策划 | 刘燕 我们已经在 Firebase 发布了 10 几款应用程序,几乎用到了该平台每个方面的特性,设计了一个可以实现优雅扩展的手册...事实,Firebase 有许多方面是我们喜欢的: 使用 Firestore,许多客户端状态管理方面的挑战都不复存在,特别是与数据新鲜度有关的问题。 免费就可拥有的实时体验。...Firestore 的文档 / 集合架构:它迫使人们仔细考虑数据建模。它还反映了一个直观的导航方案。 Firestore 中的关系数据也是如此。...云 Firestore 安全规则写起来很有趣,在考虑客户端 - 服务安全方面,这是一个可靠的模型。 开箱即用的身份验证很不错。(不过,在我们看来,其内置的 Firebase 邮件验证体验很糟糕)。...Supabase 最近,作为考察过程的一部分,我们在 Supabase 开发了一些小项目。其开发体验令人愉快,特别是行级安全,那与 Firestore 规则类似,但更为强大。

32.5K30

Material Design —卡片(Cards)

支持的手势 滑动(swipe) 拾取移动(Pick-up-and-move) 相关组件 网格列表(Grid lists) 对于开发者 Android卡片 聚合卡片(Polymer cards) ---...何时使用 显示以下内容时使用卡布局: ·作为一个集合,包含多种数据类型,如图像,视频和文本 ·不需要直接比较(用户不直接比较图像或文本) ·支持高度可变长度的内容,例如评论 ·包含可交互式内容,例如+1...按钮或评论 ·在网格列表中,但需要显示更多内容来补充图像 ?...但是,它们在卡内的大小和位置取决于图像是主要内容还是用于补充卡片的其他内容。 背景图像 当文字放置在纯色背景时,文字清晰度最高,且文字对比度足够高。 放置在图像背景的文本应该保留文本的易读性。...如果用户对集合内的卡进行分类很重要,则可以使用拾取移动手势(pick-up-and-move gesture)。但要考虑筛选或排序是否会更好地组织内容。

4.3K100

·CNN卷积神经网络原理分析

图 2.1 二维互相关运算 在二维互相关运算中,卷积窗口从输入数组的最左上方开始,按从左往右、从上往下的顺序,依次在输入数组滑动。...当卷积窗口滑动到某一位置时,窗口中的输入子数组与核数组按元素相乘求和,得到输出数组中相应位置的元素。...它接受输入数组X与核数组K,输出数组Y。...◆ 在第六个方块(水平计数)中,你可以看到模型正在拾取圆形形状 ◆ 此外,最后一个正方形正在拾取角落。 ? CNN的第3层 在第3层,我们可以看到模型开始学习更具体的东西。...第5层正在拾取对我们的狗和猫问题非常有用的铃声。它也拾取单轮脚踏车和鸟/爬行动物的眼睛。请注意,这些图像显示每层学习的一小部分内容。

69631
领券