首页
学习
活动
专区
圈层
工具
发布

利用机器学习探索食物配方:通过Word2Vec模型进行菜谱分析

又称分布式语义模型或语义向量空间或向量空间模型;这意味着在向量空间中对相似单词的向量进行分类或分组。它背后的想法相当简单:你应该通过它的同伴来认识一个单词。因此,有相似邻居的词,即。...食物的食谱数据集 让Word2Vec真正为您工作的秘密是在相关领域中拥有大量文本数据。在本教程中,我们将使用数据集,该数据集包含大约5000个不同烹饪方法和不同配料的食谱。...这绝对是有道理的。同样,所有的食材,如“鸡蛋”、“芒果”也都在眼前。 ? 接下来是什么? 上面的教程只讨论了食谱的配料部分。还有许多其他可以进一步实现的用例或探索想法。...下面是一些问题,我将尝试在后面的文章中构建并得到答案。 根据所提供的食材进行烹饪分类/预测 给定一个菜谱,从语料库中查找相似的菜谱 根据所提供的食材推荐食谱。 使用一组给定的配料,什么食谱可以准备。...总结 在识别文本中的信息时,抓住单词之间的意义和关系是非常重要的。这些嵌入为自然语言处理和机器学习中更复杂的任务和模型提供了基础。

2.4K20

家里有两只猫给挖坑,还有世界美食的诱惑,我就被无监督学习彻底收服了!

▌再来一次 作为这两只猫的主人,我难过的是,在将近 50 次的教学中,只有一个人注意到他们应该被分类为“猫1和猫2”。大多数时候答案都是“坐着和站着”或“有无木地板”,有时甚至是“丑猫对漂亮的猫”。...如下面显示,在我的分析中,我只使用了对应于烹饪和配料的列而忽略了其他列。...包含关于第一个和第二个主成分分析的所有12492份食谱的散点图 在绘制所有食谱的主成分散点图的过程中,因为许多数据点是重叠的,所以很难在数据中看到任何结构。...当我想到这些菜系时,我想到的是大和大胆的味道,所以这些菜系会被紧密地组合在一起,也是完全合理的。 读者可能会问的一个问题是,哪些特性(成分)与第一和第二主成分的联系最为紧密? 这可以在下图中看到。...所以,在超过12000个食谱的语料库中,菜品的类型(如甜点、汤、沙拉或酱料)可能比菜系的类型会有更强的关联。

96220
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    使用scikitlearn、NLTK、Docker、Flask和Heroku构建食谱推荐API

    在我的配料分析器中删除所有这些词效果非常好。 我们还想从我们的成分中去掉停用词。在NLP中,“停止词”是指一种语言中最常见的词。...NLTK为我们提供了一种简单的方法来删除(大部分)这些单词。 食材中还有一些对我们没用的词——这些词在食谱中很常见。例如,油在大多数食谱中都有使用,而且在食谱之间几乎没有区别。...当我们试图从配料表中删除这些“垃圾”词时,如果同一个词有不同的变体,会发生什么情况? 如果我们想去掉“pound”这个词的每一个出现,但是食谱中的配料却写着“pounds”怎么办?...,因此不能使用矩阵分解方法,如基于SVD和基于相关系数的方法。...例如,如果用户输入了大量的配料,而只有前半部分与食谱匹配,理论上,我们仍然应该得到一个很好的食谱匹配。在余弦相似性中,角度越小,余弦相似度越高:所以我们试图最大化这个分数。

    1.6K10

    Milvus 实战 | 基于 Milvus 的食谱检索系统

    配料:对由 word2vec 算法获得的预训练嵌入向量用双向 LSTM(由于配料列表是一个无序集,所以选择使用双向的 LSTM 模型,它同时考虑正向和逆向排序),这里 LSTM 对配料文本中的每个单词执行逻辑回归...在实现食谱检索时,首先会使用模型 im2recipe 将实物图片转化为向量,然后使用该图片向量在 Milvus 中检索出与其相似的食谱向量,并得到食谱向量的 id, 最后在 MySQL 中找到食谱向量...食谱检索 本步骤将实现使用图片向量在库中检索出对应食谱。使用上一步得到的图片向量在 Milvus 库中检索出与其相似的前 top_k 个相似的食谱向量及其对应的食谱 id。...这里使用余弦相似度来计算向量间的相似度。然后在 MySQL 中查询出前面得到的食谱 id 对应的食谱的具体信息,包括该食谱名称、配料、做法等。...结果展示 本项目的结果如下图所示,选择一张食物图像进行检索,右侧会显示本项目检索出的库中与该图像最相似的食谱。 Ingredients 下对应的是该食谱所需配料。

    1.4K10

    从十篇热门学术论文看计算机视觉的未来

    使用的数据集:通过搜索youtube,收集的特定说话者的手势数据集。总共有144小时的视频。...然后使用这些堆栈在坐标堆栈指定的位置处对身体纹理进行采样映射,并使用身体部位分配的堆栈所指定的权重来生成RGB图像。 此外,最后的身体部位分配的堆栈映射对应于背景概率。...模型精度:在许多基准数据集上的实验:在WIDER FACE和FDDB上的结果证明了DSFD(双重人脸检测器)相对于最先进的人脸检测器(如PyramidBox 和SRN)的优越性。...端到端可微分体系结构使我们能够使用计算廉价并且可靠的一阶导数来进行优化,从而使得将深度网络作为生成器(如:统计模型)或代价函数成为可能。 模型精度:在MICC数据集上网格的精度表征为点到面的距离。...MegaFace挑战中显示出最先进的性能。

    85330

    CVPR2019:PizzaGAN通过深度学习制作披萨

    披萨的组成 在尝试训练深度神经网络制作披萨之前,我们首先需要弄清楚制作披萨的流程。 像任何伟大的食谱一样,制作比萨饼的过程包括一系列有序的步骤。...因此,在输入火腿和蘑菇披萨时输出矢量的火腿和蘑菇元素设置为1.0,而其余元素设置为0.0。...识别比萨 PizzaGAN中Generator network包含披萨所有添加和删除配料。鉴别器(Discriminator) 将负责识别当前披萨上的配料。...给定比萨的输入图像,鉴别器网络预测一组多标签分类,输出向量的每个元素对应于特定的配料。 例如,在下图中,PizzaGAN鉴别器预测比萨图像具有意大利辣香肠,蘑菇和橄榄。...对应于那些配料的输出向量的元素在推断时被预测为1.0(或者高于用户设置阈值的某个值)。 GAN模型通常通过一起对Generator network和鉴别器进行训练。

    1.2K30

    AI炒菜、配料、开发新口味……人类终于可以只负责吃了?

    相对于学校食堂中数量有限的菜品识别,运用AI来识别食谱就困难许多。 人工智能想要成功分析食谱,必须先弄清楚图片中是什么食物;再推断出食材和配料的加工过程。但现有的AI在第一关就被卡住了。...缺点是当资料库中不存在查询目标的匹配菜谱时,这些系统就会失效。 针对这个不足,Facebook研究团队转换了思考方向,将图像到食谱问题公式化为条件生成问题。...由于人类品尝食物时所产生的口感多半来自嗅觉,一位米其林三星大厨曾提出假说:如果两种食物的气味组成越相似,他们就应该越容易被搭配成一道成功的菜肴。...利用机器学习技术,自动获取不同地区的消费者在社交网络中关于菜色和潮品口感的讨论,以及大厨们放在网上的食谱。...这款口味集合了Firmenich独特的配料和“SmartProteins”在植物蛋白替代品方面的专业知识。旨在满足客户对替代蛋白质的需求,并在一系列蛋白质基础上发挥作用。

    1K30

    中了数据可视化的毒:BBC如何使用R语言绘制数据图表?

    下一步是将这些解决方案集中于一处,以提供一致的体验以及让所有一切都能尽可能简单地复用——这就是 bbplot。 之前我们讨论了需要加入到该软件包中的功能。我们是否应该创建制作特定图表类型的函数?...我们的想法是,每当数据团队的成员解决一个特定问题时(比如在图中加入一条曲线箭头或突出显示条形图的一条),都能将代码加入到这个「食谱」中,从而节省你和同事下一次的时间。 ?...在创建图表时,团队成员可以求助这个「食谱」,寻找答案和解决方案——比如如何绘制特定类型的图表(如 dumbbell chart)或如何在你的图中加入文本注释。...我们的重点是创建一个可重复的工作流程,这意味着我们无需在另一个程序中进行最后的润色,就能完全使用 R 创建出尽可能多的图表,而且将我们的知识集中到一起能让这些知识轻松地传递给不太习惯使用 R 的团队成员...在课程结束时,他们会面临一个挑战:用他们学习到的所有不同的技能、概念和代码,基于原始数据生成基本图表。 ?

    2.3K40

    Alexa AI在ICASSP 2022上的自然语言理解研究

    传统机器学习方法处理食谱检索时遇到的问题是,顾客与食谱交互的数据噪声大且稀疏。...在《ADVIN:从用户文本话语中自动发现新领域和新意图》中,研究人员分三个阶段解决了对先前未见过的领域和意图进行分类的问题。在第一阶段,模型仅识别出数据集中包含不熟悉的意图。...该模型使用已知意图的标注数据以及公开可用的、标注的领域外话语(作为具有未知意图的未标注数据的替代)进行训练。在第二阶段,另一个模型根据语义内容对标注和未标注的话语进行聚类。...食谱检索《基于请求的食谱推荐的对比知识图谱注意力网络》也解决了个性化问题,尽管是在食谱推荐这一特定背景下——例如,当顾客说“给我看看鸡胸肉的食谱”时,决定返回哪些食谱。...研究人员首先构建一个食谱图谱,其中每个节点是一个食谱,如果食谱属于同一菜系类型、共享配料、包含相关关键词等,则它们共享边。接下来,他们将代表顾客的节点添加到图谱中。

    13610

    【深度学习】吃得满意又健康?AI 营养师比人类营养师更懂你

    关键词:饮食推荐 营养均衡 推荐系统 在健康饮食方面,现代人对养生、专家推荐、最全食谱这些关键词,有着超乎想象的热忱。...在本项研究中,研究团队则提出个性化食物推荐,并将其视为对食物知识图谱(Knowledge Graph,简称 KG)的受限问题的回答,从而设法用统一的方式解决上述问题。...对于不同用户,系统会进行不同的需求分析 具体来说,pFoodReQ 系统会按照用户的问题,比如「一顿包含面包的好早餐是什么?」,然后从 KG 中检索满足这一查询条件的所有食谱。...再对这些食谱中的成分进行适用度评分,最后推荐评分排名最高的几份食谱。 ?...据调查,在日本,每 300 人就配备一个营养师;在美国,每 4000 人配备一个营养师;而在中国,每 40 多万人才有一个营养师。

    2.8K20

    谷歌AI Agent白皮书:2025年AI智能体时代来临

    模型可以是一般用途、多模态或根据您特定Agent架构的需求进行微调的。 为了获得最佳生产结果,你应该利用最适合你所期望的应用程序的模型,并且最好是在使用计划用于认知架构中的工具的数据签名上进行了训练。...一种方法是实施自定义代码,该代码会处理传入的用户查询、解析查询以获取相关信息,并然后调用API。 例如,在航班预订使用案例中,用户可能会说“我想从奥斯汀预订到苏黎世的航班。”...图5:Agent、扩展和API之间的一对一关系 想想软件开发人员在解决和解决方案时如何决定使用哪个API端点。...未结构化的数据,如HTML、PDF、TXT等格式。 图12:Agent和数据存储之间的一对多关系,可以表示各种类型的预索引数据 每个用户请求和Agent响应循环的底层过程通常如图13所示进行建模。...现在让我们想象一下我们的厨师在一个厨房里,这个厨房有一个装满各种配料和食谱(示例和工具)的储藏室(外部数据存储)。现在厨师可以动态地从储藏室中选择配料和食谱,并更好地与客户的配方和偏好保持一致。

    5.2K11

    图机器学习入门:基本概念介绍

    完全图通常用于理解图论中的一些复杂问题(连通性例子等)。 图的最大密度是一个完全图中可能关系的总数。...自循环 图的节点是可以连接到自己的,所以必须在计算总边数时添加自循环 你也可以有一个多图,一个对节点有多条边 多重图 含有平行边的图称为多重图,或者说一个对节点有多条边 上面就是一些常见的图和表示方式,...知道图是连通的还是不连通的是很重要的,有些算法很难处理不连通的图。 这可以在邻接矩阵中显示,其中不同的组件被写成对角线块(非零元素被限制在平方矩阵中)。...有许多这样的例子:作者到论文(作者位于 U 集合,并且他们与他们撰写的论文即 V 集合相连)、演员(U)和他们参演的电影(V)、用户和产品、食谱和配料等。...图还可以简洁地描述数据的许多属性,并为我们提供关于不同主题之间关系的信息。例如,我们可以为节点和边分配权重和属性。在以后的文章中,我们将讨论如何在这些网络中使用算法(以及如何表示它们)。

    70910

    入门 | 做数据科学如烤蛋糕?不服来看

    将数据视为配料、数据预处理视为食谱、机器学习算法视为烤箱、最终结果视为蛋糕。蛋糕的美味程度取决于原料的质量、食谱和烤箱温度设置。同样地,数据的质量非常重要,你采用的方法也是如此。 ?...有大量不同的算法可以帮助你进行数据清理和预处理。训练模型的数据会极大地影响模型性能。就像食谱决定蛋糕的味道。 数据集类型 数据集是以适当格式收集所有示例的集合。...通过的标准取决于你的需求。通常 80% 的通过率是可以达到的。 如果模型在第一次尝试中失败,不要失望,因为在最初的尝试中失败是很正常的。...这是因为开始时你总是使用较简单的方法,然后根据测试得分,逐渐增加解决方案的复杂性。但在此之前,请重新评估你的数据集以及它的预处理方式。重复此过程,直到模型通过测试。 ?...我最近开始了数据科学家的职业生涯。我觉得每个人——即使没有技术背景——都应该了解数据科学的基础知识。但是,大多数数据科学文章都充斥着技术术语,让外行人读起来佶屈聱牙,希望这篇文章能对你有所帮助。

    65531

    入门 | 做数据科学如烤蛋糕?不服来看

    将数据视为配料、数据预处理视为食谱、机器学习算法视为烤箱、最终结果视为蛋糕。蛋糕的美味程度取决于原料的质量、食谱和烤箱温度设置。同样地,数据的质量非常重要,你采用的方法也是如此。 ?...有大量不同的算法可以帮助你进行数据清理和预处理。训练模型的数据会极大地影响模型性能。就像食谱决定蛋糕的味道。 数据集类型 数据集是以适当格式收集所有示例的集合。...通过的标准取决于你的需求。通常 80% 的通过率是可以达到的。 如果模型在第一次尝试中失败,不要失望,因为在最初的尝试中失败是很正常的。...这是因为开始时你总是使用较简单的方法,然后根据测试得分,逐渐增加解决方案的复杂性。但在此之前,请重新评估你的数据集以及它的预处理方式。重复此过程,直到模型通过测试。 ?...我最近开始了数据科学家的职业生涯。我觉得每个人——即使没有技术背景——都应该了解数据科学的基础知识。但是,大多数数据科学文章都充斥着技术术语,让外行人读起来佶屈聱牙,希望这篇文章能对你有所帮助。 ?

    68920

    切块、清洗、烹饪:RAG知识库构建的三步曲

    想象一下,你有一位朋友叫小明,他是一个"人肉搜索引擎": "小明啊,我想知道去年公司年会的预算是多少?" 小明翻开一堆文件,快速找到了答案:"是38.5万元,在第三季度财报的第17页。"...,就放在一起(保持味道融合)如果放不下,就完成当前盘子,开始新盘子别忘了处理最后一盘(可能还有剩余食材)呈上所有盘子(返回所有文本块)⚡ 秘诀:好的分块就像好的分菜——每一份都应该是一个完整的味觉体验,...当我们在块与块之间设置重叠,就像是让相邻的两盘菜共享一些共同的配料,确保在从一道菜过渡到另一道菜时不会有突兀的味道转变。...图5:知识库的分层架构 有次我做了一个知识库,把所有文本都塞进一个大文件里,结果查询时系统差点崩溃。这就像把所有食材都放在一个大锅里煮,最后得到的不是美食,而是灾难。...在RAG系统中,元数据让我们能够更精确地检索和过滤信息:「菜品标签示例」 菜名:2023年财务报告 ‍ 主厨:财务部 张三 ️ 制作日期:2023-12-31 所属餐区:财务 食用限制:内部 ️ 关键配料

    58120

    Facebook 正在研究新型 AI 系统,以自我视角与世界进行交互

    想象一下,你的 AR 设备准确地显示了如何在架子鼓课上握住鼓棒,知道你完成一个食谱;帮助你找到丢失的钥匙,或是像全息图一样在你的记忆中重现。...AI 可以通过检索过去以自我为中心的视频中的关键时刻来回答自由形式的问题并扩展个人记忆。 你可以问 AI 助手各种各样的问题,例如:我把孩子最喜欢的泰迪熊放哪儿了?...因此,当你在烹饪一份食谱时,AI 助手可以指导你需要哪些配料,需要先做什么,了解你已经做了什么,指导你完成每一个关键步骤。...随着人工智能对人们正常生活方式有了更深入的理解,它可以开始以前所未有的方式对交互体验进行情境化和个性化。...有了 Ego4D 的基准支持,配合上在全新数据集中的训练,AI 助手有可能以非常独特和有意义的方式提供很多的价值,例如,帮助回忆起最近与同事交谈中的关键信息,或者指导制作新的晚餐食谱,新的宜家家居等。

    52420

    「数据架构」什么是实体关系图(ERD)?

    当我们在ERD中谈到实体时,我们通常指的是业务对象,例如人员/角色(例如学生)、有形的业务对象(例如产品)、无形的业务对象(例如日志)等。“关系”是关于这些实体如何在系统中相互关联的。 ?...在确定实体时,将它们视为名词。在ER模型中,实体显示为圆角矩形,其名称位于顶部,其属性列在实体形状的主体中。下面的ERD示例显示了一个ER实体的示例。 ?...当在ERD中出现时,实体团队和玩家以一对多的关系相互连接。 在ER图中,基数表示为连接器两端的鱼尾纹。三种常见的基本关系是一对一、一对多和多对多。...多对多的基数的例子 多对多关系是指两个实体X和Y之间的关系,其中X可以链接到Y的多个实例,反之亦然。下图显示了一个多对多关系的示例。注意,在物理ERD中,多对多关系被分割为一对一对多关系。...由于物理ERD表示在特定DBMS中数据应该如何结构化和关联,因此考虑实际数据库系统的约定和限制是很重要的。确保DBMS支持列类型,并且在命名实体和列时不使用保留字。 物理数据模型示例 ?

    6.2K21

    利用 Coze 搭建专属 AI 厨师助手

    搭建一个自己的Ai Bot 3.1 构思 首先,我从自己的生活中发现了一些问题,其中之一就是我做的菜特别难吃。我对配料的把控不准确,也不熟悉不同菜品之间的搭配。...把菜做的香喷喷, 不仅仅只是自己吃上去美味开心, 而且也会受到家人朋友的夸赞 可以增加找女朋友的筹码 总结下来就是: 省钱, 健康, 受到夸奖, 提升自己 想到这么多的好处, 我想得去自己尝试做菜,...(更便于迭代),对 Bot 的约束更强。...当然我们默认使用的是云雀语言模型. 数据库功能提供了一种简单、高效的方式来管理和处理结构化数据,用户可通过自然语言插入和查询数据库中的数据,使用户可以便捷地与 Bot 进行交互。...这里当然选择了温柔甜妹 哈哈哈 3.4 调试厨师大神Bot 我们询问一下 土豆丝的制法: 咦, 有点混乱, 我想着以这样的形式进行展示 标题 食材以及配料 详细制作步骤 火候的控制 一些自己的建议 好,

    91011

    如何在 Core Data 中对 NSManagedObject 进行深拷贝

    我在开发 健康笔记[2] 新版本时也碰到了这个问题,需要深拷贝一个结构复杂、关系链牵涉大量数据的托管对象。考虑到以后可能还会遇到类似的情况,我决定编写一段使用简单、适用性广的代码方便自己使用。...例如: •上图中 Note 的 id 的类型为 UUID,在深拷贝时不应复制原来的内容而应该为新对象创建新的数据•Item 中的 NoteID 应该对应的是 Note 的 id,如何在复制过程中保持一致...逆向对多关系 上图中 Tag 同 Memo 之间是多对多(many-to-many)关系。当在一个关系链条上出现了逆向对多(Tag)的情况时,需特别谨慎处理。...沿着关系链向下,如果某个关系的逆向关系为对多,则无论正关系是对一还是对多,在深拷贝时都会形成一个尴尬的局面——逆向关系为对多的实体,服务于全部的正向关系树。...当我们从 Note 向下深拷贝到 Memo 时,如果继续对 Tag 进行复制,则会和 Tag 的设计初衷相违背。 解决方案为,当在关系链中碰到了逆向关系为对多的实体 A,则不再继续向下拷贝。

    2.6K20

    组合测试从理论到实践——从吃货的角度实现组合测试用例的自动设计

    在使用PICT时,需输入与测试用例相关的所有参数,以达到全面覆盖的效果。 PICT的使用相对简单,PICT是一个命令行工具,接受纯文本模型文件作为输入,并输入一系列测试用例。...面对因素之间存在约束关系的被测试应用,应该明确定义约束关系,让组合测试工具根据约束来生成有效的测试用例集。...因此我们需要在设计PICT输入模型时,加入约束限制,好在PICT工具很强大并在设计之初就考虑到了这点,以本文最开始的故事为例,除了多参数、多值以外,还存在着参数值之间的约束关系,修改我们在上文中的输入文本文件如下...当PICT读取模型文件时,它会解析约束规则,并将其应用于测试用例生成过程。生成的测试用例集既满足对有效取值组合的覆盖,又不包含无效取值组合。 执行PICT命令行,生成的食谱合理搭配如下: ?...例如,在如下代码中,if语句会“过滤”掉所有A的输入。 ? 如果不了解代码中的卫哨语句,可能会将输入定义为: ? 生成的输出中 ?

    3.8K111
    领券