我需要使用张量流来构建一个图像分类模型,但是在我的数据集中,我的10000类、和每个类只有5图像。
我知道5的图像数量太少,理想情况下每个类至少应该有100个图像,但此时我不明白某些“人脸识别”模型是如何工作的。
例如,所有的现代智能手机都提供了一个“人脸识别”功能,它可以在世界上所有的面孔中识别手机的主人,而且设置非常容易,只需要对用户的脸进行快速射击(3到5秒)。
那么,为什么这种方法可以工作,而图像分类模型却需要大量的图像才能达到可接受的精度?
这些模型是在幕后使用不同的技术建立的吗?
是否有可能使用智能手机用于“人脸识别”的技术建立“图像分类”模型?
发布于 2021-04-12 09:25:41
智能手机人脸识别系统():你的智能手机人脸识别系统所做的就是在你的脸上识别特定的关键特征,比如S
。因此,如果是一个新面孔,它要么说“是的这个脸与S
匹配”,要么说“不,这个脸与S
不匹配”。因此,正如您所看到的,您所需要的只是少量的面部样本来识别这个良好的集合S
。当它看到一个新面孔时,它所要做的就是从新面孔中获取这些关键特性,并将其与S
进行比较,最后说“是”或“否”。它不一定要说,它是你的脸,你的父亲的脸,你的母亲的脸等等,它所要说的只是“是的,它匹配”或“不,它不匹配”。
图像分类:然而,图像分类是一个完全不同的任务,它必须将每个图像分类为一个类。为了识别图像是否是猫,它必须提取某些关键特征,以区别于其他动物。因此,如果你有100个这样不同的动物,你需要100套这样的可区分的关键特征。这就是为什么每个类都需要大量的样本,以便图像分类系统能够识别每个类的关键特征集。
如何识别关键的特征是一个完全不同的球类游戏。它可以使用经典的图像处理技术(如SIFT、SURF等),也可以使用深度学习技术(如can、自动编码器等)。
https://stackoverflow.com/questions/66886608
复制相似问题