我试验了许多不同的机器学习模型用于姿态估计。它们中的大多数输出图像中被检测的人(S)的热图和偏移量。我非常喜欢多姿态估计模型这里的性能/精度。
接下来我要做的是创建一个类似于这个模型的模型,但它应该标明探测到的人(S)的每一个姿势。有多个不同的实现可供选择--caffe/py火炬/tensorflow。我考虑过如何处理这个问题,我想了几种不同的方法:
我想在这里选择阻力最小的路径,但我也关心收集/处理数据所需的时间,最重要的是模型的准确性/性能。是否有经验丰富的机器学习/数据科学家回答以下问题?
发布于 2020-02-17 12:06:05
我在一个类似的非目标检测problem.so中工作,我的建议是转移学习。
(1)最优的方法是使用transfer,learning.It允许我们在节省时间的way.With传输学习中建立精确的模型,而不是从头开始学习过程,而是从解决不同问题时学到的模式开始。这样,您就可以利用以前的经验教训,避免从头开始。
预训练模型是在大型基准数据集上训练以解决类似于我们想要解决的问题的模型。因此,由于训练这些模型的计算成本,从已发表的文献(例如VGG、Inception、MobileNet)中导入和使用模型是常见的做法。
在迁移学习中使用的几种预训练模型是基于大型卷积神经网络(CNN)的.
当您根据自己的需要重新定义一个经过预先训练的模型时,首先删除原始分类器,然后添加一个符合您的目的的新分类器,最后您必须根据以下三种策略之一对模型进行微调:
1.Train the model.
2.Train some layers and leave the frozen.
3.Freeze the convolutional base.
转移学习过程的方法:
1)Select a pre-trained model.
2)Classify your problem according to the Size-Similarity Matrix.
3)Fine-tune your model.
Tensorflow提供了一个名为PoseNet的视觉模型。
PoseNet是一种视觉模型,它可以通过估计人体关键关节的位置来估计人在图像或视频中的姿态。从这里你可以冻结模型和微调它。您可以使用其他预先训练过的图像模型(例如mobilenet、resnet)。
( iii)直接从原始图像中得到的估计首先要求您识别或检测人员,因此它会在另一个模型上进行中继。
https://datascience.stackexchange.com/questions/67673
复制相似问题