我正在用我电脑上的摄像头构建一个类似iPhone的FaceID程序。我关注的是this notebook,它使用Kinect创建RGB-D图像。那么,我可以使用我的网络摄像头来捕捉几张用于相同目的的图像吗?
下面是如何预测Kinect图像中的人物。它使用.dat文件。
inp1 = create_input_rgbd(file1)
file1 = ('faceid_train/(2012-05-16)(154211)/011_1_d.dat')
inp2 = create_input_rgbd(file1)
model_final.predict([inp1, inp2])
发布于 2019-06-10 00:30:03
他们使用Kinect来创建RGB-D图像,而你想只使用RGB摄像头来做类似的事情吗?硬件方面,它们是不同的。所以不会有直接的方法
您必须首先仅使用单目图像来估计深度图。
好吧,你可以试着重温一下单一图像深度估计:使用精确的对象边界的更高分辨率的贴图,如下所示。得到的深度非常接近真实的地面事实。对于无生命危险的情况(如控制无人机或控制车),您可以随时使用它。
代码和模型可在以下位置获得
https://github.com/JunjH/Revisiting_Single_Depth_Estimation
编辑演示文件以执行单个图像检测。
image = you
deep_learned_fake_depth = model(image)
#Add your additional classification routing behind.
请注意,这种方法不能实时工作。因此,您只能在关键帧处执行此操作。人们通常使用特征跟踪技术来进行伪连续检测(这是一种常见的做法)。
还请注意,一些电话设备确实有一个小的深度估计传感器,您可以使用。细节我不是很确定,因为我在非常低的水平上处理android和ios。
https://stackoverflow.com/questions/56516217
复制相似问题