如何进行姿态估计
姿态估计过程中有三个坐标系,分别为世界坐标系、相机坐标系和图像坐标系。...一个世界坐标系中的三维点(U,V,W)(U,V,W)通过旋转矩阵RR和平移向量tt映射到相机坐标系(X,Y,Z)(X,Y,Z),一个相机坐标系中的三维点(X,Y,Z)(X,Y,Z)通过相机的内参数矩阵映射到图像坐标系...(x,y)(x,y)。...比如面对第一个问题,你可以采用现有的大量landmark数据进行pose的估算,或者采用合成的方式来生成训练数据,比如300W-LP数据库;面对第二个问题,可以采用控制输入训练数据的分布,或者加权的方式来训练模型...;第二点,作者将对姿态的直接回归,转化成该数据分布和预先设定的锚点的一个期望,这里跟物体检测任务中引入anchor的机制很类似;第三,通过引入加权的loss来调整不同分布数据对网络训练的贡献。