我使用的是一个人体姿态估计模型,它可以生成形状为[p k h w]的姿态热图,其中p是帧中的人数,k是关键点的数目(如头部、手等)。休息是高度和宽度。我使用numpy.save将这个numpy保存到磁盘上,一切看起来都很好。我运行这个模型的大约15K视频(约100万帧,总数),我发现在某些情况下(仅10-15帧的百万)保存的文件有一个形状类似[0 17 96 72]。在我看来,如果帧中没有人,热图数组就应该是0,<e
因此,我们基本上需要不断地从网络摄像头捕获位图图像,以便我们可以将所有这些帧作为“流”传递给我们的应用程序。
访问网络摄像头并直接从网络摄像头读取单个图像的实际帧的最佳且最简单的方法是什么?有许多库允许用户访问网络摄像头,在窗口面板上预览网络摄像头的内容,然后使用屏幕捕获功能再次捕获此图像。不幸的是,当我们每秒捕获25帧时,这不会给我们带来必要的性能。IVMRWindowlessControl9 C