00:00
本次和大家分享一个图片视频内容识别分析软件,它可以对你图片视频选中的区域内容进行分析总结。然后输出这个物体的详细描述结果我制作了最新版的免安装一键启动整合包,首先将网盘内的软件压缩包下载到本地电脑上,然后解压到当前文件夹。双击启动软件,软件主要有两种启动模式,一个是启动图片处理功能,另一个是启动视频处理功能。我们先以这个图片处理为例,点击按钮启动文件,第一次启动的时候会自动下载模型文件,一般速度都比较快,稍等一会儿就可以。软件成功启动后,会自动打开外部UI界面,软件功能比较简单,就是在这里先上传一张图片,点击这个描述按钮就可以了。我们先以下面这个示例图片为例点击它,然后再点击这个地方的画笔。
01:03
然后再画出你想要处理的,想要识别的这个区域,然后点击下面的描述按钮,软件识别出了这个整体的区域。并给出了这个描述内容,你在这里随便圈了其中的一部分,软件就会识别出这个完整的这个物体,然后并进行描述,描述结果是英文的,我们可以复制一下,看一下结果,我们把这个描述词复制到翻译里面看一下它中文内容是一只中型犬,有厚厚的红棕色皮毛,爪子上有白色的斑纹。带着红色项圈,还有这些,这个就是识别后的内容,对这个图描述基本上是正确的,而且这个描述的也比较详细。不光外貌,还有这个动作,动作也是识别的比较准确,比如说你想识别某一个区域。而不是这个一整个整体,那么你选中这个区域之后呢,你就勾选这个,勾选这个选项之后呢,它就不会自动覆盖到这个整体,而只识别你选中的这个区域,下面是描述词2则,就是你想要对这个所框选的这个区域想要得到什么样的内容,比如说你选中这个区域之后。
02:23
你说你想要让他描述一下这个物体,那它就会像刚才那样给你一个完整的描述,你也可以使用中文输入,他回答的内容就是中文的。比如说我问他这只狗狗是什么颜色,它回答是一只橘红色柯基。注意你在这里输入描述词的时候,前面必须要带这个image,这个标签必须要有这个就是说你不需要必须用英文输入了,这地方对其他语言的人来说还是比较友好的,算是比较智能化的吧。我们再换一张图片试试,我们选中这些熊的区域保温,问他这是什么,是什么,这是我们问他这是什么熊,看他能不能给出结果,他说这幅图片中是一只大熊和它的幼崽,回答的比较笼统,我们再换一张图片试试。
03:18
我们选择这个橘猫这一部分,我问他描述一下图片内容,你看一下,这次我用中文提问,他用的是英文回答。看下这个结果还是有一定的随机性,我们再重新生成一下试试看看。我刚才又试了,直接输入中文的话,它有时候还是会回答英文,但是你最好加上一个用中文回答的话,他这里就会用中文回答你了。把要求写在这个描述词里面就可以了。图片识别的话,效果就是这样的了,我们再看一下视频处理,关闭它。点击启动视频描述,第一次启动的话也是会需要下载模型文件的,不过速度都比较快,这个也不需要太长时间,模型下载完成之后也自动打开了web UI界面,这个视频识别也是比较简单,直接在这里上传视频。
04:15
需要是MP4格式的视频,我们先以这个事例素材为例,点击它。然后点击导入第一帧,提取出这个视频画面的第一帧,然后在这里选择这个画笔,然后选择想要识别的这个区域,然后点击这个描述按钮识别出的结果。同样是用英文回答你的,我们看一下这个识别内容,复制一下,我们把它放到这个翻译里面看一下,识别内容呢,就是一辆时尚的白色SUV,识别结果对这个物体进行了详细的描述,包括这个物体的外观,还有它是否运动。还有这个物体的特点啊等等,描述的非常详细,注意这个视频描述呢,它只能描述在第一帧画面中出现的内容,必须物体出现在第一帧画面才行。这个视频描述就更简单了,就是导入视频提取帧,然后描述这个没有输入描述此内容的那个功能,直接就是描述给你结果了。
05:20
它的这个软件效果就是这样的,软件主要用于对一些图片、视频,其中的一些物体进行的描述,然后识别。大家有需要的话可以自行下载测试一下。
我来说两句