我想做图像分类。在我的数据集中,尽管图像特征是这种分类(颜色、形状等)的强大组成部分,但是如果不解释图像中的文本,那么中的某些类别的图像将很难被区分。
我不认为VertexAI/AutoML将使用预先训练的模型来促进分类,如果在某些情况下,唯一的区别是文本。我知道Google Vision/OCR有能力进行这样的提取。但是是否有一种方法来进行图像分类(VertexAI/AutoML),使用Google提取作为一种额外的图像特征
目前,我的项目使用了3种模型(没有google云):
我想切换到顶点AI,以下将提高我的项目质量如下:
如果确认AutoML不能很好地表现,如果某些图像类别仅在文本中不同,我将重新创建一个类似的三层模型使用顶点AI自定义培训脚本。我可以很容易地用VertexAI/AutoML创建模型1。然而,我不知道是否:
你能给我建议如何使用谷歌云平台来实现这个目标吗?
发布于 2022-01-10 18:10:59
为此,我建议你如下:
1.模型2:
GCS
中。{"gcs":"gs://path_to_image/image_1","text":["text1"...]}
。1.模型3:
"text"
字段为空{"gcs":"gs://path_to_image/image_2","text":[]}
的数据集。您自己的脚本可以排除带有文本的数据,并为模型2生成数据集,为模型1生成数据集。我看到你们的模型2和3并不是严格的分类。模型2是一个ocr问题,它们处理输出数据。模型3基本上是处理数据并分离适当的数据集。
我希望这个洞察力能对你有所帮助。
https://stackoverflow.com/questions/70620806
复制相似问题