所以我在看这个YouTube视频
因此,基本上,教授使用ML生成随机面孔,以便为Kaggle挑战创建数据。当我查看数据文件时,我希望看到*.jpg或png文件,但我发现的只是CSV文件,基于他的视频,他的模型生成了一些png文件。
发生了什么?他是怎么把jpg变成CSV的?我们能不使用jpg吗?
发布于 2020-11-19 16:44:17
首先,图像被转换成像素值。如果这是一个彩色图像,我们有RGB组合的值。它是黑白的,那么数据集中的每个图像的像素值都是黑白之间的无符号整数,或者0和255。这是第一次向数字转换。
在此之后,我们对其进行嵌入,将其转换为一个数字数组。然后我们使用这个嵌入进行进一步的处理。
由于AI/ML算法只处理数字,所以不能直接使用图像。
您可能需要采取一个更简单的图像基础,如MNIST,这是一个简单的0-9表示在28*28像素的图像,然后发挥与识别算法更好的理解。
https://datascience.stackexchange.com/questions/85638
复制相似问题