我用tflearn来模拟CNN。但是,我的数据在每个输入中有不同的行数(但列数相同)。例如,我有100个输入。第一个输入的维数为4*9,而第二个和第三个输入的维数为1*9。我不知道如何使用input_data()来输入和格式化数据。
发布于 2016-11-23 08:51:22
首先,你必须知道你的训练样本到底是什么。我不知道你所说的“输入”是什么意思,一个输入意味着一个样本吗?还是输入中的一行意味着一个示例?
如果一个输入意味着一个样本,那么您将遇到一些麻烦,因为几乎所有CNN (以及几乎任何其他机器学习标志)都需要数据形状的一致性。考虑到某些示例比其他示例具有更多的数据,它可能是一种解决方案,可以裁剪出具有更多数据的额外数据,或者忽略那些行数较少的数据(以便最大化您使用的数据)。一个更复杂的方法是对一些具有更多行(和相同行数)的样本运行PCA,如果可能的话,只对所有样本使用主组件。
如果一行意味着一个示例,那么您可以将所有数据合并到一个大块中,并按照通常的方式处理它。你说对了。
https://stackoverflow.com/questions/40759257
复制相似问题