文章/答案/技术大牛

发布

社区首页 >问答首页 >希望使用tensorflow拆分从csv获得的训练数据和测试数据

问希望使用tensorflow拆分从csv获得的训练数据和测试数据
EN

Stack Overflow用户

提问于 2019-03-24 16:24:25

回答 2查看 1.4K关注 0票数 0

我想使用tensorflow拆分csv的训练和测试数据，但我在张量中找不到像np.loadtxt这样的顺序，并尝试使用numpy进行拆分并将其转换为张量，但我得到了类似以下的错误：

      TypeError: object of type 'Tensor' has no len()

下面是我的代码：

     import tensorflow as tf
     import numpy as np
     import matplotlib.pyplot as plt
     from sklearn.model_selection import train_test_split

     x = tf.convert_to_tensor( np.loadtxt('data.csv', delimiter=','))
     y = tf.convert_to_tensor(np.loadtxt('labels.csv', delimiter=','))

     x_train, x_test, y_train, y_test = train_test_split(x, y, 
     test_size=0.25, random_state='')

     model = tf.keras.models.Sequential([
     tf.keras.layers.Flatten(input_shape= (426,30,1)),
     tf.keras.layers.Dense(126, activation=tf.nn.tanh),
      #tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation=tf.nn.tanh)
       ])

       model.compile(optimizer='sgd',
          loss='mean_squared_error',
          metrics=['accuracy'])

       history = model.fit(x_train, y_train, epochs=5 )  #validation_data 
       = [x_test, y_test])
       model.evaluate(x_test, y_test)

      t_predicted = model.predict(x_test)
      out_predicted = np.argmax(t_predicted, axis=1)
      conf_matrix = tf.confusion_matrix(y_test, out_predicted)
      with tf.Session():
       print('Confusion Matrix: \n\n', tf.Tensor.eval(conf_matrix, 
     feed_dict=None, session=None))

      # summarize history for accuracy
      plt.plot(history.history['acc'])
      plt.plot(history.history['val_acc'])
      plt.title('model accuracy')
      plt.ylabel('accuracy')
      plt.xlabel('epoch')
      plt.legend(['train', 'test'], loc='upper left')
      plt.show()

     # summarize history for loss
     plt.plot(history.history['loss'])
     plt.plot(history.history['val_loss'])
     plt.title('model loss')
     plt.ylabel('loss')
     plt.xlabel('epoch')
     plt.legend(['train', 'test'], loc='upper left')
     plt.show()

tensorflow

python

回答 2

Stack Overflow用户

发布于 2019-03-24 16:44:29

首先加载csv文件，执行拆分，然后将拆分结果给Tf，不是更简单吗？

sklearn.model_selection.train_test_split()并不是用来处理从tf.convert_to_tensor()获得的张量对象的。

颠倒顺序使您的代码在小的测试脚本中工作

x = np.loadtxt('data.csv', delimiter=',')
y = np.loadtxt('labels.csv', delimiter=',')

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.25)

x_train = tf.convert_to_tensor(x_train)
x_test = tf.convert_to_tensor(x_test)
y_train = tf.convert_to_tensor(y_train)
y_test = tf.convert_to_tensor(y_test)

票数 0

Stack Overflow用户

发布于 2019-03-24 17:04:13

最好的做法是不要将全部数据加载到张量中。如果你的代码是在GPU上执行的，如果你的数据很大，张量可能会占用大量的GPU内存，导致“内存不足”错误。通常使用的方法是

numpy将数据加载到内存变量(通常为

)中，
将数据拆分成训练和验证批次(使用类似numpy的东西over splits with batch splits并创建批次大小张量)。使用它来训练(验证拆分批以进行验证)

在处理大型/巨型图像时，我们无法将所有图像加载到内存中。这里通常采用的方法是将一批图像加载到张量中，并将其用于训练/验证。所有的深度学习框架都提供了在多线程中加载多个批次的机制，这样下一个训练步骤就不会等待下一个批次的加载。

如果您仍然希望将完整数据加载到张量中，并将其拆分为训练张量和测试张量，那么可以使用tensorflow方法tf.split。https://www.tensorflow.org/api_docs/python/tf/split

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55321905

复制

相似问题

问希望使用tensorflow拆分从csv获得的训练数据和测试数据
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问希望使用tensorflow拆分从csv获得的训练数据和测试数据EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问希望使用tensorflow拆分从csv获得的训练数据和测试数据
EN