有没有从数据中提取最佳特征的方法。现在,我正在使用sklearn中的'KBest‘。在这种情况下,我必须指定需要选择的K个最佳特征的数量。有没有什么方法可以让我不必指定要提取的特征数量?相反,我们提取所有有用的特征?
from sklearn.feature_selection import SelectKBest
test = SelectKBest(score_func=chi2, k=4)
我有一个数据集,其中包含序列和与每个序列相关联的分类属性。 为了捕获不同属性之间的序列差异,包含这些分类属性的最佳实践是什么? 示例df Sequence | Country | User |
[A,B,D,E,F] USA U1
[B,C,D,E] DE U123
[A,B,F,E,G,H] USA U2456
... ... .... 我想建立一个LSTM模型,它将能够预测序列中的下一个事件。 如果我只
我正在尝试使用Keras中的全连接层架构进行二进制分类,这在Keras中被称为密集类。
以下是我创建的神经网络架构的设计:
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD
self.model = Sequential()
# Dense(64) is a fully-connected layer with 64 hidden uni