我正在从安德鲁教授的演讲中学习机器学习(线性回归)。在聆听何时使用正态方程与梯度下降时,他说,当我们的特征数量非常高(如10E6)时,则使用梯度下降。对我来说,一切都很清楚,但我想知道,有没有人能给我举个现实生活中的例子,说明我们使用了如此多的功能?

发布于 2014-04-21 10:33:52
例如,在文本分类(例如,电子邮件垃圾邮件过滤)中,我们可以使用一元组(词袋)、二元组、三元组作为特征。根据数据集的大小,特征的数量可能非常大。
发布于 2014-04-22 02:58:18
具有大量属性的数据集的列表:-
单词日常和体育活动数据集link
以上是具有较大no的数据集的真实示例。属性。
https://stackoverflow.com/questions/23187691
复制相似问题