根据索引特征从列表列表中提取列表_根据R中的索引列表，从变量中提取值列表_从字符串列表中提取特征 - 腾讯云开发者社区

、、、

我正在使用VGG19架构从我的图像中提取特征。下面是我这样做的代码： model = VGG19(include_top=False) image_paths = glob.glob('train/*/*') def extract_features(model, path): img_path = path img = image.load_img(img_path, target_size=(224,224)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) x = preproce

浏览 101提问于2020-09-16得票数 0

2回答

可以使用Solr的Lucene进行图像检索吗？

、

我现在正在为我的图像检索项目寻找检索服务器。正如我从互联网上看到的，Lucene和Solr是专门用于文本搜索的，但您认为将它们用于图像检索是可能的和合理的吗？你可能会推荐一个特定于图像的工具，比如LIRE，但它有预定义的特征提取算法，对于新特征来说不是很灵活。基本上，我所需要的就是使用Lucene或Solr这样的服务器对提取管道(用Python编写)中的图像特征进行索引，并基于索引特征的欧几里德距离执行一些检索任务。任何建议或指向任何参考的指针都将非常有用。谢谢。

浏览 3提问于2014-11-16得票数 0

1回答

学习:如何使model.transform从原始数据中删除列索引

、、、、

我在试着申请未来的选择。问题是，使用整个数据帧会导致内存错误。因此，我决定削减我的数据，以便能够应用下一个未来的选择： # this is original dataframes X_full = df_train[df_train.columns[0:size]] # 76000(rows)*300(cols) y_full = df_train[[len(df_train.columns)-1]] # 76000(rows)*1(col) y_full包含0和1，数字1低于5%。所有其他列都只包含数字，但我们不知道它们的意思。 #this is way, I reduce the numb

浏览 2提问于2016-03-14得票数 1

回答已采纳

1回答

cv::flann::Index::knnSearch()没有可用的源代码

、、、、

我正在尝试在OpenCV中实现Flann索引。让我一步一步地讲述我的实现： 1)我从图像中提取了SURF特征，并将所有特征连接起来。然后像这样保存描述符和flann索引： FileStorage fs("descriptors.yml", FileStorage::WRITE); write(fs, "descriptors", descriptors); flann_index_saved.save("tmp_twitter.fln"); 2)从查询图像中提取SURF特征。 3)我像这样加载flann索引： FileStorage fsRead

浏览 3提问于2016-02-27得票数 1

1回答

是否应该将核心数据中的日期字段细分为月、日和年，以便轻松按月和年份对日期进行分组和提取？

、

如何执行与SQL提取/提取记录相当的SQL提取/提取记录(按月份和年份从某个日期开始)？所需经费如下：按月份和年份分列的列表记录 2015年9月 2015年10月显示属于年份和月份的事务。编辑:我指的是核心数据。将“等效于SQL”改为“等效于SQL”以澄清。

浏览 3提问于2015-10-20得票数 0

1回答

在Python中提取原始列表中特定项的子列表

、、

问题如何从列表中提取子列表，每个子列表都被提取，其上、下边是列表中的一个特定项。示例1 输入 Sublist_Slicing_edge =0 mylist =0，1，1，-1，-1，-1，-2,1,2,3,4,0 期望输出 list1 = 0,1,0 list2 = 0,1，-1，-1，-2,1,2,3,4,0 示例2 输入 Sublist_Slicing_edge = "I“ mylist = "I“、"am”、"an“、"Engineer”、"and“、"I”、"am“、"am”、“am”、"a“、”科学家

浏览 3提问于2021-08-21得票数 1

回答已采纳

2回答

如何通过选择并删除每个项来迭代python列表？

、、

所以我用请求从某个页面中获取了这个数据。现在我使用它的值来创建列表。我如何在列表中迭代以提取和使用每一项？我已经尝试过这样的方法： for component in values: if values.index(component) > 0: value = values.pop() 但它只给了我一些东西，留下了另外一些东西。

浏览 8提问于2022-10-05得票数 1

1回答

OpenCV:如何从adaboost中获取弱词法分析器

、、

是否有一种方法可以从Opencv中实现的adaboost算法中提取与弱学习器相对应的特征？我知道adaboost基于一组输入特征组合了一组弱学习者。对训练集中的每个样本测量相同的特征。adaboost通常使用决策树桩，并为每个特征设置阈值，并选择误差最小的决策树桩。我想找出产生弱学习者的特征是什么。谢谢。

浏览 0提问于2013-05-26得票数 1

1回答

如何利用mRMRe软件包找到最优的特征计数？

、、、

我试图使用R中的mRMRe软件包对基因表达数据集进行特征选择，我有包含超过10K基因的RNA seq数据，我想找到最适合于分类模型的特征。我想知道如何找到最优的功能计数。这是我的密码 mrEnsemble <- mRMR.ensemble(data = Xdata, target_indices = c(1) ,feature_count = 100 ,solution_count = 1) mrEnsemble_genes <- as.data.frame(apply(solutions(mrEnsemble)[[1]], 2, function(x, y) { return(y

浏览 21提问于2022-04-25得票数 0

1回答

CNN与gabor滤波器的关系

、、、

我正在学习使用gabor滤波器从图像中提取与方向和比例相关的特征。另一方面，卷积神经网络也可以提取包括方向和尺度在内的特征，是否有证据表明CNN中的滤波器具有与gabor滤波器类似的功能？或者他们两个的利弊。

浏览 47提问于2019-07-25得票数 1

3回答

如何将词作为数字特征纳入分类

、、、

在任何机器学习算法中，使用单词本身作为特征的最佳方法是什么？问题是我必须从特定段落中提取与单词相关的特征。我应该使用字典中的索引作为数字特征吗？如果是这样的话，我将如何将这些标准化？通常，单词本身在NLP中是如何用作功能的？

浏览 0提问于2010-11-18得票数 6

回答已采纳

1回答

Excel:试图在单元格列表中找到单元格的一部分

、、

我有一个不同应用程序名称的列表：示例小列表： CPS大型机处理器直销商名录拆卸日历然后，我每周从另一个不同命名这些应用程序的工具中提取报告。例如，在第一个列表中，DD (分发服务器目录)是应用程序名称，但它可以从我所提取的报表中的另一个列表中命名为Distributor Directory和DD Hub。因此，我需要一个函数，它可以通过测试其中的部分来判断两个名称是否相同，因为它永远不会是完全相同的名称/顺序。以前有人必须这么做吗？请帮帮忙。

浏览 0提问于2014-03-10得票数 0

1回答

从星星之火数据中的列表中提取值，而不转换为熊猫

、、

我有一个火花数据框架，如下所示:每行包含一个列表，我想从中提取一个元素。我非常绿色的火花，所以我把它转换成一个熊猫DataFrame，然后使用地图功能，我提取所需的元素。问题是，数据是巨大的，因此这种方法是不可扩展的。让我花时间的是toPandas()命令。是否有从每一行访问列表中的值的选项？谢谢! +--------------------+ | sentence| +--------------------+ |[{document, 0, 23...| |[{document, 0, 68...| |[{document, 0, 65...| |[{documen

浏览 5提问于2021-12-09得票数 1

回答已采纳

1回答

基于表征学习的特征提取

、、、

我是机器学习的新手，我被要求使用表示学习(例如堆叠自动编码器)从具有连续数据的数据集中提取特征。然后，我将把这些提取的特征与数据集的原始特征结合起来，然后使用特征选择技术来确定进入我的预测模型的最终特征集。有没有人能给我一些参考资料、演示或示例代码，告诉我如何开始做这件事？我对从哪里开始感到非常困惑，希望得到一些建议！

浏览 22提问于2020-12-29得票数 0

回答已采纳

2回答

如何将NBA-API列表转换为DataFrame

、、、

将NBA-API对象转换为DataFrame时出现问题。我得到的是数据帧的列表。如何从列表中提取DataFrame，或者跳过列表并创建DataFrame。 <code>A0</code>

浏览 24提问于2020-11-14得票数 0

回答已采纳

1回答

二值特征提取

、、

我是一个在自然语言处理的特征提取方面的初学者。我想知道如何使用hashmap来提取文本的特征。如果每个特征都是hashmap中的"key“，并且它的值是" value”(所有特征都是二进制的，0或1)，这是否意味着我需要n个hashmap (n是文本中的单词数)？因为对于每个单词，我都需要提取特征。我说的对吗？提前谢谢你，爱丽丝

浏览 3提问于2013-03-07得票数 1

1回答

如何对多变量时态数据进行列车测试分割

、

我正在建立一个模型，以便在某人处于压力状态时进行预测。我正在使用的WESAD数据集，其中具有电真皮活性数据的11名受试者。我采用这个方法，并使用Neurokit2从原始EDA数据中清理和提取特性。最终的结果是，我有一个列表，将每个主题存储在原始数据集中，其中包含3个特征和1个标签。标签是二进制0,1，特征是规范化的。我只拥有使用单一因素和单一主题运行timeseries模型的经验。我怎样才能正确地在多学科上进行多功能的火车测试？下面是我的代码，用于为一个特征和一个主题的神经网络创建数据生成器。我应该循环每一个主题，并做如下相同的过程？如果我按我的建议去做，我将如何把它变成一个LSTM模型？

浏览 0提问于2023-03-28得票数 0

回答已采纳

1回答

特征提取类型错误

、、、

作为编程初学者，我在通过与Scikit学习的机器学习实验对文本进行分类时遇到了一些问题。我使用10倍交叉验证，所以没有部门在火车和测试数据。我的问题从特征提取模块开始。这是带有错误的代码： vec = DictVectorizer() X = vec.fit_transform(instances).toarray() 最后一行给出了以下错误： TypeError: float()参数必须是字符串或数字，而不是'dict‘ 实例是一个特征向量字典列表，每个文档都有一个字典。实例列表开头的示例(您可以看到第一个文档的字典的一部分)。有些特征是嵌套在特征向量字典中的字典

浏览 4提问于2017-07-12得票数 0

回答已采纳

1回答

支持向量机关键短语

、、

支持向量机新手-我有160个类别，从少数到许多成员术语和短语，用于培训数据。有些类别的短语很少，而另一些类别则有数百个词组。我有大量的文本测试数据与广泛的专题品种。我想我想要一个MultiClass，oneVsRest支持向量机，二进制分类器。 1)支持向量机的训练输入应是一组1特征3:1特征5:1的直线。对于正的成员资格，其中的特性是类成员列表中的术语/短语-二进制值足够吗？-1特征线1:1特征2:1特征4:1.known_terms_of_interest字典中其他类的所有成员？ ( 2)测试文档输入是否只包括known_terms_of_interest字典中的术语？ ( 3)线性对不

浏览 3提问于2014-02-01得票数 0

3回答

Scikit学习构建随机森林的ExtraTreeRegressor考虑的特征

、、、

我遇到了，它涉及到测试数据集的face补全。在这里，max_features的32值被传递给ExtraTreesRegressor()函数。我了解到决策树是构建的，它从输入数据集中选择随机特征。对于上面链接中的示例，图像被用作训练和测试数据集。描述了各种类型的图像功能。现在我不能理解sklearn.ensemble.ExtraTreeRegressor从作为输入提供的图像数据集中寻找或提取哪些特征来构建随机森林。另外，如何确定对于max_features来说32的值是最优的。请帮我弄一下这个。

浏览 0提问于2013-06-11得票数 1

回答已采纳

3回答

在python中使用numpy.linalg.eig后对特征值和相关特征向量进行排序

、、

我使用numpy.linalg.eig来获取特征值和特征向量的列表： A = someMatrixArray from numpy.linalg import eig as eigenValuesAndVectors solution = eigenValuesAndVectors(A) eigenValues = solution[0] eigenVectors = solution[1] 我想对我的特征值进行排序(例如，从最低到最高)，在某种程度上，我知道排序后相关的特征向量是什么。我找不到任何使用python函数来实现这一点的方法。有没有什么简单的方法，或者我必须编写我的排序版本？

浏览 2提问于2011-11-11得票数 112

回答已采纳

4回答

在Python中将元组元素切片和堆叠到矩阵中

、、

我有一个元组列表(特征值，特征向量)，我必须从其中提取前60个特征向量，并将它们水平堆叠到一个矩阵中。我使用的是以下代码： matrix_60 = np.hstack((eig_pairs[:60][1]).reshape(samples,1)) 代码不能正常工作(我知道元组没有reshape属性)，但是我找不出正确的语法。预期的结果是获得前60个特征向量，并按列堆叠它们(因此矩阵将具有N行乘60列)。

浏览 0提问于2018-12-27得票数 1

1回答

捕获文本中的特征偏移量的文本向量器？

、、、、

我正在使用sklearn从文本中提取特征以进行文本分类。我相信我需要的信息往往在文档的开头，所以我想以某种方式捕捉每个文档的每个特性的偏移量(第一次出现，或者所有外观的平均偏移量)。有什么向量器能做到吗？或者其他有效地提取这些信息的方法？谢谢!

浏览 0提问于2020-03-19得票数 3

2回答

使用opencv对线条进行分类

、、、

我正在做一个图像分类项目，我已经使用边缘检测从图像中提取了曲线，并且需要根据它们的曲率对它们进行分类。例如，在下面的图像中，有3种线，左边的线具有良好的曲率，中间的线具有不错的曲率，而右边的线具有非常差的曲率。谢谢你的帮忙

浏览 6提问于2012-06-25得票数 6

回答已采纳

1回答

如何使用带有svm.net的路透社-21578数据集进行文本分类？

、、、

我刚刚开始了一个文本分类的应用程序，我已经阅读了很多关于这个主题的论文，但到目前为止我还不知道如何开始，我感觉我还没有得到完整的图像。我已经得到了训练数据集，并阅读了它的描述，得到了一个很好的支持向量机算法(SVM.Net)的实现，但我不知道如何在这个实现中使用该数据集。我知道我应该从数据集的文本中提取特征，并将这些特征用作SVM的输入，所以谁能告诉我有关如何提取文本特征并将其用作SVM算法的输入的详细教程，然后使用此算法对新文本进行分类？如果有一个完整的关于使用SVM进行文本分类的例子，那就太好了。任何帮助都将不胜感激。提前谢谢。

浏览 4提问于2011-05-23得票数 3

回答已采纳

1回答

选择大的WHERE IN子句需要很长的时间

、、

这一切我都是新来的，所以温柔点:)。我有一个大型的医学数据库，我需要根据选定的医生(S)为患者提取数据。现在我建立了一个病人名单 SELECT patID FROM appointments WHERE docID IN ('docid1', 'docid2', ..... , 'docidn') 一旦我得到了我的病人列表，我就会在从一大堆病人相关的表中提取数据时使用它。根据我最初的医生名单，我可能最终得到的病人名单是20,000+。该系统中病人总数接近100万人。然后，我拿起我的病人名单，开始从其他表格中获取数据，大致如下 Sel

浏览 0提问于2012-04-14得票数 5

2回答

Python -- SciKit --分类器的文本特征提取

、、、、

我必须将文章归入我的自定义类别。所以我选择了SciKit中的MultinomialNB。我正在做有监督的学习。因此，我有一个编辑，他每天查看文章，然后对它们进行标记。一旦它们被标记，我就将它们包含到我的学习模型中，依此类推。下面是代码来了解我在做什么和使用什么。(我不包含任何导入行，因为我只是想让您了解我在做什么) () corpus = (train_set) vectorizer = HashingVectorizer(stop_words='english', non_negative=True) x = vectorizer.transform(corpus) x_a

浏览 1提问于2015-03-09得票数 4

3回答

图像分割与特征提取在图像处理中的区别是什么？

、、

我读过一篇关于脑瘤segmentation.That的文章，文章有一些方法可以将脑肿瘤细胞从正常的脑组织中分割出来，cells.Those方法是预处理、分割和特征extraction.But，我无法理解，分割和特征提取.I也有什么区别，但是我仍然没有understand.Can任何人解释这种方法的基本概念？

浏览 6提问于2016-03-30得票数 0

3回答

使用OpenSMILE从实时输入中提取音频特征

、

我可以使用OpenSMILE从存储在系统中的音频文件中提取特征。但我需要使用相同的OpenSMILE实时提取特征。有没有可能不保存录制的音频文件？

浏览 6提问于2014-01-15得票数 1

1回答

OpenCV 3.0为什么关键点的数量超过阈值？

、

我创建了SIFT构造函数，其阈值= 20 sift = cv2.xfeatures2d.SIFT_create(20) keypoints, descriptors = sift.detectAndCompute(image,None) 然后，我从图像序列中提取描述符，对于某些图像，我接收到超过一个限制的关键点数。请参阅下面打印的描述符： (20, 128) (20, 128) (20, 128) (20, 128) (21, 128) 是虫子吗？我怎样才能避免这种行为？谢谢。

浏览 0提问于2015-11-11得票数 4

回答已采纳

2回答

如何在OpenCV中进行特征提取时忽略图像的一部分？

、、、、

我正在尝试从矩形图像中提取特征。但是我想忽略图像的某些部分，这样就不会从图像内部的这些区域提取任何特征。我可以想到两种方法。 a)从整个图像中获取特征，并使用关键点丢弃位于被忽略区域内的特征。但这种方法并不是首选的，因为我对从图像中提取的特征的最大数量进行了限制，稍后丢弃将不会有助于获得恒定数量的特征。 b)使图像的该部分上的像素为数字零。但我认为SIFT/ORB或其他特征提取算法可能会将其检测为黑色矩形，并在此黑色框的边缘部分错误地创建特征。尽管对此不太确定。有人能确认问题陈述的最佳方法吗？

浏览 23提问于2017-09-27得票数 4

1回答

信息检索索引和排序模型

、

我想不出与这个问题(a)相匹配的结构。我想过张贴包含任何像素确切数据的100x100 +1条目的列表，但对我来说这似乎是浪费的想法。如果我可以在接下来的问题(b，c)中得到一些帮助，我不明白我需要如何解决它。

浏览 1提问于2016-12-02得票数 2

2回答

从大的有序的元组列表中获取一系列项

、、、

我有一个元组列表，如下所示： [(334.99972431901307, 0.0), (335.00088248902574, 0.0), (335.0020406650446, 0.0), (335.0031988470696, 66.83868408203125), (335.00435703510072, 252.91905212402344), (335.0055152291381, 341.447509765625), (335.00667342918183, 282.1964111328125), (335.0078316352317, 125.92335510253906), (

浏览 2提问于2012-04-25得票数 0

回答已采纳

1回答

VLFeat HOG特征提取

、

我找到了一个关于VLFeat HOG的教程 http://www.vlfeat.org/overview/hog.html 我对16*16*31矩阵有点迷惑。谁能告诉我如何从函数返回的矩阵中提取可用于分类任务的特征？谢谢!

浏览 0提问于2013-12-14得票数 2

1回答

用于特征提取的MR图像分割

、、

我有脑部MR图像与肿瘤的数据集，肿瘤已经由一位物理学家使用图像J. 我读过关于分割的文章，但我仍然不明白如何从分割的图像中提取特征。图像是否应该像下面的图像那样只有黑色背景的肿瘤，这样就可以对整个图像进行特征提取了。还是只在感兴趣的区域使用覆盖或者指定ROI的层来提取特性？离散小波变换DWT描述子是描述子的好选择吗？ 📷

浏览 0提问于2018-12-11得票数 1

5回答

特征选择与特征提取。什么时候用？

、、

特征提取和特征选择从本质上降低了数据的维数，但如果我是对的，特征提取也会使数据更容易分离。哪种技术比另一种更好，什么时候会更好？我在想，因为特性选择不会修改原始数据和它的属性，我假设您将使用特性选择，当您正在培训的特性保持不变是很重要的。但我想不出你为什么想要这样的..。

浏览 0提问于2018-03-13得票数 21

回答已采纳

1回答

select_features方法背后的算法

、、、

我最近开始使用tsfresh库从时间序列数据中提取特性。我可以在几行代码中获得一系列特性，这是非常酷的，但我对select_features方法背后的逻辑有疑问。我查看了官方文档并搜索了它，但找不到用于此的算法。我想知道它是如何工作的，这样我就可以在tsfresh中的数据处理之后决定在特性选择阶段做什么。

浏览 4提问于2019-10-01得票数 1

回答已采纳

2回答

在Python中，如何根据列表中的项对列表进行切片？

、、

list1 = ['5', '3', '2', '1'] j = '3' 如何从该列表中从j提取到列表的末尾？在这个例子中，给我的是： ['3', '2', '1'] 当我知道j，j总是在列表中，列表总是充满唯一的值？

浏览 7提问于2022-04-14得票数 -1

回答已采纳

1回答

根据特定文本提取固定数量的元素，并在python中转换为数据框

如何根据以下条件从列表中提取特定元素 mylist = ["aabc", "$2322", "$354", "lkgh", "rbus","hjguy", "$33","$77","kjlh","ghfd", "ytrwsd","$876", "$987", "abc", "efg" ] 我想从上面的列表中提取元素，从带有'$‘符号的元素开始，直到

浏览 13提问于2019-02-26得票数 0

回答已采纳

1回答

简单规则分类器的特征选择/提取

、

假设我必须检测一张图片中是否有一只黑斑羚羊。现在我有了一个充满图片的数据库，其中一些图片包含了这张图片。在所有的图像中(其中有黑斑)，黑斑都是从侧面看到的。现在进一步假设我以某种方式找到了一种方法来检测图像中是否有角，任何类型的角，具有不同的形状和颜色(假设)。现在我对包含角的图像做一些进一步的图像处理。我确定它们是扭曲的还是笔直的，如果它们是笔直的，可能会有多长。然后，我将其长度的值作为规则在分类器中使用。比方说10到15之间的值是紫红色的羚羊，否则就不是。我想知道的是，我在那里做的是什么？找到角的长度并确定它是否属于某个类。是特征提取还是特征选择。还是别的什么？

浏览 1提问于2015-03-09得票数 0

1回答

HOG描述符的实现

、、、、

我试图使用java实现Hog描述符，而不使用在opencv中实现的Hog描述符，但我有以下问题： HOG检测器和HOG描述符是否相同？在从图像中提取兴趣点或关键点之后，我们从哪些方面提取HOG描述符？形成整个图像或我们之前从图像中检测到的兴趣点/关键点。当我们计算梯度时，我们是在计算图像梯度之前还是之后将图像分割成块？预先表示感谢

浏览 1提问于2014-08-18得票数 0

回答已采纳

3回答

特征选择的最佳方法

、

我有超过六个不同的表，有超过300个特性(属性)。现在，我对选择用于建模的特性的正确方法感到有点困惑。我想到了两个过程逐个选择属性并计算其对输出的重要性，并将其添加到数据集市中。从所有表中提取所有特征，计算它们的相关性和重要性，并删除不太重要的特性。

浏览 0提问于2019-02-20得票数 1

2回答

对NumPy数组进行排序，并与其一起排列另一个数组

、、

我有两个numpy数组，第一个是一维的A，第二个是B，在我所想到的应用程序中是二维的，但实际上可以有任何维度。B的每一个索引都与A的单个索引覆盖相同的范围。现在，我想对A进行排序(按降序排列)，但希望与其一起对B的每个维度进行排序。从数学上讲，如果P是排序A的置换矩阵，我想根据np.dot(P, np.dot(B, P.T))变换B。例如，考虑以下示例，其中排序巧合地对应于倒序： In [1]: import numpy as np In [2]: A = np.array([1,2,3]) In [3]: B = np.random.rand(3,3); B Out[3]: arra

浏览 6提问于2016-02-05得票数 7

回答已采纳

1回答

标记较小列表中哪些元素在较大列表中的有效方法(Python)

、、

我正在将相当大的数据集从json解析为“传统”数据框架(行作为观察，列作为变量)。json对象包含每个观察的特征列表。我想把它转换成一个零一向量，它表示所讨论的观测是否具有这种特性。我拥有的是“主列表”(包含所有可能的特性的列表)和观察列表(如json )。假设所有特征的个数为K，则每个观测的输出应该是长度K的0-1列表，标记每个特征是否适用于该观测。我目前的方法是“蛮力”迭代： characteristics #master list of all possibilities output_dataset = [] for observation in data: chars =

浏览 2提问于2015-10-26得票数 0

回答已采纳

2回答

如何更有效地将一个列表中的元素排在另一个列表中的相应元素之后？

、

所以，我有两个包含数据的列表。一个是关于一个物体从哪个高度掉下来的信息(称为heightsTotal)，另一个是关于该物体掉下来所花费的时间的信息(称为timesTotal)。对于每个高度，一个物体会被抛出几次。我想要做的是从列表中提取元素，并根据时间对应的高度将它们排序到列表中。我已经解决了这个问题，但它需要大量的代码。我的代码看起来像这样： timesAfterHeight = [[], [], [], [], []] counter = 0 for i in heightsTotal: if i == 0.2: timesAfterHeight[0].app

浏览 30提问于2021-04-25得票数 0

回答已采纳

1回答

特征提取和特征学习有什么区别吗？

、、

在我看来，“特征提取”和“特征学习”是等价的概念，然而，维基百科有两篇专门针对它们的文章是非常不同的。特别是在特征学习文章中，只提到了神经网络/深度学习。然而，它们似乎同样适用于这两种情况，因为自动编码器从原始(通常是图像)数据中提取特征，而现在提取的特性则输入到下一层。那么，这些术语的真正区别是什么？

浏览 0提问于2015-11-09得票数 4

回答已采纳

1回答

如何在matlab中训练SVM进行字符识别？

、、

我是一名大四学生，正在做我的专业项目。我的项目基本上是从自然场景中提取文本，并识别它，然后在记事本等中显示它们。我已经从图像中提取了文本，并为每个提取的字符获得了85个特征。然而，对于识别部分，我不知道如何在matlab中训练或使用SVM(支持向量机)，以便获得匹配。请帮帮我，因为这是非常困难的

浏览 3提问于2012-04-11得票数 5

1回答

YearPredictionMSD字段列表(从百万首歌数据集中识别音乐年)

、

YearPredictionMSD数据集是从百万宋数据集中提取并在UCI机器学习库中找到的机器学习实践数据集。我找不到描述这些特性的字段列表。有人知道我在哪里能找到他们吗？另外，我也不明白为什么来自LabRosa的原始数据中只有54个特性，而UCI上的数据子集中只有90个特性。

浏览 0提问于2016-12-14得票数 0

1回答

如何在机器学习算法中部署我的功能？

、、、

我对ML非常陌生，所以我有一个非常基本的问题。如果有人帮我澄清，我会很感激的。假设我有一组标记为否定和肯定的tweet。我想做一些情感分析。我提取了三个基本特征：情感图标感叹号强度词(非常，真的等等)。如何将这些特性与支持向量机或其他ML算法结合使用？换句话说，如何将提取的特征部署到SVM算法中？我正在使用python，并且已经知道如何运行支持向量机或其他算法，但我不知道提取的特征与它们在每个算法中的作用之间的关系！基于一些专家的回答我更新了我的问题：首先，我想感谢你的时间和有价值的解释。我想我的问题是解决…因此，按照您所说的，每个ML算法可能需要一些矢量化的特征，我应该找到一种

浏览 7提问于2020-01-22得票数 2

2回答

基于精调BERT模型的文本特征提取

、、

我试图在一些数据上建立一个二进制预测器，它有一个带有文本的列，还有一些带有数值的列。我的第一个解决方案是在文本上使用word2vec提取30个特性，并将它们与随机森林中的其他值一起使用。它产生了良好的效果。我感兴趣的是改进文本到特征模型。然后，我想改进BERT的特征提取算法。我成功地实现了一个经过预先训练的word2vec特征提取模型，并对其进行了一些改进。现在我想知道，我如何微调我的数据上的伯特模型-改进特征提取模型-得到更好的文本到特征，我的随机森林算法。我知道如何微调二进制预测器(BertForSequenceClassification)的伯特，但不知道如何微调它，以建立一个更好的

浏览 7提问于2019-09-23得票数 2

回答已采纳