大数据学习路径_大数据三大框架学习_Java技术学习路径 - 腾讯云开发者社区

、、、、

我一直试图使用转移学习的MNIST数据集使用VGG/盗梦空间。但这两个网络都接受至少224x224x3大小的图像。如何将28x28x1 MNIST映像重定向到224x224x3以进行传输学习？

浏览 1提问于2017-12-17得票数 11

回答已采纳

2回答

低维路径表示学习

、、

我有一个图(例如: map)和代表不同路径的多个ids序列。顶点表示区域/区域两个顶点之间的边缘:从一个区域到另一个区域的交叉图路径(交叉序列)：轨迹如下所示： path1 = [15,1,2,3] path2 = [1,2,9] path3 = [15,3] 所有的路径都来自相同的图结构，它们可以有不同的大尺寸(~50)。然后，我想得到一个低维向量(每个路径一个)，以执行近似邻域搜索(这是一种搜索技术，用于查找最接近另一条路径的数据点)。我发现了一些关于图表示学习的论文，但没有任何相关的内容。我应该探索NLP技术还是图形嵌入技术？

浏览 0提问于2021-07-15得票数 1

1回答

有关在mac os上使用selenium进行爬行的问题

、、、

我开始学习使用selenium进行网络爬行。我已经下载了用于firefox的selenium和geckodriver。到目前为止，我只是试图打开谷歌，但我得到了一大堆错误。有谁知道可能出了什么问题吗？ from selenium import webdriver driver = webdriver.Firefox(executable_path='/usr/local/bin/geckodriver') driver.get("https://www.google.com")

浏览 0提问于2020-06-25得票数 0

2回答

使用大文件设置远程Git的最佳方法

、、

我有一个目录，其中包含我的代码和非常大的文件(例如，数据文件和大型深度学习模型)。忽略这些大文件，我已经将代码上传到GitHub存储库。现在，我还设置了一个远程服务器(AWS EC2)，我已经在其中克隆了该存储库。但是，因为我想要处理数据和这些大文件，所以设置一个好的工作流的最佳方法是什么？我是否应该将这些文件上传到我的服务器上，然后设置一个.gitignore --有没有更聪明的方法呢？对于这个菜鸟问题，很抱歉，谢谢！

浏览 20提问于2020-10-09得票数 2

2回答

将.bcp文件导入sql server

、、

我已经从一个政府网站下载了一些ZIP文件供学习，这些文件的类型是、Server复制、快照、大容量复制数据文件。我假设它们是.bcp文件。我还下载了要在sql server中创建的相应的.sql文件。还有一个单独的压缩文件，其中包含一个大型的.bcp文件和 not .sql文件，所以我不确定它是干什么用的。我创建了一个名为“c:\sadybcp\extract1...extract2....测试”的数据库，其中表extract1、extract2、 extract3等表都是不同的。我想将它们导入到我的sql服务器中。我在网上搜索了语法，但没有成功，其中大部分是.txt文件。因此，我尝试了各种

浏览 4提问于2017-10-05得票数 0

2回答

如何使用自动学习与达克数据？

、、、

如何在自动学习中使用dataframe？我的代码是正确的，并且使用了Pandas数据文件，但没有使用Dask。因为我的数据集非常大，所以我使用的是Dask数据。对达斯克有什么自动学习支持吗？

浏览 7提问于2021-12-06得票数 1

回答已采纳

1回答

在这种情况下，树数据类型是我所需要的吗？[TicTacToe游戏]

我正在尝试一种算法，它让ticTacToe与自己对抗，并从获胜条件中学习。当它获胜时，它会再次检查它所做的所有动作，并增加下一次出现相同情况的可能性。我以前从来没有做过这样的事情。所以我的想法是我需要所有可能的动作组合。在第一轮中，PC必须从9个元素的列表中进行选择，每个元素代表游戏上的一个瓷砖。然后另一个玩家可以从8个列表中选择。但是:两个玩家必须有9个不同的列表可供选择。当玩家1选择数字2时，玩家2被允许从不包括数字2的元素列表中进行选择。所以我需要在第一行中列出9个元素。在第二个中，我需要9个列表，每个列表包含8个元素，依此类推。这会变得很大，所以我需要自动创建这些组合。我的想法是

浏览 1提问于2020-08-10得票数 0

1回答

在哪里验证数据？

、

我正在学习一个学习项目的软件使用PHP在后端和大3在前面(HTML，CSS，JS)。如果使用PHP或Javascript，我不确定在哪里验证数据输入

浏览 2提问于2018-08-21得票数 1

回答已采纳

3回答

适合于多类分类的深度学习结构

、、、、

我有以下数据 feat_1 feat_2 ... feat_n label gene_1 100.33 10.2 ... 90.23 great gene_2 13.32 87.9 ... 77.18 soso .... gene_m 213.32 63.2 ... 12.23 quitegood M大~30K行，N小得多~10列。我的问题是，什么样的深度学习结构适合学习和测试上述数据。在一天结束时，用户将给出一个基因表达载体。 gene_1 989.00 gene_2 77.10 ... ge

浏览 6提问于2016-04-27得票数 15

回答已采纳

2回答

获取CImage的子图

、

我最近开始学习如何在Visual Studio中使用MFC。我的程序使用了许多小的32x32像素的图像，为了方便起见，它们被放在一个大的.png中。我已经知道如何将大图像加载到CImage中并在CClientDC上显示它，但我找不到任何可以帮助我将图像拆分成较小的32x32图像的方法。或者，我可以使用DevIL获取大图像的像素数据，但我找不到任何可以从像素数据构造CImage的东西。因为我几天前才开始学习MFC，所以我对API不是很了解，我可能遗漏了一些明显的东西。有谁能给我指个方向吗？

浏览 0提问于2010-11-14得票数 1

回答已采纳

1回答

对于以GB为单位的大型数据集，实施最大似然估计的最佳/首选方法是什么

我有一个以千兆字节(GB)为单位的数据集，并希望估计其中缺失值的参数。在机器学习中有一种称为MLE(最大似然估计)的算法可以用于机器学习。既然R可能无法处理这么大的数据集，那么哪个库将是最好的呢？

浏览 3提问于2013-01-18得票数 3

回答已采纳

2回答

迷你批次-我提供迷你批次的scikit-learn分类器的训练

、、

我有一个非常大的数据集，不能加载到内存中。我想使用这个数据集作为scikit学习分类器的训练集，例如LogisticRegression。有没有可能在我提供小批次的情况下，对一个scikit学习分类器进行一个小批次训练？

浏览 1提问于2017-10-25得票数 8

回答已采纳

3回答

Matlab中大矩阵的使用

、、、

我想用一些不适合内存的大矩阵，memory.My矩阵是不稀疏的。我需要一些批处理\块处理或在线机器学习算法。我需要:1.从硬盘驱动器上存储的大矩阵读取一些数据块(可以放在RAM中)，最好是像普通的matlab矩阵一样访问它。2.将一些数据块附加到存储在磁盘上的大矩阵的末尾。

浏览 1提问于2013-08-07得票数 2

2回答

R中类似SQL的功能

、、

我习惯于用SQL编写数据操作逻辑，现在我正在学习R，我发现自己有时只是想做一些在SQL中很简单的事情，但我必须学习一大堆关于R的东西，才能在R数据帧上执行相同的操作。有没有简单的工作方法？

浏览 0提问于2009-07-23得票数 13

回答已采纳

3回答

Python中最快的集群包是什么？

、、、、

我想对1,300列和500,000行的数据集进行聚类分析。我看到聚类算法在科学工具包-学习中是可用的。但我担心在这么大的数据集上，算法效率会很低。 SciKit-学习慢吗?如果是的话，Python中最好的(最快的)集群包是什么？

浏览 0提问于2023-03-07得票数 1

回答已采纳

2回答

时间复杂性-理解大Theta

我目前正在研究算法和数据结构。经过近两个月的学习，我仍然觉得时间的复杂性非常令人困惑。我的教授告诉我，如果某个程序的大欧米茄和大O不相等，那么大θ就不存在了。我现在真的质疑到目前为止我学到的一切。我将以BubbleSort为例，用大-omega(N)，大θ(n^2)和大-O(n^2)。大θ确实存在(当我分析它时，它是有意义的)。有人能向我解释我的教授是错的还是我误解了什么吗？

浏览 2提问于2018-04-17得票数 2

回答已采纳

1回答

将大型csv导入规范化关系数据库(包含多个表)的最佳实践是什么？

、、、、

这是我的数据库结构。目前，我有一个包含所有字段的大csv文件。我在想几种解决方案：将csv拆分为多个文件，将它们规范化，然后将所有csv导入SQL中。首先将大csv导入SQL中，然后在数据库中将它们拆分我还处在学习SQL的阶段，所以我想找到一种简单的导入数据的方法。有什么建议吗？

浏览 1提问于2018-11-30得票数 2

回答已采纳

1回答

最佳实践？在angular中将图像存储在哪里？

我目前正在学习angular，因为我即将在工作中使用它开始一大堆项目。无论如何，我只是在摆弄一些东西，我在找出存储图像文件的最佳位置时遇到了一些麻烦。我已经成功地使用index.html文件和style.css设置了背景图像。但现在我尝试在组件级别上使用一些图片，只是遇到了一些困难。任何建议都将不胜感激。

浏览 2提问于2017-12-05得票数 13

回答已采纳

1回答

一次射击学习意味着什么？他们是否只需要一幅图像来训练一些新的类别检测？

、、、

作为深度学习的新手，我有点挣扎于掌握一次尝试学习的想法。假设我有一个类来检测训练数据集(如COCO或Image )中不存在的类。我是否可以仅使用图像来训练该类的模型，或者训练集必须与YOLO或RCNN一样大？

浏览 0提问于2021-05-04得票数 1

回答已采纳

1回答

将txt文件合并为一个文件，保留不同文件中副本的最新行

这里的挑战包括将大的txt文件(有些文件大小为70MB，总共3 3GB数据)合并为一个可由BI系统读取的文件。有些行在多个文件中重复，合并后的文件需要有最新的行。我不是开发人员，但我正在通过正确的方式学习来解决这个问题。同时，我也在尝试解决编码方面的问题。这一次，我尝试了几种解决方案，下面的代码给出了一个有趣/耐人寻味的结果： import os import io import pandas as pd merged_df = pd.DataFrame() for file in os.listdir(r"C:\Users\username\Desktop\txt"):

浏览 7提问于2019-09-17得票数 0

回答已采纳

2回答

如何在python中调整图像大小以进行机器学习？

、、、

我使用了一个图像数据集进行机器学习训练。每个图像都有64px的宽度和64px的高度。现在，我想使用来自google的图像来测试我的机器学习模型。问题是google图像比训练图像大，我想调整它们的大小，使它们的高度和宽度为64px (就像训练集中的图像一样)。在python中有什么方法可以做到这一点吗？我确实找到了一些方法，但它们都保持纵横比。因此，我无法实现64 * 64大小。

浏览 0提问于2020-02-28得票数 0

1回答

需要关于对象关系映射的建议

、、、、

我需要你的建议。我现在为自己构建后端rest项目，以便学习。我在MongoDB中使用Node。已经为我的迷你项目实现了许多功能。那么，为了学习目的，我是否有/需要在我的Node应用程序中实现ORM？因为我知道MongoDB是NoSQL，并且MongoDB本身不需要关系的东西，但是仍然对ORM的工作感到好奇和好奇(我以前在学习MongoDB时实现了ORM )。我想深入了解集装箱化，ORM-事物对集装箱化有如此大的影响吗？或者它会在我的Node应用程序中造成太多错误吗？看着你的答案和解释，谢谢

浏览 4提问于2021-12-27得票数 1

1回答

如何学习用Python或任何其他语言创建数据可视化工具？

、、

我想了解和学习数据可视化工具是如何工作和制作的。试着在谷歌上搜索，但什么也没找到。只有资料库教程。我不想学习使用工具。我想学着创造一个。试着在谷歌上搜索，但什么也没找到。期望得到一个在线文档/教程/课程/YT播放列表来学习它。长篇大论的答案也会奏效。我会读的。

浏览 4提问于2022-11-30得票数 1

2回答

从一个很大的BigQuery表中读取小批的最佳方法？

、、

我有一个大的(>200M行) BigQuery表，我想从这个表中阅读迷你批次，这样我就可以训练一个机器学习模型了。数据集太大，无法容纳到内存中，因此我无法同时读取所有数据，但我希望我的模型能够从所有数据中学习。我还想避免由于网络延迟而发出太多的查询，因为这会减慢培训过程。用Python做这件事最好的方法是什么？

浏览 3提问于2020-01-29得票数 1

回答已采纳

1回答

SageMaker分布式训练能用于非深度学习模式的训练吗？

、、、、

我正在跟踪这个页面，以了解SageMaker的分布式培训功能。上面写着：- SageMaker分布式培训库只能通过TensorFlow、PyTorch和HuggingFace框架的AWS深度学习容器在SageMaker培训平台中使用。这是否意味着我们不能使用SageMaker分布式训练来使用传统的机器学习算法(如线性回归、随机森林或XGBoost )来训练机器学习模型？我有一个用例，其中数据集非常大，和分布式培训可以帮助模型并行和数据并行。为了避免在训练实例的内存中输入大量数据，还可以推荐哪些其他选项？

浏览 12提问于2022-09-17得票数 -1

1回答

使用Tensorflow可以进行增量学习吗？

、、、

我正在尝试用一个非常大的数据集(比我的记忆大得多)来训练一个Tensorflow模型。为了充分利用所有可用的培训数据，我正在考虑将它们分成几个小的“碎片”，一次只训练一个碎片。经过一番研究，我发现这种方法常被称为“增量学习”。并基于，并不是所有的算法都支持增量学习。我正在使用tf.keras.Model构建我的模型。在这种情况下，增量学习是可能的吗？

浏览 6提问于2020-11-12得票数 8

回答已采纳

1回答

深度学习中大图像和稀疏图像的预处理

、、、

这是一个关于深度学习中预处理大尺寸和稀疏图像的更好方法的一般性问题。所谓大，我的意思是大小太大(例如1024*1024*通道)，无法直接输入深度学习管道，并且不容易放入可用的GPU内存中。通过稀疏，我的意思是用于检测的特征不是均匀分布的，因此将图像分割成较小的片段(例如64*64)可能会违背在大图像中定位它的目的。例如，通过99张土地图片和1张房屋图片来定位农田中的农舍是没有帮助的。我目前的解决方案是使用PIL将原始文件切成小块，并惩罚假阴性(即在前面的示例中被识别为土地的Farmhouse )。我想知道是否有更好的解决方案和管道来处理这样的图像数据。

浏览 55提问于2020-06-11得票数 0

2回答

更改MUI v5的所有导入语句

、

我现在正在学习react，它使用MUI进行了一个相当大的项目，使用v5，包名从@material-ui/core更改为@mui/material。我知道这很简单，但有比手动将所有导入行从import x from "@material-ui/core/x"更改为import x from "@mui/material/x"更好的方法吗？任何帮助都很感激，我花了太多时间在这个问题上，MUI文档/发布说明对这个问题没有帮助。

浏览 8提问于2021-10-23得票数 2

回答已采纳

2回答

在rails中读取xml是简单还是将其转换为散列会更简单？

、、、、

对于这个问题很抱歉，但是在花了1-2个小时学习如何阅读xml之后，我想把它发布到论坛上会更好。所以我从plugin trackify得到了一个复杂的(非常大的)xml响应。我想从其中读取一些值，所以我将其转换为哈希，然后按如下方式读取它，例如：- to read city @tracking_info['TrackResponse']['Shipment']['ShipTo']['Address']['City'] #>> "SEATTLE" 我的问题是，获取xml响应的方式是否合适

浏览 1提问于2010-04-07得票数 0

1回答

Ajax源文件来自本地文件，它会减少页面加载时间吗？

、

我正在用DataTables 学习这个例子 Ajax将数据从一个大的txt文件加载到网格中。当使用这些数据访问静态网页时，浏览器会完全下载txt文件吗?还是只加载所需的内容？谢谢!

浏览 4提问于2017-10-22得票数 1

回答已采纳

2回答

为不同用户链接位于不同路径中的库

、、

在Windows和Visual Studio上工作时，我在git存储库中有一个项目。我需要链接到这个库来编译。我希望这个项目在不同的计算机上构建，在这些计算机上，库可以位于不同的路径中(非常大的库，我不能作为子模块或依赖项嵌入) 我如何才能让我的存储库的贡献者可以设置项目和选择库的位置，而不需要实际修改git跟踪的项目文件( .vcxproj )？我应该学习如何使用CMAKE而不提交项目文件吗？谢谢;) 注意:我应该补充说，这个库是一个静态库注释，我考虑使用# .lib ( lib，"yourLibrary.lib“)，但这也会包含在源代码中，这不符合我的需要此外，如果我要调用&#

浏览 17提问于2018-12-15得票数 1

回答已采纳

6回答

如何对大数据进行SVD和PCA？

、、

我有大量的数据(大约8GB)。我想用机器学习来分析它。因此，我认为应该使用SVD和PCA来降低数据的维数，以提高效率。然而，MATLAB和Octave无法加载如此大的数据集。有什么工具可以用这么多的数据来做SVD呢？

浏览 0提问于2014-09-25得票数 36

回答已采纳

2回答

如何尽可能有效地了解分布式软件系统？

、

我正在努力学习云计算，尤其是分布式操作(网格计算？)我正在做的一个项目。我们需要在一个非常大的数据集中执行分布式容错操作，我们还将负责以优化的方式存储和维护这些数据集。如果我试图从书本或白皮书中学习，我应该寻找和专注于哪些类型的事情来帮助我尽可能高效和有效地获得这些知识？

浏览 0提问于2011-03-31得票数 8

1回答

如何快速分析大型MDB文件

、

我需要知道如何快速分析一个大的MDB文件(大约1 1GB)，看看是哪些表导致它这么大。有没有什么东西可以让我很容易地显示哪些表负责多少数据的细分。

浏览 1提问于2010-05-08得票数 1

2回答

如何在星火中显式地实现RDD

我需要从一个文件中读取一个大的数据集，将它转换成一个火花矩阵，并在这个矩阵上运行一些机器学习算法。我想测试机器学习算法的速度。由于Spark总是被延迟评估，因此很难对机器学习算法进行基准测试。当我测量运行时时，它还包括解析输入文件的运行时。有没有办法迫使星火实现一些RDDs？这样我就可以在运行机器学习算法之前先解析输入文件了吗？谢谢你，爸爸

浏览 7提问于2016-03-19得票数 3

回答已采纳

1回答

报表生成器图表-按特定年龄组分组数据

我有一个相当大的数据集，学习者被分成年龄组(16-18岁，19+).我试图计算学习者的保留率(已完成的字段/离场字段)，并仅按其中一个年龄组(16-18岁)显示图表。作为一种表达，我如何做到这一点？

浏览 0提问于2018-11-26得票数 0

回答已采纳

1回答

Dijkstra给出了哪条路径？

、、

我开始学习算法，我被下面这个简单的有向图的例子所困扰：假设A到B的权重为3，然后A到C的权重为4，最后B到D的权重为3，C到D的权重为1。从A到D的最短明显路径是A，C，D。现在我确信我对Dijkstra做错了什么，因为我发现A，B，D不是真的。我首先用0标记A，用无穷大标记所有其他顶点。然后从A开始，我松弛B和C。从那里，最低的节点是B，从B开始有一个相邻的未访问节点，即D。所以最短路径是A，B，D。我做错了什么？谢谢您抽时间见我。

浏览 3提问于2020-12-02得票数 0

1回答

持续学习-持续学习

、

这个问题是为了寻求关于如何以分布式方式构建持续学习方法的建议。让我解释一下情况：在我的分类问题中，我的类可以在一段时间内大量增长，因为来自多个域的多个客户倾向于依附于我们的多租户应用程序。当我们需要更多的实时数据时，许多意图也需要重新训练很多次。很多时候，当一个班被训练时，由于顾客是季节性的，所以它需要进入hibernate模式。他们可能会在几个月后醒来，因此不能每次在训练数据集中保存他们的训练数据。它导致缓慢的训练以及不平衡的数据集。我想要的是：我想要的是，如果我今天训练一门课，而且我知道在接下来的几个月里它不会被要求，我只想在某个地方保留它的知识。与其将它的标记数据集保留在我身

浏览 0提问于2022-10-12得票数 1

1回答

在二叉树中寻找不相交的叶对叶路径的最大和

、、、、

我需要关于一项任务的建议，在这个任务中，我正在寻找从一片叶子到另一片叶子的不相交的路径(它们不能沿着相同的路径/边缘返回)，这样它们的总和创造了尽可能大的价值，即路径不能交叉，并且必须尽可能好地属于总路径。请注意，路径中断的点(根)不包括在总和中，即。图片。我根本不知道如何解决这个问题。我附加的代码试图决定是按一片叶子选择路径，还是选择一个较小的子树，但它不能正确工作。如果有人有任何学习资料，我将非常感激。预先谢谢您的所有节目 int depth(struct node *root, int *res) { if(root == NULL) return 0; i

浏览 2提问于2022-10-28得票数 3

回答已采纳

2回答

在Python中创建、操作和加载大型numpy数组

、、

我正在尝试创建一个大的numpy数组，比如说 S=0.5 a=np.random.normal(size=(100000,10000)) x=np.maximum(S-a,1) #This is just an example. The calculation is more complicated than this. 但是它对于内存来说太大了。创建此数组后，我还需要进行操作，并将其用作机器学习中的训练数据(例如，xgboost或CART)。所以我的问题是:1.如何创建这么大的数组而不出现内存错误，并且还可以让我进行计算？你能推荐一些我可以学习的包或链接吗? 2.假设这个数组已经保存在一个

浏览 0提问于2020-07-20得票数 1

1回答

获取“FileNotFoundError”

、

我刚接触Python，目前正在在线学习如何使用Python进行数据分析和可视化。我已经学习了Python基础知识课程，现在我将进入下一步。我一直在努力学习一堂题为“阅读和编写文本文件”的课程中的代码。我正在尝试从csv文件构建数据帧，但我一直收到'FileNotFoundError‘。我已将csv文件保存在c驱动器的名为Python Examples的文件夹中，但python找不到该文档。在Jupyter Notebook中，我甚至尝试在代码中输入正确的文件路径，但出现了一个不同的错误，一个'Unicode‘错误。这是我尝试过的： import numpy as np i

浏览 20提问于2020-08-10得票数 0

1回答

如何在protege中存储视频/音频/大文本？

、

我创建了一个本体，在插入个体和存储值的阶段，我遇到了许多问题。我尝试使用protege将视频/音频文件和大文本存储到本体中，但我不知道如何将视频/音频文件和大文本存储到数据库中。例如，当我在protege中搜索时，我找不到视频/音频文件的任何数据类型。我只是为个人找到了'string‘数据类型，当我选择它时，我不能在个人中存储大文本。有谁能帮帮我吗？

浏览 22提问于2016-09-05得票数 0

1回答

python scikit通过核心外学习学习超参数调优

、、、、

目前我正在使用 clf = SGDClassifier(loss='log', random_state=1, n_iter=1) 为我训练一个预测模型。然而，训练数据相当大，所以我使用的是核心外学习。 clf.partial_fit(X_train, y_train, classes=classes) 此外，我还希望通过GridSearchCV()实现超参数调优但看起来，由于GridSearchCV没有提供partial_fit方法，所以不可能进行核心外学习，我必须将整个数据集保存在内存中。有没有一种方法可以调优超参数，同时仍然使用内核外学习？

浏览 0提问于2016-12-11得票数 3

1回答

使用redis-graph

、、、

我是redis-graph的初学者，目前我正在研究用JAVA实现的K-shortest path算法(其中一个图是使用hashmap创建的)，由于数据集相当大(2700万行)，我需要一个数据库来存储一个图，出于同样的原因，我计划使用redis- graph，但redis-graph使用cypher查询语言。如何集成这两个应用程序？欢迎任何其他建议。

浏览 20提问于2017-05-18得票数 1

1回答

如果列表元素的名称中包含"this text“并传递给for循环中的下一个元素，如何签入R？

、、、、

我是R公司的新手，有一个包含30个元素的大列表，每个元素都是包含几百行和大约20列的dataframe (这取决于数据格式)。每个数据文件都以原始的.csv文件名命名(例如，“试验数据XYZ 01")。我如何检查整个列表，只过滤那些不包含在文件名中的特定文本的数据文件，并向那些过滤的数据文件添加一个唯一的id列( id值将是该文件名的前三个字符)？例如，列表中包含"XYZ“作为其名称一部分的所有元素/dataframes/文件都不会被过滤，也不需要唯一的id。我有一个伪样式代码： for(i in 1:length(list_of_dataframes)){ if l

浏览 3提问于2022-03-10得票数 0

回答已采纳

1回答

如何调试没有合并源代码的sqlite？

、、、、

我是我学院数据库组的学生。我是分析sqlite3的源代码最近！我尝试使用合并源代码(是的，它的大小超过7.8M)。这个文件太大了，我无法调试到it.such中来观察一些变量或表达式。我的代码环境是ubuntu16.04Clien2016.2.3。我尝试使用Eclipse /c++，这可以调试合并源代码，但是非常慢，而且我不熟悉使用Eclipse 我试着阅读一些使用makefile和cmakefile的规则，但是我不知道如何解决源代码依赖我试图在配置文件中使clion内存更大，这可以在Clion中使用很好的特性，但是每次修改我的源代码时，我的CPU都会运行100%。我还试

浏览 1提问于2017-01-08得票数 1

1回答

XML数据的受控迭代

下午好, 我有一个简单的应用程序(只是学习)，它从一个模拟文件中读取一些xml数据。XML数据被很好地划分为6类，我使用SAX解析器来读取它。我的应用程序基本上有两个按钮，上一个和下一个。因此，当应用程序加载时，我希望看到第一类xml数据。当用户按下next button...well时，我希望看到下一类数据，等等，直到最后。我的问题是如何在数据之间来回移动？我是通过某种形式的排序将其全部加载到数据对象中并在对象中来回迭代，还是将atty字段添加到父元素中，然后在xml中搜索请求的atty和子数据？我不认为xml会变得非常大。只是尝试让更有经验的用户输入如何将数据与gui同步。 TIA JB

浏览 2提问于2012-05-09得票数 0

回答已采纳

1回答

Torch 7如何加载内存不能容纳的非常大的数据集？

、、

我有一些非常大的数据集，我想要加载到Torch中。但在运行我的学习算法之前，我无法将它们完全加载到内存中。我应该怎么做才能使性能最大化？

浏览 2提问于2015-10-05得票数 3

1回答

如何在没有特定网站/服务器的情况下为文本文件生成URL？

、、

这是我想要做的:生成一个url，我可以把它放到我的wordpress博客中，让用户查看一个大的文本文件。我不知道如何才能生成这个url。我受到了像Flickr这样的网站的启发，这些网站为图像生成urls，并希望有一个推论，只有文本文件。我当时正在学习MITx 6.00.1xPython课程，其中一项作业让我们参考了教授上传到他的课程网站上的一个文本文件。因此，文本文件有一个url：不确定此url是否对非成员可用。有没有办法把这个文件上传到一个通用的网址，任何人都可以免费访问？致以亲切的问候，斯宾塞

浏览 1提问于2015-07-22得票数 0

2回答

一种瀑布检测模型的训练

我的父母年纪大了，摔倒是件大事。我很擅长编码之类的。所以我想我应该使用一些秋季数据集并将它们插入到机器学习系统中。你可以从这句话中看出，我是机器学习的新手。我应该怎么开始得到我的第一个模型？文献指出，与KNN...do相比，我尝试决策树模型更好--我拿起TensorFlow，开始用数据集绘制模型，或者你怎么开始呢？谢谢，我为我的问题道歉。

浏览 0提问于2019-08-08得票数 0