我不知道我在SGD方法中做错了什么

在SGD（Stochastic Gradient Descent，随机梯度下降）方法中，可能存在以下一些常见的错误或问题：

学习率设置不当：SGD方法中的学习率是一个重要的超参数，过大或过小的学习率都可能导致收敛困难或效果不佳。应根据具体情况调整学习率，可以尝试使用学习率衰减策略来动态调整学习率。
参数初始化问题：在SGD方法中，初始参数的选择可能会对模型的收敛速度和效果产生影响。合适的参数初始化方法可以帮助模型更快地收敛到最优解。常用的参数初始化方法包括随机初始化、Xavier初始化等。
数据预处理不当：SGD方法对数据的规模和分布敏感，若数据没有进行合适的预处理，如归一化、标准化、特征缩放等，可能会导致模型收敛困难或陷入局部最优。
过拟合或欠拟合：SGD方法在训练过程中容易出现过拟合或欠拟合的问题。过拟合指模型在训练集上表现良好，但在测试集上表现较差，可以通过增加正则化项、提前停止训练等方法来缓解。欠拟合指模型无法很好地拟合训练集数据，可以尝试增加模型复杂度或增加训练数据量来改善。
批量大小选择不当：SGD方法中的批量大小也是一个重要的超参数。过小的批量大小可能会导致训练过程中的噪声较大，过大的批量大小可能会导致模型陷入局部最优。通常可以通过交叉验证等方法选择合适的批量大小。
优化器选择问题：SGD是一种最基础的优化算法，但在实际应用中，还存在其他更高级的优化算法，如Adam、Adagrad等，它们能够更快地收敛到最优解。根据具体问题的特点，可以考虑使用不同的优化算法来优化模型。

总之，在SGD方法中，以上问题都可能会导致训练困难或效果不佳。因此，建议进行合适的学习率设置、参数初始化、数据预处理，注意过拟合和欠拟合问题，选择合适的批量大小和优化器，以提高SGD方法的效果。

注意：根据要求，我不会提及腾讯云相关产品和产品介绍链接地址。

在sklearn中从Pipeline对象返回系数

、、、

我已经用RandomizedSearchCV拟合了一个Pipeline对象 pipe_sgd = Pipeline([('scl', StandardScaler()), ('clf', SGDClassifier(n_jobs=-1))]) param_dist_sgd = {'clf__loss': ['log'], 'clf__penalty': [None, 'l1', 'l2', 'elas

浏览 6提问于2017-05-09得票数 24

回答已采纳

1回答

我不知道我在SGD方法中做错了什么

我有SGD方法： def StochasticgradientDescent(theta, alpha, num_observations, iterations): for i in range (iterations): x1 = random.choice(x) y1 = random.choice(y) f = np.matmul(x1,theta) error = np.subtract(f,y1) gradient = np.matmul(x1.transpose().reshape(2,1

浏览 12提问于2020-10-04得票数 1

1回答

使用libCGAL-vc120-mt-sgd-4.5.1.lib链接错误，似乎无法找到或构建它

、、

嘿，当涉及到CGAL和CMake时，我是个菜鸟，但是我已经到了这样的地步，除了这个链接错误之外，所有东西似乎都在运行：链接:致命错误LNK1104:无法打开文件'libCGAL-vc120-mt-sgd-4.5.1.lib‘ 问题是我似乎找不到对这个库的引用，我建错了吗？我可以在我的cgal lib dir中看到'libCGAL-vc120-mt-gd-4.5.1.lib‘，它链接得很好。我不知道gd和sgd之间有什么区别，以及如何做到这一点。任何帮助都是非常感谢的。

浏览 0提问于2015-01-15得票数 1

2回答

tensorflow中具有重量衰减参数的SGD

、、、

在Keras和Pytorch中，SGD优化器具有权重衰减参数，我发现tf.train.GradientDescentOptimizer没有重量衰减参数。什么是tensorflow等效的SGD与重量衰减？ Pytorch Keras优化器-

浏览 4提问于2019-03-07得票数 1

1回答

Spacy3.0的nlp.update问题: TypeError：[E978] Language.update方法接受示例对象的列表，但得到的是：{}

、、

在Spacy3.0版中，nlp.update似乎有一些变化。我完全被这个简单的代码搞糊涂了： examples = TRAIN_DATA random.shuffle(examples) losses = {} for batch in minibatch(examples, size=8): nlp.update(batch, sgd=optimizer, drop=0.35, losses=losses) 当我输入( batch )时，它表明batch的类型是list。但是错误消息说它是一个元组。我还尝试将其转换为列表，但没有成功。我做错了什么？确切的错误是：小批量

浏览 64提问于2021-02-24得票数 2

回答已采纳

1回答

SOAP请求在数组中带有foreach循环

、、、

我需要SOAP请求如下所示： <x:Envelope xmlns:x="http://schemas.xmlsoap.org/soap/envelope/" xmlns:tem="http://tempuri.org/" xmlns:sgd="http://schemas.datacontract.org/2004/07/SGDDWebServiceContracts.Messages" xmlns:sgd9="http://schemas.datacontract.org/2004/07/SGDDWebServiceContrac

浏览 1提问于2016-04-27得票数 0

1回答

XOR神经网络回归卢布

、、、、

我在Tensorflow.js中的异或“神经网络”一直在返回垃圾预测，而loss总是停留在0.25。我不知道我做错了什么。谢谢你的帮助! const model = tf.sequential(); model.add(tf.layers.dense({units: 2, activation: 'sigmoid', inputShape: [2]})); model.add(tf.layers.dense({units: 1, activation: 'sigmoid'})); model.compile({loss:'meanSquaredE

浏览 1提问于2018-10-24得票数 0

回答已采纳

3回答

JSON到C#数组

、、

我有一个ASP.NET方法，需要提取一些货币汇率。 protected void btnTest_Click(object sender, EventArgs e) { HttpWebRequest WebReq = (HttpWebRequest)WebRequest.Create(string.Format("https://api.fixer.io/latest?base=JPY&symbols=SGD")); WebReq.Method = "GET"; HttpWebResponse WebResp = (HttpW

浏览 1提问于2018-03-06得票数 0

2回答

为什么sklearn中的SGDRegressor函数不能收敛到正确的最优值？

、、、、

我正在练习在sklearn中使用SGDRegressor，但我遇到了一些问题，我将其简化为以下代码。 import numpy as np from sklearn.linear_model import SGDRegressor X = np.array([0,0.5,1]).reshape((3,1)) y = np.array([0,0.5,1]).reshape((3,1)) sgd = SGDRegressor() sgd.fit(X, y.ravel()) print("intercept=", sgd.intercept_) print("coe

浏览 58提问于2021-03-01得票数 3

回答已采纳

1回答

SGD分类器和Logisitc回归有什么区别？

、、、

据我理解，SGD分类器和Logistic回归似乎相似。损失=对数的SGD分类器实现Logistic回归，损失=铰链实现线性支持向量机。我还了解到logistic回归采用梯度下降作为优化函数，SGD采用随机梯度下降，收敛速度要快得多。但这两种算法中哪一种会在哪种情况下使用？另外，SGD和Logistic回归有什么相似之处，它们又有何不同？

浏览 0提问于2018-09-07得票数 10

1回答

将处理或函数应用于需要从另一个sqlite表检索列的列

、

假设我在sqlite3中有这个表sqlite3。 name, currency, price AA, SGD, 1 BB, USD, 2 CC, EUR, 3 我需要以这种方式处理价格。 if currency == "SGD", price = price*X if currency == "USD", price = price*Y if currency == "EUR", price = price*Z X、Y、Z的值需要从另一个表currency_multipl

浏览 1提问于2018-10-18得票数 1

回答已采纳

1回答

非线性回归:为什么模型不能学习？

、、、、

我刚开始学习keras。我正在尝试在keras中训练一个非线性回归模型，但model似乎学不到太多。 #datapoints X = np.arange(0.0, 5.0, 0.1, dtype='float32').reshape(-1,1) y = 5 * np.power(X,2) + np.power(np.random.randn(50).reshape(-1,1),3) #model model = Sequential() model.add(Dense(50, activation='relu', input_dim=1)) model.add

浏览 3提问于2018-02-23得票数 5

回答已采纳

1回答

使用scikit-learn重新初始化已学习的线性模型

、

假设我运行SGDRegressor或SGDClassifier，并获得一组我想在将来使用的系数。做基本的预测绝对是微不足道的(因为对于回归器来说，这只是矩阵乘法)，但如果能够在拟合的模型上使用其他方法(如predict_proba等)，那就更好了。有没有一般的方法可以做到这一点？我翻遍了所有的文件但什么也没找到。为清晰起见，特定的代码示例： from sklearn import linear_model sgd = linear_model.SGDRegressor() sgd.fit([[0, 1, 1], [0, -1, 1]], [0, 1]) coefs = sgd.coef_

浏览 4提问于2013-05-20得票数 2

回答已采纳

1回答

为什么我的损失值开始在-10,000左右，而我的准确性没有提高？

、、、

我正在使用Keras库开发一个多标签分类器，但是我的准确率相对较低，大约为2%，而且我的每个时期的损失值大约是-10,000，但在历次之间变化很小。我对Keras比较陌生，但我需要在我的大学工作中使用它，我想知道出了什么问题。我的模型目前看起来如下： model = Sequential() model.add(Dense(1024, activation='relu', input_shape=X.shape[1:])) model.add(Dropout(0.2)) model.add(Dense(512, activation='relu')) mode

浏览 0提问于2018-03-01得票数 0

1回答

为什么我的SGD比我的线性回归模型差得多？

、、、

我试着比较线性回归(正常方程)和SGD，但看起来SGD离我们很远。我做错了什么吗？这是我的密码 x = np.random.randint(100, size=1000) y = x * 0.10 slope, intercept, r_value, p_value, std_err = stats.linregress(x=x, y=y) print("slope is %f and intercept is %s" % (slope,intercept)) #slope is 0.100000 and intercept is 1.61435309565e-11 这是我的

浏览 9提问于2015-07-14得票数 3

回答已采纳

1回答

如何使用ROLLUP为mysql中的一个列创建超级聚合？

、、

我有以下表格： CREATE TABLE IF NOT EXISTS Business ( Ticker VARCHAR(255) NOT NULL UNIQUE, Company_Name VARCHAR(255) NOT NULL UNIQUE, Currency CHAR(3) NOT NULL, Portfolio VARCHAR(255) NOT NULL, PRIMARY KEY ( Company_Name ), FOREIGN KEY ( Currency ) REFERENCES Currenc

浏览 4提问于2021-01-03得票数 0

回答已采纳

2回答

小批量减少SGD的缺点吗？

、

许多专家说，“批处理比SGD具有更多的本地最优可能性”。但是，我不知道原因..。 📷 SGD如何能比批处理更好地避免局部最优？)有些人告诉我，过度射击是原因。但是，我也不知道在SGD有更多的过度射击) 如果你用几何、数学或其他直觉概念来解释这个原因，那就太棒了！

浏览 0提问于2020-01-09得票数 1

1回答

MATLAB中的随机梯度下降算法

、、、

我试图在MATLAB中实现随机梯度下降，但我在哪里出错了。我认为，也许我检查收敛的方式是不正确的(我不太确定如何用每次迭代更新估计器)，但我不确定。我一直在尝试拟合基本的线性数据，但是我得到的结果还很远，我希望能得到一些帮助。有人能指出我哪里出了问题吗?为什么这不能正常工作？谢谢! 以下是设置的数据和通用代码： clear all; close all; clc N_features = 2; d = 100; m = 100; X_train = 10*rand(d,1); X_test = 10*rand(d,1); X_train = [ones(d,1) X_train]; X_

浏览 8提问于2016-10-09得票数 0

1回答

交叉val预测预期作为输入一个已经拟合的模型？

、

我在读杰伦的手工机器学习。在第90页中，有一个关于混淆矩阵的章节。他说我们需要一些预测，所以他做了以下几点： from sklearn.model_selection import cross_val_predict y_train_pred = cross_val_predict(sgd_clf, X_train, y_train5, cv=3) 该对象sgd_clf是一种随机梯度下降分类器，它与前一部分中的列车数据相匹配。我的问题是:既然已经安装好了，为什么最好把火车分成三部分再进行再培训(?)sgd_clf在其中的两个，然后做一个预测等，如果sgd_clf已经训练了？为什么不让它在完整

浏览 3提问于2022-07-24得票数 -1

3回答

在python中SGD分类器和SGD回归器有什么不同？

、、

在python sklearn中，SGD分类器和SGD回归器有什么不同？另外，我们可以设置批处理大小以提高性能吗？

浏览 3提问于2019-02-15得票数 1

2回答

DNN训练中的无耗氧优化与梯度下降

、、、、

对于深度神经网络(DNN)的训练，Hessian-Free (HF)优化技术与梯度下降(例如随机梯度下降(SGD)、间歇梯度下降(SGD)、自适应梯度下降)比较如何？在什么情况下，人们应该更喜欢高频技术，而不是梯度下降技术？

浏览 3提问于2015-07-22得票数 2

回答已采纳

2回答

在神经网络中寻找最优学习速率和学习周期

、、、、

我创建了一个单层神经网络，它有两个输出(每个类一个，0或1个)，使用sigmoid方法和SGD优化器进行训练。我也训练过没有任何隐藏层的神经网络。此外，我还用4分片的StratifiedKFold验证了模型的性能。训练的模型是用lr=0.1和epochs=150设计的，但是，我不知道这些值是否在优化模型。由于这个原因，我想运行20个组合的学习速率参数和时代，以看到最准确的结果和这些参数的组合，我得到它。限制规定如下：历元: 10到150学习率的数值:0.0 1到1之间的值请参阅下面的代码： from sklearn.model_selection import StratifiedKFol

浏览 0提问于2019-11-25得票数 0

回答已采纳

1回答

Python熊猫从dataframe中获得价值并存储在对象中

、、、

考虑到以下熊猫的数据，我如何创建一个对象数组，其中包含2020到2015年间年份的所有值？假设数据包括2020年至2010年的数据。 Year Yield Total Amount ExDate PayDate \ 0 2020 3.09% SGD 0.66 SGD0.33 2020-05-12 2020-05-26 1 2020 3.09% SGD 0.66 SGD0.33 2020-05-12 2020-05-26 2 2019 7.02% SGD 1.5 SGD0.3 2019-11-18

浏览 7提问于2020-07-19得票数 0

回答已采纳

1回答

我可以将SGD与多项朴素贝叶斯一起使用吗？

、、、、

我想知道我是否可以使用SGD训练你的MNB模型，以及这是否是有效的方法。我的应用程序是文本分类。在中，我发现没有MNB可用，默认情况下是支持向量机，但是NB是线性模型，不是吗？因此，如果我的似然参数(使用拉普拉斯平滑)可以估计为我可以用SGD更新我的参数并最小化成本函数吗？请告诉我SGD是否在这里无关紧要。提前谢谢。更新:所以我得到了答案，并希望我得到了正确的答案，即MNB的参数由给定输入文本中的单词occurence更新(如tf-idf)。但我仍然不明白为什么我们不能使用SGD进行MNB培训。如果用明确的描述或一些数学解释来解释它，我会理解它。谢谢

浏览 2提问于2016-11-28得票数 0

1回答

Keras自定义优化器批量更改参数

、、

我想定制我自己的优化器，它会在keras中的每一批结束时改变学习速率。首先，我构建了一个自定义回调： class custom_callback(Callback): def __init__(self,lr): super(op_callback, self).__init__() self.lr=lr def on_batch_end(self,batch,logs={}): sgd = SGD(lr=batch*self.lr) self.model.compile(optimizer=sgd,loss='categorical_cros

浏览 0提问于2018-09-11得票数 0

1回答

我怎样才能提高我的准确性，避免过度拟合？CNN-Keras-VGG16 16

、、、、

正如我在这个问题中所问的：如果我在火车上的准确率大约是100%，为什么我的预测不好(凯拉斯CNN，我的问题是过于合适，所以，我减少了层数，现在我有了这个模型： vgg16_model = VGG16(weights="imagenet", include_top=True) # (2) remove the top layer base_model = Model(input=vgg16_model.input, output=vgg16_model.get_layer("block5_pool").output) #

浏览 0提问于2019-10-30得票数 1

回答已采纳

1回答

Keras序列模型损失不会减少&在所有时期保持不变

、、、

import numpy as np import pandas as pd from sklearn.model_selection import train_test_split df = pd.read_csv('insurance.csv') X = df.drop(['sex', 'children', 'smoker', 'region'], axis = 1) X = X.values y = df['charges'] y = y.values.reshape(1331,1) X_t

浏览 0提问于2018-09-29得票数 0

回答已采纳

1回答

SGD分类器精度-召回曲线

、、、、

我正在研究一个二进制分类问题，我有一个sgd分类器，如下所示： sgd = SGDClassifier( max_iter = 1000, tol = 1e-3, validation_fraction = 0.2, class_weight = {0:0.5, 1:8.99} ) 我把它安装在我的训练集上，并绘制了精确召回曲线： from sklearn.metrics import plot_precision_recall_curve disp = plot_precision_recall_curv

浏览 1提问于2021-05-09得票数 1

回答已采纳

2回答

TerminatedWorkerError:由执行器管理的工作进程意外终止。

、、、

我正试图为我的深度学习模型寻找最佳的超参数。当我使用'GridSearchCV‘方法并尝试拟合我的模型时，我最终出错了 "TerminatedWorkerError:由执行器管理的工作进程意外终止。这可能是由于调用函数时出现分段错误或导致操作系统杀死工人的过多内存使用造成的。工作人员的退出代码为{ exit (1)}。“ 我已经更新和测试了枕木库，这很好。我不能用n_jobs=-1。我必须使用最多16个CPU (n_jobs=16)。我的平台: NAME="Ubuntu“VERSION="16.04.6 LTS (Xenial Xerus)”。我正在使

浏览 4提问于2019-09-20得票数 10

5回答

无法从'keras.optimizers‘导入SGD和Adam

、、

试着跑-- from keras.optimizers import SGD, Adam，，我得到了这个错误-- 跟踪(最近一次调用)： "C:\Users\usn\Downloads\CNN-Image-Denoising-master文件文件从keras.optimizers导入的 ImportError:无法从“keras.optimizers”导入名称“SGD” 以及此错误，如果我从导入语句中删除SGD - ImportError:无法从“keras.optimizers”导入名称“Adam” 我找不到解决这个问题的办法。我安装了Keras和TensorFlo

浏览 11提问于2021-05-19得票数 16

回答已采纳

1回答

在角度12/13中创建管道时的获取和未知误差

我目前正在做一个项目，我创建了一个新管道，但是它显示了一个错误。我不知道这个错误意味着什么，也不知道如何解决它。 (method) SumPipe.transform(value: any, currancy: string): any This member must have an 'override' modifier because it overrides a member in the base class 'CurrencyPipe'. import { CurrencyPipe } from '@angular/common';

浏览 1提问于2022-11-22得票数 0

回答已采纳

1回答

如何在MySQL中填充外部连接多个表

、、、

我需要FULL OUTER JOIN多个表。我知道如何从FULL OUTER JOIN中提取两个表。但我有几张桌子，我不能把它用在上面。我怎样才能做到这一点？下面是我的SQL代码： INSERT INTO table ( customer_id ,g01 ,g02 ,g03 ,has_card ,activity ) SELECT sgd.customer_id, sgd.g01,sgd.g02,sgd.g03,sc.value, a.activity FROM s_geo_data sgd LEFT JOIN s_category sc ON sc.cus

浏览 2提问于2015-05-28得票数 6

3回答

如何修正调度程序的“恢复优化器时未指定的initial_lr”错误？

、、、

在PyTorch中，我配置了这样的SGD： sgd_config = { 'params' : net.parameters(), 'lr' : 1e-7, 'weight_decay' : 5e-4, 'momentum' : 0.9 } optimizer = SGD(**sgd_config) 我的要求是：总年数为100。每30个时代的学习率会降低10倍。学习率的下降将在60年代停止。因此，在100个时代，我将得到两倍的0.1降低我的学习率。我读过关于学习速率调度

浏览 64提问于2022-04-29得票数 0

1回答

Keras预处理交易数据

、、

我在对来自.csv的交易数据进行预处理时遇到了问题，因此它适合于sgd模型、神经网络的输入/输出。我用熊猫库导入了数据，但是也许有更好的方法呢？我需要设置列名，内部数据需要双类型，并将其转换为tf.data.Dataset。我有两个数据集: testingdata.csv和trainingdata.csv 每个列有4列:打开，最大，最小，关闭 ‘'Open’列是一个预测值Y，而'max‘、'min’和'close‘是X输入。此外，我也不知道什么是“度量”，在这里我应该使用什么度量？所以我的问题是:什么是最好的方法，如何去做。谢谢

浏览 10提问于2021-04-04得票数 0

回答已采纳

1回答

将参数传递到keras丢失函数的语法是什么？

、

我试图用from_logits=True给我的keras神经网络绝对交叉熵损失。但是，我不知道如何将其传递到代码中，因为它要求我指定目标和输出。一般情况下，我可以使用： network.compile(sgd, loss='categorical_crossentropy'), 但现在我得试试这个： network.compile(sgd, loss=categorical_crossentropy(from_logits=True)) 这给了我一个错误： TypeError: categorical_crossentropy() missing 2 required pos

浏览 3提问于2020-02-04得票数 1

回答已采纳

1回答

从SGD算法中提取权重

、

因此，我正在为二进制分类问题实现SGD。有两类点，我想绘制决策边界，但我不知道如何从代码中提取权重来绘制它。以下是代码： def train_model(train_dl, model): # define the optimization criterion = nn.BCELoss(reduction='none') optimizer = torch.optim.SGD(net.parameters(), lr=0.1) # enumerate epochs for epoch in range(10): # en

浏览 3提问于2022-02-15得票数 0

1回答

基于场景大纲示例或外部文件从响应中提取JSON元素

这是我的api响应。希望根据displayNumber提取Id的值。这个显示号是在示例/csv文件中的值列表中给定的。 { "Acc": [ { "Id": "2b765368696b3441673633325", "code": "SGD", "val": 406030.83, "displayNumber": "8957", "curval": 406030.83 },

浏览 1提问于2022-05-29得票数 1

1回答

随机梯度下降(动量)公式实现C++

、、、、

所以我有一个神经网络的实现，我在Youtube上关注了它。这家伙使用SGD (动量)作为优化算法，双曲正切作为激活函数。我已经将传递函数更改为Leaky ReLU (用于隐藏层)和Sigmoid (用于输出层)。但是现在我决定我也应该把优化算法改为Adam。我最终在维基百科上搜索SGD (动量)，以更深入地了解它是如何工作的，我注意到有些地方不对劲。这家伙在视频中使用的公式与维基百科上的不同。我不确定这是不是个错误...这段视频有一个小时长，但我不是要你看整个视频，而是我对54m37s的标记和维基百科的公式很感兴趣，就在这里：因此，如果你看看这家伙的实现，然后看看维基百科链接的SGD

浏览 0提问于2018-02-04得票数 0

2回答

如何在使用tf.keras.optimizers.schedules.ExponentialDecay?时获取TensorFlow 2.0中SGD优化器的当前学习率

、

我想在tensorflow2.0的SGD优化器中降低学习率，我使用了下面这行代码： lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay( initial_learning_rate=self.parameter['learning_rate'], decay_steps=(1000), decay_rate=self.parameter['lr_decay'] ) opt = tf.keras.optim

浏览 0提问于2019-11-11得票数 9

1回答

当神经网络的局部极小值等价时，SGD变体性能更好的原因？

、、

从一些神经网络的文章中我读到，如果你扩大神经网络的结构，不同的局部极小值在损失面上的差异就会减小。基本上，所有的局部极小值都是等价的。如果是这样，那么为什么SGD的不同变体(如Adagrad、ADAM等)？比普通的SGD好吗？我相信使用这些SGD变体的原因是为了解决“坏”的局部极小值问题，但如果所有局部极小值或多或少是相同的，那么使用这些变量的目的是什么？

浏览 0提问于2016-08-10得票数 1

回答已采纳

1回答

在keras中裁剪adam优化器的奖励

、、、、

我想把奖励剪辑在角纸上。我看到可以剪切规范，并将值为sgd，如下所示： sgd = optimizers.SGD(lr=0.01, clipnorm=1.) sgd = optimizers.SGD(lr=0.01, clipvalue=0.5) 什么是剪裁规范和裁剪价值？另外，如何才能实现对亚当的奖励？你能告诉我怎么做吗？

浏览 0提问于2018-10-03得票数 9

1回答

神经网络错误，有人能帮我吗？

、、、

我通过神经网络观看了YouTube视频，讲述了如何使用神经网络创建智能聊天机器人(链接到视频= )。我一步一步地跟着它。在我尝试执行training.py文档之前，一切都很好。以下代码： import random import json import pickle from tabnanny import verbose import numpy as np import nltk from nltk.stem import WordNetLemmatizer # used for the word stem (ex. work, work-ed, work-ing) from

浏览 7提问于2022-01-29得票数 0

1回答

Keras - TensorBoard不保存日志文件

、、

作为网络的一个例子，我使用了第一个示例我想在这个网络上使用张力板。在阅读了有关如何使用的TensorBoard之后，我将这些命令添加到代码中： from keras.callbacks import TensorBoard TensorBoard("Directory path that contains the log files") 输出听起来是正确的： Out[3]: <keras.callbacks.TensorBoard at 0x7f14730e79b0> 但目录里什么都没有..。我做错了什么？以下是完整的代码： import keras from

浏览 0提问于2018-07-04得票数 3

回答已采纳

1回答

如何使用Keras Tuner调整优化功能？

、、、

如何使用Keras Tuner调整优化功能？我想试试SGD，Adam和RMSprop。我试过了： hp_lr = hp.Choice('learning_rate', values=[1e-2, 1e-3, 1e-4]) hp_optimizer = hp.Choice('optimizer', values=[SGD(learning_rate=hp_lr), RMSprop(learning_rate=hp_lr), Adam(learning_rate=hp_lr)]) model.compile(optimizer=hp_optimizer,

浏览 28提问于2021-04-27得票数 1

回答已采纳

1回答

如何在TensorFlow 2.0中降低SGD优化器的学习速度？

、、

我想在tensorflow2.0 2.0的SGD优化器中降低学习率，我使用了这一行代码：tf.keras.optimizers.SGD(learning_rate, decay=lr_decay, momentum=0.9)，但我不知道我的学习速度是否下降了，我如何才能获得当前的学习速度？

浏览 6提问于2019-11-07得票数 5

回答已采纳

1回答

在随机梯度下降中增加费用的目的是什么？

、、

我正试图实现一个基于斯坦福在他们第一次分配给cs224n的脚手架基础上的SGD。实现是用python实现的。该脚手架如下： def load_saved_params(): '''A helper function that loads previously saved parameters and resets iteration start.''' return st, params, state #st = starting iteration def save_params(iter, params): '''s

浏览 1提问于2017-08-29得票数 1

回答已采纳

2回答

AsyncTask太慢的HttpURLConnection (安卓)

、、、

我试图从互联网上获取数据，并将它们保存在变量中，但过程太慢了……下面是我的代码： `public class CurrConvert extends AsyncTask { boolean connection = true; float exchangeRate(final String currencyFrom, final String currencyTo) throws IOException { URL url = new URL("http://quote.yahoo.com/d/quotes.csv?s=" + currenc

浏览 20提问于2016-09-02得票数 1

回答已采纳

1回答

TensforflowJS nodejs绑定，无法设置自定义优化器

、

我刚刚开始使用tensorflowjs和tensorflow，我遇到了一个我不能完全解决的问题。我正在尝试更改优化器的学习率，但只要我使用自定义优化器，我就会收到以下错误： User-defined optimizer must be an instance of tf.Optimizer 为了创建我的模型，我执行以下操作(取自docs )： const model = tf.sequential(); model.add(tf.layers.dense({units:1, inputShape:[11]})); model.compile({ optimizer: tf.tr

浏览 3提问于2018-12-17得票数 1

回答已采纳

4回答

在Keras中使用Tensorflow Huber loss

、、、

我正在尝试在keras模型中使用huber loss (编写DQN)，但我得到了不好的结果，我认为我做错了什么。我的is代码如下。 model = Sequential() model.add(Dense(output_dim=64, activation='relu', input_dim=state_dim)) model.add(Dense(output_dim=number_of_actions, activation='linear')) loss = tf.losses.huber_loss(delta=1.0) model.compile(los

浏览 360提问于2017-12-16得票数 14

回答已采纳

1回答

Julia Flux错误: SGD优化器未定义

、

我想使用SGD优化器在Flux.jl的深入学习朱莉娅学院教程中所示的流量。是他们提供的笔记本电脑，他们在其中使用SGD优化器作为： opt = SGD(params(model)) 然而，当我运行SGD时，我得到： ERROR: UndefVarError: SGD not defined 这是我运行?SGD时的输出 search: SGD AMSGrad Signed signed Unsigned unsigned sigmoid issetgid logsigmoid StringIndexError isassigned significand Couldn't find S

浏览 2提问于2020-01-20得票数 6

回答已采纳