我正在尝试编写一个函数,该函数在汇总表中对不同的数据集生成几种分类算法的输出。我正在使用caret包。
我将尝试演练到目前为止我所拥有的不同代码:
library(foreign) ## Get a concacated list of files is working directry
f<-c(dir())
## create and view an object with file names and full paths
file<-file.path("C:/Users/Documents/Datasets",c (f))
# use a loop
当我运行下面的代码时,我看到了“pca.explained_variance_ratio_”和一个直方图,它显示了每个特征解释的方差比例。
import statsmodels.api as sm
import numpy as np
import pandas as pd
import statsmodels.formula.api as smf
from statsmodels.stats import anova
mtcars = sm.datasets.get_rdataset("mtcars", "datasets", cache=True).dat
我正在尝试建立一个pca图,我写了这个程序。但是由于某种原因,我得到了一个空白的图表。如何解决此问题?
import pandas as pd
X = pd.read_csv('ANNCitydata.csv')
# load dataset into Pandas DataFrame
X1 = X.drop(['ID','City'], axis=1)
y = pd.read_csv('ANNCitydata.csv', usecols=["City"])
from sklearn.decomposition
如果我的VBA代码是:
Private Declare Function pca Lib "mc.dll" Alias "_pca@40" (ByVal n As Long, ByVal nsim As Long, ByVal nbucket As Long, ByVal percent As Double, ByRef cor As Double, ByRef result As Double, ByRef evalue As Double, ByRef evector As Double, ByRef np As Long) As Long
我的C#代码会是
我尝试在r中循环以获得多个Anova结果。然而,我一直收到以下错误:
Error in model.frame.default(formula = col ~ Total, data = phil_data,
:variable lengths differ (found for 'Total')
我不明白这是从哪里来的,因为Anova在循环之外工作(参见代码)。任何帮助都是非常感谢的。
multi.hist(phil_data[,c(7:23)],density=TRUE,freq=TRUE,bcol="cyan",main=" ")
ano
我将我的聚类中心投影到两个主成分上,但给出的图不在我的两组数据点的正确中心位置。我的代码如下所示。有没有人看到我哪里错了?PCA很好,但是集群的一个数据点还差得很远。我要提到的是,我的质心数据点有一半是负的。我已经尝试过反pca变换,真的不确定错误是从哪里来的。任何帮助都是非常感谢的!
import numpy as np
import sklearn
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
data = normaliz
我一直在遵循一个类似的答案,但我有一些问题,当使用sklearn和滚动应用。我正在尝试创建z分数,并使用滚动应用进行主成分分析,但我一直在使用'only length-1 arrays can be converted to Python scalars' error.
按照前面的示例,我创建了一个数据帧
from sklearn.preprocessing import StandardScaler
import pandas as pd
import numpy as np
sc=StandardScaler()
tmp=pd.DataFrame(np.random.ra
我正在从.js文件导入.json:import pca from './pca.js'。在控制台中使用console.log()会输出正确的JSON,但是当我试图在代码中访问它时
pca_json = JSON.parse(pca); (I can remove parsing, not working either)
pca_json["rowname"].forEach(...
webpack失败了,错误如下:
我尝试更改extention:.js -> .json,但它根本无法导入文件,在这种情况下,给了我另一个错误:
pca
我想有2个标签在侧边栏"otu选择“和"anova”。根据侧边栏中选择的选项卡,我想在主面板中输出不同的图或表。
目前我收到一个错误:
ERROR: object 'input.tabs' not found
这是我的脚本。
ui <- fluidPage(
# Make a title to display in the app
titlePanel(" Exploring the Effect of Metarhizium on the Soil and Root Microbiome "),
# Make the Side
我试图对数据(bmt) (KMsurv)进行Tukey测试,并且只关注变量t2和d3。t2:无病生存时间(复发时间、死亡时间或学业结束时间) d3:无疾病指标变量。d3 =1(死亡或复发),d3 =0(存活或无疾病)。可以使用KMsurv包获取数据。患者被分组为风险类别或组,以数据集中的变量g表示。
g = 1; ALL (acute lymphoblastic leukemia) 38 patients
g = 2; AML low risk (acute myeloctic leukemia) 54 patients
g = 3; AML high risk (ac
我有一个正在执行主成分分析(PCA)的数据集。当我尝试转换数据时,收到一条ValueError消息。以下是部分代码:
import pandas as pd
import numpy as np
import matplotlib as mpl
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA as sklearnPCA
data = pd.read_csv('test.csv',header=0)
X = data.ix[:,0:1000].value
age25=subset(juul,juul[,"age"]>25.00)## create a subset of age greater than 25
modelgf=lm(age25[,"igf1"]~age25[,"age"])
age20=subset(juul,juul[,"age"]<20.00)
modelgf2=lm(age20[,"igf1"]~age20[,"age"]) 我尝试使用anova(m1,m2)比较modelgf和modelgf2模型。但是,我收到一
我有一个大型的200000数据点数据集,每个数据点都包含132特性。所以基本上我的数据集是200000 x 132。
我使用完成了所有的计算。然而,我试图进行PCA分析,但是我收到了一个内存错误,我不知道这是因为我的RAM内存(8GB的Ram ),或者是由于框架本身的限制。
我收到以下错误:requested size is too large。
您能给我推荐另一个不具有大小/内存限制的PCA计算框架吗?
或者,如果你以前在PCA计算中使用过鲤鱼,遇到过这个问题,你能告诉我你是如何解决的吗?
我正在和一个叫"PCA9635“的硬件PWM-LED控制器一起工作.该芯片可以用"“库控制在Arduino上。
在库中提供的示例中,具有ledArray地址0x70的i2c由以下人员发起:
#include "PCA9635.h"
PCA9632 ledArray(0x70);
我的项目要求以不同的地址控制未知数量的PCA935控制器。
如何创建一个数组,如:
PCA9635 ledControlers[2] = {0x70,0x71};
以上内容不起作用。编译器中的错误消息:conversion from 'const int' to non