首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

RDKit | 基于Ward方法化合物进行分层

从大量化合物构建结构多样的化合物库: 方法 基于距离的方法 基于分类的方法 使用优化方法方法 通过使用Ward方法进行从化合物库中选择各种化合物,Ward方法是分层方法之一。...Morgan指纹生成和距离矩阵计算 创建指纹作为的输入数据,并使用它创建距离矩阵。...Ward方法进行 使用Ward方法将其分为6个。...树状图中,x轴表示每个数据,y轴表示之间的距离,与x轴上的水平线相交的数是数。 PCA:主成分分析 可视化结果的另一种方法数据降维。...换句话说,如果主要使用剩余的60%信息进行,则无法在2D平面上将其分离。进行主成分分析时,请确保在做出任何决定之前检查累积贡献。 ----

1.6K60

Python使用系统算法随机元素进行分类

系统算法又称层次或系谱,首先把样本看作各自一,定义间距离,选择距离最小的一元素合并成一个新的,重复计算各类之间的距离并重复上面的步骤,直到将所有原始元素分成指定数量的。...该算法的计算复杂度比较高,不适合大数据问题。...进行,最终划分为k''' points = points[:] while len(points)>k: nearest = float('inf') # 查找距离最近的两个点...,进行合并 # 合并后的两个点,使用中点代替其坐标 for index1, point1 in enumerate(points[:-1]): position1...points.append(p) # 查看每步处理后的数据 print(points) return points # 生成随机测试数据 points = generate('abcde

1.4K60
您找到你想要的搜索结果了吗?
是的
没有找到

使用高斯混合模型不同的股票市场状况进行

我们可以根据一些特征将交易日的状态进行,这样会比每个每个概念单独命名要好的多。...有监督与无监督机器学习 这两种方法的区别在于使用数据集是否有标记:监督学习使用有标注的输入和输出数据,而无监督学习算法没有确定的输出。数据集的标注是响应变量或试图预测的变量包含数值或分类值。...上图代表了一些具有 4 个集群的多模态数据。高斯混合模型是一种用于标记数据模型。 使用 GMM 进行无监督的一个主要好处是包含每个的空间可以呈现椭圆形状。...高斯混合模型不仅考虑均值,还考虑协方差来形成集群 GMM 方法的一个优点是它完全是数据驱动的。提供给模型的数据就可以进行。...这个还需要进一步的调查使用符合 GMM 的宏观经济数据美国经济进行分类 为了直观演示 GMM,我将使用二维数据(两个变量)。每个对应的簇都是三个维度的多正态分布。

1.6K30

用电负荷时间序列数据进行K-medoids建模和GAM回归

让我们使用一种基于模型的基本表示方法- 平均季节性。在此还有一个非常重要的注意事项,对时间序列进行归一化是对时间序列进行每次或分类之前的必要步骤。...我们想要提取典型的消耗曲线,而不是根据消耗量进行。 维数上已大大降低。现在,让我们使用K-medoids方法来提取典型的消耗量。...让我们对数据进行并可视化其结果。 让我们绘制 评估的结果。 的最佳数目为7。让我们绘制结果。 提取的消费数据比平均季节性数据更平滑。现在,K 中心提取了4个典型的轮廓,并确定了3个簇。...但是也可以检查具有不同数量的其他结果。 结论 在本教程中,我展示了如何使用时间序列表示方法来创建用电量的更多特征。然后,用时间序列进行K-medoids,并从创建的中提取典型的负荷曲线。...---- 本文摘选《用电负荷时间序列数据进行K-medoids建模和GAM回归》

67130

R语言k-Shape时间序列方法股票价格时间序列|附代码数据

本文我们将使用k-Shape时间序列方法检查与我们有业务关系的公司的股票收益率的时间序列企业企业交易和股票价格在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性。...----本文摘选 《 R语言k-Shape时间序列方法股票价格时间序列 》 ,点击“阅读原文”获取全文完整资料。...Python Monte Carlo K-Means实战研究R语言k-Shape时间序列方法股票价格时间序列R语言对用电负荷时间序列数据进行K-medoids建模和GAM回归R语言谱...Python、R小说进行文本挖掘和层次可视化分析案例R语言k-means、层次、主成分(PCA)降维及可视化分析鸢尾花iris数据集R语言有限混合模型(FMM,finite mixture...R语言进行网站评论文本挖掘基于LDA主题模型的商品评论文本挖掘R语言鸢尾花iris数据集的层次聚类分析R语言对用电负荷时间序列数据进行K-medoids建模和GAM回归R语言算法的应用实例

46300

R语言k-Shape时间序列方法股票价格时间序列|附代码数据

本文我们将使用k-Shape时间序列方法检查与我们有业务关系的公司的股票收益率的时间序列 企业企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性。...k-Shape k-Shape [Paparrizos和Gravano,2015]是一种关注时间序列形状的时间序列方法。...将每个时间序列与每个的质心向量进行比较,并将其分配给最近的质心向量的 更新群集质心向量 重复上述步骤1和2,直到集群成员中没有发生更改或迭代次数达到最大值。...---- 用电负荷时间序列数据进行K-medoids建模和GAM回归 01 02 03 04 将zscore作为“preproc”,“sbd”作为距离,以及centroid =“shape...---- 本文摘选 《 R语言k-Shape时间序列方法股票价格时间序列 》。 ----

26620

R语言k-Shape时间序列方法股票价格时间序列|附代码数据

本文我们将使用k-Shape时间序列方法检查与我们有业务关系的公司的股票收益率的时间序列 企业企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性。...k-Shape k-Shape [Paparrizos和Gravano,2015]是一种关注时间序列形状的时间序列方法。...将每个时间序列与每个的质心向量进行比较,并将其分配给最近的质心向量的 更新群集质心向量 重复上述步骤1和2,直到集群成员中没有发生更改或迭代次数达到最大值。...---- 用电负荷时间序列数据进行K-medoids建模和GAM回归 01 02 03 04 将zscore作为“preproc”,“sbd”作为距离,以及centroid =“shape...---- 本文摘选 《 R语言k-Shape时间序列方法股票价格时间序列 》 。 ----

36100

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

时序数据方法,该算法按照以下流程执行。使用基于互相关测量的距离标度(基于形状的距离:SBD)根据 1 计算时间序列的质心。...(一种新的基于质心的算法,可保留时间序列的形状)划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...r语言有限正态混合模型EM算法的分层、分类和密度估计及可视化Python Monte Carlo K-Means实战研究R语言k-Shape时间序列方法股票价格时间序列R语言对用电负荷时间序列数据进行...建模和GAM回归R语言算法的应用实例用电负荷时间序列数据进行K-medoids建模和GAM回归分位数回归、GAM样条曲线、指数平滑和SARIMA电力负荷时间序列预测【视频】R语言广义相加模型...(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口R语言对用电负荷时间序列数据进行K-medoids建模和GAM回归用电负荷时间序列数据进行K-medoids建模和

82400

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

p=27078最近我们被客户要求撰写关于时间序列进行研究报告,包括一些图形和统计输出。 时序数据方法,该算法按照以下流程执行。...(一种新的基于质心的算法,可保留时间序列的形状)划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...r语言有限正态混合模型EM算法的分层、分类和密度估计及可视化Python Monte Carlo K-Means实战研究R语言k-Shape时间序列方法股票价格时间序列R语言对用电负荷时间序列数据进行...建模和GAM回归R语言算法的应用实例用电负荷时间序列数据进行K-medoids建模和GAM回归分位数回归、GAM样条曲线、指数平滑和SARIMA电力负荷时间序列预测【视频】R语言广义相加模型...(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口R语言对用电负荷时间序列数据进行K-medoids建模和GAM回归用电负荷时间序列数据进行K-medoids建模和

94220

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

(一种新的基于质心的算法,可保留时间序列的形状)划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...r语言有限正态混合模型EM算法的分层、分类和密度估计及可视化Python Monte Carlo K-Means实战研究R语言k-Shape时间序列方法股票价格时间序列R语言对用电负荷时间序列数据进行...:确定最优数分析IRIS鸢尾花数据和可视化Python、R小说进行文本挖掘和层次可视化分析案例R语言k-means、层次、主成分(PCA)降维及可视化分析鸢尾花iris数据集R语言有限混合模型...建模和GAM回归R语言算法的应用实例用电负荷时间序列数据进行K-medoids建模和GAM回归分位数回归、GAM样条曲线、指数平滑和SARIMA电力负荷时间序列预测【视频】R语言广义相加模型...(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口R语言对用电负荷时间序列数据进行K-medoids建模和GAM回归用电负荷时间序列数据进行K-medoids建模和

1K00

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

p=27078 最近我们被客户要求撰写关于时间序列进行的研究报告,包括一些图形和统计输出。 时序数据方法,该算法按照以下流程执行。...使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列的质心。...(一种新的基于质心的算法,可保留时间序列的形状) 划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...它是一种更改簇数,绘制每个 SSE 值,并将像“肘”一样弯曲的点设置为最佳簇数的方法。 #计算到1~10个群组 for i  in range(1,11):     #进行计算。     ...disorons.append(ks.netia_) plt.plot(range(1,11), disorins, marker='o') ---- ---- 本文选自《Python用KShape对时间序列进行和肘方法确定最优

43800

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

p=27078 最近我们被客户要求撰写关于KShape对时间序列进行的研究报告,包括一些图形和统计输出。 时序数据方法,该算法按照以下流程执行。...使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列的质心。...(一种新的基于质心的算法,可保留时间序列的形状) 划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...() plt.show() ---- R语言k-Shape时间序列方法股票价格时间序列 01 02 03 04 用肘法计算簇数 什么是肘法......disorons.append(ks.netia_) plt.plot(range(1,11), disorins, marker='o') ---- ---- 本文选自《Python用KShape对时间序列进行和肘方法确定最优

60300

Python用KShape对时间序列进行和肘方法确定最优数k可视化|附代码数据

p=27078  时序数据方法,该算法按照以下流程执行。 使用基于互相关测量的距离标度(基于形状的距离:SBD) 根据 1 计算时间序列的质心。...(一种新的基于质心的算法,可保留时间序列的形状) 划分成每个簇的方法和一般的kmeans一样,但是在计算距离尺度和重心的时候使用上面的1和2。...() plt.show() 点击标题查阅往期内容 R语言k-Shape时间序列方法股票价格时间序列 左右滑动查看更多 01 02 03 04 用肘法计算簇数 什么是肘法......它是一种更改簇数,绘制每个 SSE 值,并将像“肘”一样弯曲的点设置为最佳簇数的方法。 #计算到1~10个群组 for i  in range(1,11):     #进行计算。     ...disorons.append(ks.netia_) plt.plot(range(1,11), disorins, marker='o') 本文选自《Python用KShape对时间序列进行和肘方法确定最优

1.1K20

数据科学学习手札08)系统法的Python源码实现(与Python,R自带方法进行比较)

聚类分析是数据挖掘方法中应用非常广泛的一项,而聚类分析根据其大体方法的不同又分为系统和快速,其中系统的优点是可以很直观的得到数不同时具体中包括了哪些样本,而Python和R中都有直接用来聚类分析的函数...一、仅使用numpy包进行系统的实现: '''以重心法为距离选择方法搭建的系统算法原型''' # @Feffery # @说明:目前仅支持维度为2,重心法的情况 import numpy as....format(str(len(data[0,:])-token+1),set(classfier[index]))) #求得重心并数据进行覆盖 for...dd.prepare(data)#调用中的系统法(默认重心法) print('自己编写的系统算法使用了'+str(round(time.clock()-a,3))+'秒') ?...与Scipy中系统方法进行比较: '''与Scipy中自带的层次方法进行比较''' import scipy.cluster.hierarchy as sch import numpy as np

1.1K50

【干货】统计学最常用的「数据分析方法」清单(上)

正态性检验 很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。 常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。...不同研究者对于同一组数据进行聚类分析,所得到的数未必一致。 从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。...而且能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中特定的簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。 1....性质分类 Q型聚类分析:样本进行分类处理,又称样本聚类分析使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等。...方法分类 系统法:适用于小样本的样本或指标,一般用系统法来指标,又称分层 逐步法:适用于大样本的样本 其他法:两步、K均值等 End.

1.5K60

机器学习常用算法总结分享

三、无监督学习 1、算法 算法就是将一堆数据进行处理,根据它们的相似性对数据进行,就像回归一样,有时候人们描述的是一问题,有时候描述的是一算法。...算法通常按照中心点或者分层的方式输入数据进行归并。所以的算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。...2、K-均值算法(K-Means) K-means算法是硬算法,是典型的基于原型的目标函数方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。...在计算机视觉领域,第一个脸部识别算法就是基于PCA与SVD的,用特征脸部进行特征表示,然后降维、最后进行面部匹配。尽管现在面部识别方法复杂,但是基本原理还是类似的。...Q-Learning是一种无模型的强化学习技术。具体来说,可以使用Q学习来为任何给定的(有限的)马尔可夫决策过程(MDP)找到最优的动作选择策略。

1.2K00

全网最全数据分析师干货-python篇

方法:for i in range(len(n)): swap(arr[i], arr[random(i,n)]) 这段代码是随机确定数组第一位的值,然后递归剩余的数组进行相同的过程,可以产生n!...有条件的话使用密度或者一些软的方式先,剔除异常值。不过本来用kmeans就是为了快,这么做有些南辕北辙了 b....这种办法简单,但没有充分考虑数据中已有的信息,误差可能较大。另一种办法就是根据调查对象其他问题的答案,通过变量之间的相关分析或逻辑推论进行估计。...28.有哪些算法,kmeans算法有什么缺点? k-means算法 k-means是划分方法中较经典的算法之一。由于该算法的效率高,所以在对大规模数据进行时被广泛应用。...②每个插补数据集合都用针对完整数据集的统计方法进行统计分析。③来自各个插补数据集的结果,根据评分函数进行选择,产生最终的插补值。

1.7K52

如何使用 Keras 实现无监督

它需要有人对数据进行标注。无论是 X 光图像还是新闻报道的主题进行标注,在数据集增大的时候,依靠人类进行干预的做法都是费时费力的。 聚类分析,或者称作是一种无监督的机器学习技术。...它不需要有标签的数据集。它可以根据数据成员的相似性它们进行分组。 你为什么需要关注它呢?让我来讲讲几个理由。 ?...的应用 推荐系统,通过学习用户的购买历史,模型可以根据相似性用户进行区分。它可以帮助你找到志趣相投的用户,以及相关商品。 在生物学上,序列算法试图将相关的生物序列进行分组。...它根据氨基酸含量蛋白进行。 图像和视频聚类分析根据相似性它们进行分组。 在医疗数据库中,每个病人来说,真正有价值的测试(比如葡萄糖,胆固醇)都是不同的。...对于层,我们初始化它的权重,中心使用k-means所有图像的特征向量进行训练。

3.9K30
领券