选自cnblog
作者:Limitlessun
http://1t.click/7XU
知识点
进程和线程:进程和线程都是一个时间段的描述,是CPU工作时间段的描述,不过是颗粒大小不同.进程就是包换上下文切换的程序执行时间总和...模型:当训练集,距离度量,k值以及分类决策规则确定后,特征空间已经根据这些要素被划分为一些子空间,且子空间里每个点所属的类也已被确定.....用选定的对(j,s)划分区域并决定相应的输出值
?
,直到满足停止条件.
基尼指数:假设有K个类,样本属于第k类的概率为pk,则概率分布的基尼指数为
?...如果是连续值的情况,一般用二分法作为结点来划分.
logistic回归和最大熵模型
逻辑斯谛分布:
?
分布函数f(x)以点(μ,1/2)为中心对称,γ的值越小,曲线在中心附近增长得越快....传统算法:
用先验知识或交叉验证选择一个合适的k值.
随机选择k个样本作为初始的质心.注意初始化质心的选择对最后的聚类结果和运行时间都有很大的影响.