该数据集仅包含了评价过20部以上电影的用户评价数据,没有评分的电影数据占所有数据的比重(稀疏度)为94%。...过程与结果分析
(1)确定最佳聚类数
首先,通过比较不同聚类数相应的聚类有效性函数值来选出最佳聚类数cmax。实验结果如图所示。
图中的横坐标为聚类数,纵坐标为相应的4个聚类有效性函数值。...n=1:5:80%########最近邻数
mae(j)=0;%mae为最近邻为n的情况下的最小均方误差
k=0;%计数变量
for t=1:size(udatatest,1)...%D为相似系数矩阵,i为第i个目标用户,n为前n个最相似的用户数,输出为前n个用户的坐标信息
[a,b]=sort(D(i,:),'descend');%a为从高到低排的相似系数
top=b(1:n);...for w=1:size(udata,2)
I=topn(CS,q,n);%D为相似系数矩阵,i为第i个目标用户(即为q),n为前n个最相似的用户数(默认为3),输出为最近邻居用户的前