Устойчивость кластеризации

20.02.2020

Добрый день!

Подскажите, пожалуйста, как можно добиться устойчивости кластеризации методом k-means или другие методы?

При загрузки одного и того же дата сета выдает различное оптимальное количество кластеров, даже когда одинаковое, то на выходе получаем разный результат.

Какие парметры или методы сущетвуют или фильтры? Помогите пожалуйста!

Спасибо заранее

Привожу свой кусок кода

[data, text, alldata] = xlsread('data.xlsx');

ns=length(data(1,:));

fg=normalize(data);

nx=ns-1; % количество признаков-x

n1=length(fg(:,1)); % количество наблюдений

c=cvpartition(n1,'Holdout',0.2);

id1=test(c);

id2=training(c);

eva = evalclusters(fg(id2,1:nx),'kmeans','DaviesBouldin','KList',[1:20]);

plot(eva)

hold on

k=eva.OptimalK

[idx,C] = kmeans(fg(id2,1:nx),k);

[~,idx_test] = pdist2(C,fg(id1,1:nx),'euclidean','LARGEST',1);

Ответы

galekx20.00

20.02.2020 10:30

что реализовано в матлабе на данный момент?

Прикрепить файл

Устойчивость кластеризации

Теги

Ответы

Темы

Популярные теги

Устойчивость кластеризации

Теги

Ответы Подписаться на ответы

Темы

Популярные теги

Ответы