web-dev-qa-db-fra.com

Exemple de classification SVM 10 fois dans MATLAB

J'ai besoin d'un exemple descriptif montrant comment effectuer une classification SVM 10 fois sur un ensemble de données à deux classes. il n'y a qu'un seul exemple dans la documentation MATLAB mais ce n'est pas avec 10 fois. Est-ce que quelqu'un peut m'aider?

22
Hossein

Voici un exemple complet, utilisant les fonctions suivantes de la Bioinformatics Toolbox: SVMTRAIN , SVMCLASSIFY =, CLASSPERF , CROSSVALIND .

load fisheriris                              %# load iris dataset
groups = ismember(species,'setosa');         %# create a two-class problem

%# number of cross-validation folds:
%# If you have 50 samples, divide them into 10 groups of 5 samples each,
%# then train with 9 groups (45 samples) and test with 1 group (5 samples).
%# This is repeated ten times, with each group used exactly once as a test set.
%# Finally the 10 results from the folds are averaged to produce a single 
%# performance estimation.
k=10;

cvFolds = crossvalind('Kfold', groups, k);   %# get indices of 10-fold CV
cp = classperf(groups);                      %# init performance tracker

for i = 1:k                                  %# for each fold
    testIdx = (cvFolds == i);                %# get indices of test instances
    trainIdx = ~testIdx;                     %# get indices training instances

    %# train an SVM model over training instances
    svmModel = svmtrain(meas(trainIdx,:), groups(trainIdx), ...
                 'Autoscale',true, 'Showplot',false, 'Method','QP', ...
                 'BoxConstraint',2e-1, 'Kernel_Function','rbf', 'RBF_Sigma',1);

    %# test using test instances
    pred = svmclassify(svmModel, meas(testIdx,:), 'Showplot',false);

    %# evaluate and update performance object
    cp = classperf(cp, pred, testIdx);
end

%# get accuracy
cp.CorrectRate

%# get confusion matrix
%# columns:actual, rows:predicted, last-row: unclassified instances
cp.CountingMatrix

avec la sortie:

ans =
      0.99333
ans =
   100     1
     0    49
     0     0

nous avons obtenu 99.33% précision avec une seule instance 'setosa' mal classée comme 'non-setosa'


[~ # ~] mise à jour [~ # ~] : les fonctions SVM ont été déplacées vers la boîte à outils Statistiques dans R2013a

43
Amro