Classificatie en discriminantanalyse
- Gepubliceerd in Gezondheid
- Lees 1507 keer
In de psychometrie wil je twee soorten uitspraken kunnen doen:
Dimensionele uitspraken: wat is iemands plaats op een bepaalde dimensie (bijvoorbeeld extraversie)? Wanneer je het hebt over betrouwbaarheid en validiteit, gaat het meestal om deze benadering.
Classificatie: tot welke categorie behoren we (bijvoorbeeld depressief)? Je wijst hier mensen toe aan categorieën.
Van dimensioneel naar classificatie
Classificatiesystemen worden ook wel taxonomieën genoemd. Vaak zijn classificaties en diagnoses in de psychologie gebaseerd op één of meer dimensionele oordelen. Er is een algemene procedure om van dimensionele oordelen naar classificatie te komen:
1. Onderzoeksgroep: je hebt een steekproef nodig, waarbij de scores op de dimensionele oordelen en op de classificatie van ieder individu bekend zijn.
2. Voorspellingsregel: je probeert binnen die onderzoeksgroep op basis van de dimensionele oordelen te voorspellen wie welke classificatie krijgt. Hierdoor kun je nieuwe gevallen classificeren en je kunt checken hoe goed de voorspellingsregel binnen de steekproef werkt.
3. Classificatie van nieuwe gevallen: wanneer de gevonden voorspellingsregel goed is, kun je hiermee nieuwe gevallen classificeren.
In het eenvoudigste geval heb je scores op één dimensie die je binnen de steekproef op twee manieren kunt classificeren: wel of niet een stoornis. Wanneer je een t-toets uitvoert op de data en de gemiddelde scores van de stoornisgroep zijn sterk significant verschillend in vergelijking met de niet-stoornis groep, heb je aangetoond dat de dimensie samenhangt met de stoornis. Om te kunnen bepalen of je de stoornis ook uit de dimensie kunt voorspellen, maak je gebruik van de grenswaarde XC. Hierop is de voorspellingsregel van toepassing:
- als Xi < XC, dan behoort persoon i tot de niet-stoornis groep.
- als Xi ≥ XC, dan behoort persoon i tot de stoornis groep.
Deze regel werkt niet perfect, omdat er bij echte data altijd wel wat overlap is (mensen die hoog scoren op de dimensie hebben toch geen stoornis, of mensen die laag scoren op de dimensie hebben toch wel een stoornis). Je maakt dus altijd fouten in je voorspelling. Het bepalen van de grenswaarde XC is niet eenvoudig. Je kunt twee soorten fouten maken, de vals negatieven en de vals positieven. Bij het bepalen van de grenswaarde moet je bedenken welke fouten je erger vindt. Daarnaast hangt de grenswaarde af van de vergelijkbaarheid van beide verdelingen
Wanneer je in meer dan twee groepen gaat classificeren op basis van één dimensie, kun je het best gebruik maken van discriminantanalyse.