Menu

Discriminantanalyse (DA)

Je wilt op grond van een aantal intervalvariabelen (p≥2) voorspellen tot welke groep uit een set van k groepen iemand behoort. Je kunt onderscheid maken door te kijken vanuit de groepen (descriptieve DA) of vanuit de individuen binnen die groepen (predictieve DA).

Bij het doen van DA moet je jezelf afvragen of je voorspelling zin heeft. Da leidt altijd tot een optimale voorspelling van de nominale variabele vanuit de intervalvariabelen. Een voorspelling stelt iets voor als deze beter is dan wat je op basis van toeval mag verwachten. Dit kun je berekenen met behulp van Wilk’s lambda. Hierbij geldt H0: de groepen verschillen op geen enkele manier op de intervalvariabelen. Wanneer Wilk’s lambda niet significant is, kun je niets voorspellen. Wanneer deze wel significant is, kun je een voorspelling doen die beter is dan je toevalsverwachting. Het is geen garantie voor een goede voorspelling of voor een sterke samenhang tussen de groepsindeling en de intervalvariabelen.

Voor predictieve DA hoef je eigenlijk niet te weten hoe de groepen van elkaar verschillen. Toch wil je vaak graag weten hoe en waarom een voorspelling werkt. Dit kun je bekijken met behulp van de descriptieve DA (komt bij de cursus MVDA aan bod).

Wanneer je een p-dimensionale ruimte hebt waarin je de scores van de verschillende proefpersonen aftekent, die je vervolgens verbindt met de verschillende groepen, kun je achterhalen bij welke groep welke proefpersoon hoort. Dit is namelijk de groep waar de proefpersoon het dichtst bij in de buurt staat. Zie ook figuur 3 op pagina 5. Je kunt de afstand berekenen met de stelling van pythagoras:

Bekijk pagina 6 voor een rekenvoorbeeld. De algemene formule is als volgt:

Wanneer de variabelen verschillende standaarddeviaties hebben, moet je de variabelen standaardiseren (omzetten in z-scores). Als variabelen onderling gecorreleerd zijn, moet je werken in de ruimte van de discriminantfunctievariaten. Wanneer de groepen verschillen in spreiding rondom het gemiddelde moet je de groepspunten wegen naar de standaarddeviaties van de groepen (de afstand wordt kleiner bij een hoge standaarddeviatie).

Lees meer...

Van dimensioneel naar classificatie

Classificatiesystemen worden ook wel taxonomieën genoemd. Vaak zijn classificaties en diagnoses in de psychologie gebaseerd op één of meer dimensionele oordelen. Er is een algemene procedure om van dimensionele oordelen naar classificatie te komen:

  1. Onderzoeksgroep: je hebt een steekproef nodig, waarbij de scores op de dimensionele oordelen en op de classificatie van ieder individu bekend zijn.
  2. Voorspellingsregel: je probeert binnen die onderzoeksgroep op basis van de dimensionele oordelen te voorspellen wie welke classificatie krijgt. Hierdoor kun je nieuwe gevallen classificeren en je kunt checken hoe goed de voorspellingsregel binnen de steekproef werkt.
  3. Classificatie van nieuwe gevallen: wanneer de gevonden voorspellingsregel goed is, kun je hiermee nieuwe gevallen classificeren.


In het eenvoudigste geval heb je scores op één dimensie die je binnen de steekproef op twee manieren kunt classificeren: wel of niet een stoornis. Wanneer je een t-toets uitvoert op de data en de gemiddelde scores van de stoornisgroep zijn sterk significant verschillend in vergelijking met de niet-stoornis groep, heb je aangetoond dat de dimensie samenhangt met de stoornis. Om te kunnen bepalen of je de stoornis ook uit de dimensie kunt voorspellen, maak je gebruik van de grenswaarde XC. Hierop is de voorspellingsregel van toepassing:

  • als Xi < XC, dan behoort persoon i tot de niet-stoornis groep.
  • als Xi ≥ XC, dan behoort persoon i tot de stoornis groep.


Deze regel werkt niet perfect, omdat er bij echte data altijd wel wat overlap is (mensen die hoog scoren op de dimensie hebben toch geen stoornis, of mensen die laag scoren op de dimensie hebben toch wel een stoornis). Je maakt dus altijd fouten in je voorspelling.

Het bepalen van de grenswaarde XC is niet eenvoudig. Je kunt twee soorten fouten maken, de vals negatieven en de vals positieven. Bij het bepalen van de grenswaarde moet je bedenken welke fouten je erger vindt. Daarnaast hangt de grenswaarde af van de vergelijkbaarheid van beide verdelingen

Wanneer je in meer dan twee groepen gaat classificeren op basis van één dimensie, kun je het best gebruik maken van discriminantanalyse.

Lees meer...

Classificatie en discriminantanalyse

In de psychometrie wil je twee soorten uitspraken kunnen doen:

  • Dimensionele uitspraken: wat is iemands plaats op een bepaalde dimensie (bijvoorbeeld extraversie)? Wanneer je het hebt over betrouwbaarheid en validiteit, gaat het meestal om deze benadering.
  • Classificatie: tot welke categorie behoren we (bijvoorbeeld depressief)? Je wijst hier mensen toe aan categorieën.
Lees meer...

Analyse van de residuen

Je kunt uit residuen afleiden welke parameters er voor een goede fit moeten worden vrijgemaakt:

  • Gecorreleerde factoren: wanneer twee factoren in werkelijkheid positief gecorreleerd zijn, maar deze in het model op nul staat, dan zullen de terugvoorspelde correlaties stelselmatig lager dan de werkelijke correlaties. Wanneer je in een blok residuen van variabelen uit twee verschillende factoren bijna alleen hoog positieve waarden vindt, moet je de factoren correleren waardoor je waarschijnlijk een betere fit krijgt.
  • Extra factorlading: wanneer een variabele zowel op de eigen factor als op een andere factor in de werkelijkheid goed laadt, maar de lading op de andere factor in het model op nul is gezet, ontstaat dezelfde situatie als bij de gecorreleerde factoren.
  • Gecorreleerde errors: wanneer je een duidelijk van nul afwijkend residu hebt dat geen onderdeel is van een breder patroon, zou je de correlatie tussen de errors van de betrokken variabelen schatten. Gecorreleerde errors zijn echter meestal niet heel bevorderlijk voor de begrijpelijkheid van een model.
Lees meer...

Modificatie-indices en residuen

Om te bepalen welke parameters je moet vrijmaken voor een betere fit, kun je gebruik maken van modificatie-indices en van residuen. Een modificatie-index geeft aan in hoeverre het trimmen leidt tot een slechtere fit en in hoeverre het verhogen van de fit leidt tot een verbetering van de fit.

Een residu is het verschil tussen de werkelijke en de teruggeschatte waarde van een element uit de variantie-covariantie matrix. Wanneer een model een perfecte fit heeft, zijn alle errors gelijk aan nul. Bij echte data komt dit nagenoeg nooit voor. In dit geval geldt: hoe dichter het residu de nul nadert, hoe beter het model erin slaagt om de betreffende covariantie of correlatie te verklaren. Om een model bij te stellen, gebruik je de volgende formule:

Dit is het gestandaardiseerde residu. Bij een standaardmodel met een goede fit zijn de residuen klein (tussen de -.10 en .10). Er zijn dan ook ongeveer evenveel positieve als negatieve residuen.

Lees meer...

Trimmen versus fit verhogen

Je kunt een model bij stap (5.) op twee manieren verbeteren: trimmen of de fit verhogen. Bij het trimmen zet je de vrije parameters vast. Zelfs wanneer je een model hebt met een goede fit, kun je het model nog verbeteren vanwege de spaarzaamheid (wanneer een eenvoudige en ingewikkelde versie beiden even goed werken, heeft de eenvoudige versie de voorkeur). Bij CFA moet je dus bij twee even goede modellen, het model kiezen dat de minste vrije parameters heeft. Je kunt het aantal vrije parameters verminderen door de factorladingen op nul te zetten of door de correlaties tussen de factoren op nul te zetten. Dit is trimmen. De fit kan hiervan nooit verbeteren, maar wel verslechteren of gelijk blijven.

Bij het verhogen van de fit maak je vaste parameters vrij. Dit betekent dat je pijlen in het paddiagram toevoegt:

  • Factorladingen: je laat een manifeste variabele ook op een andere factor laden.
  • Correlaties tussen factoren: je staat toe dat er twee factoren gecorreleerd zijn.
  • Correlaties tussen errors: je staat toe dat twee variabelen iets gemeenschappelijk hebben dat je niet kunt herleiden tot de factoren.
  • Meer factoren: hierdoor wordt het model minder spaarzaam, maar wordt de fit wel groter.
Lees meer...
Abonneren op deze RSS feed

Advies nodig?

Vraag dan nu een gratis en vrijblijvende scan aan voor uw website.
Wij voeren een uitgebreide scan en stellen een SEO-rapport op met aanbevelingen
voor het verbeteren van de vindbaarheid en de conversie van uw website.

Scan aanvragen