Het voorspellen van een afhankelijke variabele Y uit één onafhankelijke variabele X. Het criterium is niet of er een samenhang is en in welke richting, maar hoe goed het lukt die uit Y te voorspellen.
Als de voorspelde Y Ў is, dan kan de vraag hoe goed mijn voorspelling van Y is vertaalt worden als: Hoeveel Ў van Y afwijkt. De afwijkingen van de voorspelde en de echte scores van Y is ‘e’. Dus geldt: e = Y – Ў.
Als indicator hoe goed het lukt om Y uit X te voorspellen wordt de standaardschattingsfout gebruikt.
Als de correlatie tussen X en Y nul is, dan levert X geen bijdrage aan de voorspelling van Y. Als echter in het andere extreme geval de correlatie 1 is of -1 dan is de voorspelfout nul en dus perfect.
Om Y uit X te voorspellen hebben we het lineair model: Y = a+bX + e (regressiemodel).
Het intercept a geeft weer hoeveel wij gemiddeld bij X moeten optellen om Y te voorspellen. Het regressiegewicht b geeft weer hoeveel Y toeneemt met toename van X.
De regressieanalyse is niet symmetrisch, omgedraaid komen er andere getallen uit.