Q faktoranalyse

Faktoranalyse kan være lidt svær at forstå, men da det er nødvendigt at vide, hvordan matematik behandler bløde temaer og altså relationen mellem to personers synspunkter, tager jeg lidt grundigere fat i forklaringerne her. Selve faktoranalysens matematiske beregninger vil være for omfattende og ikke give særligt udbytte at gå ind i. Derimod giver en gennemgang af de indledende beregninger forud for faktoranalysen et godt afsæt for at forstå, hvad der sker, når man regner på de afgivne svar i Q gitteret.

Beregninger af data fra de udfyldte Q gitre foregår ved Q-faktoranalyse, der er den traditionelle R-faktoranalyse - bare vendt på hovedet (Læs evt. mere om faktoranalyse her). På almindelig dansk vil det sige, at de data, beregningerne foretages på, er vendt om, således at cases (personerne) bliver til variable og de variable (udsagnene) bliver til cases (Se Brown 80). Den traditionelle R-faktoranalyse bruges i mange forskellige undersøgelser f.eks. af personlige træk eller inter-personelle relationer, f.eks. sympati og tillid til en afsender, oplevelse af troværdighed m.m. (Se f.eks. McCroskey 99).
Principperne i de statistiske beregninger er de samme for de to typer analyse, men de har dog hver deres redskaber til rådighed. Den reelle forskel er, at data vendes om i Q, så der kan analyseres sammenhænge (fællestræk) mellem personers svarmønstre og ikke hvordan udsagnene er fordelt i svarene.

Faktorer?

Kort fortalt opregner faktoranalyse klynger af svar i datamaterrialet, der ligner hinanden. Nogle deltageres svar vil ligne hinanden og danne et mønster, og sådan et mønster betegnes en faktor. Analysen finder de generelle mønstre på tværs af alle svarene, så det bliver muligt at beskrive, hvad mønstrene bygger på. Og dét kalder man faktorer.  På baggrund af beregningerne fremkommer et antal faktorer, der gør det muligt at beskrive de fællestræk, deltagerne har i deres synspunkter indenfor det pågældende emne.

Når nogle svar i datamaterialet ligner hinanden, eksisterer der altså en form for enighed blandt nogle deltagere og uenighed med andre. To eller flere undersøgelsesdeltagere kan være enige i et udsagn og placere det på samme måde i Q gitteret, men det siger ikke noget om, hvorvidt respondenterne i øvrigt kunne være enige. Målet er at finde ud af, hvordan ensartetheden i alle Q gitre ser ud og derved kunne beskrive et dybereliggende mønster for deltagernes synspunkter. I Q-faktoranalyse kan man faktisk sige, at en faktor er en statistisk beskrivelse af de fælles synspunkter, der findes blandt deltagerne (Se Brown 80 og 93). Steven Brown beskriver det således:

Fundamentally, factor analysis examines a correlation matrix (...), and, in the case of Q methodology, determines how many basically different Q sorts are in evidence: Q sorts which are highly correlated with one another may be considered to have a family resemblance, those belonging to one family being highly correlated with one another but uncorrelated with members of other families. Factor analysis tells us how many different families (factors) there are. The number of factors is therefore purely empirical and wholly dependent on how the Q sorters actually performed (Brown 93 p. 124).

Korrelation

Når man beskæftiger sig med statistisk belysning af sammenhængen mellem to eller flere størrelser, taler man om korrelationer mellem variable. Korrelationskoefficienten er en talværdi for sådan en sammenhæng. Et datasæt har altså altid en korrelationsmatrix, der viser sammenhængen mellem alle variable. Den er i og for sig ikke så interessant. Man vil ofte være optaget af, hvad årsagen til korrelationerne - dvs. sammenhængene mellem de variable er. En af mulighederne for at belyse dette, er faktoranalyse.

I Q faktoranalyse er korrelationskoeficienen et udtryk for rækkevidden af "det fælles" for to deltageres synspunkter - altså et tal for hvor meget to svarmønstre ligner hinanden. I Q kalder man også en deltagers svarmønster for deltagerens subjektive position. Det væsentligste for at forstå faktoranalyse er korrelationen, da det er dennes værdier, der beskriver sammenhængen mellem variable, og ud fra en matrix over alle korrelationer, at faktorerne beregnes.

Deltagernes subjektive positioner

Lad os antage for en undersøgelse, at et antal udsagn konstrueres ud fra en diskurs. Det er altså en p sample på 20 udsagn. Det betegnes ofte N=20. Deltagerne skal derefter rangordne disse inden for et afgrænset område i gitteret. Læs mere under fremgangsmåde. Det defineres her med skalaen -3 til +3, hvor -3 er meget uenig -2 noget uenig, 1 lidt uenig, 0 neutral og +3 er meget enig. Dette giver en fordeling af udsagnene, hvor hver enkelt deltager frembringer sin egen subjektive position ved at vurdere udsagnene og vælge en prioritering af dem. Med 20 udsagn, der nummereres 1,2,3….20, i den anvendte sample fordelt på en 7-trinsskala, kan en position, vi kan kalde A, se sådan ud:

-3

-2

-1

0

+1

+2

+3

3

16

7

10

2

11

9

15

8

12

17

14

19

13

 

4

18

5

6

1

 

 

 

 

20

 

 

 

Deltagerens (A's) svar er således et udtryk for persons subjektive position. Det skal understreges, at selve processen med at konstruere udsagn og etablere en p sample er den mest betydningsfulde del i designet af en undersøgelse. Indsamlingen af diskursmaterialet kan foregå på mange måder eksempelvis ved traditionelle kvalitative informantinterviews, litteraturlæsninger inden for det valgte genstandsfelt. Det er dog netop på dette punkt Q methodology har sin styrke, idet kvalitative undersøgelser ofte kan være uoverskuelige, når data skal behandles. De strukturer, der findes i data, er meget omstændelige at få frem ved traditionelle tekstlige organiseringsprocesser, kodninger m.m. af datasættet.
Med et antal respondenter, f.eks. 5, opnås altså 5 forskellige positioner (5 udfyldte Q-gitre), der er udtryk for disse 5 personers subjektive holdning til emnet. Hvis vi eksempelvis beder deltager B udfylde gitteret, har vi altså en anden position, der f.eks. ser sådan ud:

-3

-2

-1

0

+1

+2

+3

4

8

2

10

7

16

14

15

17

12

19

1

11

13

 

18

3

5

20

9

 

 

 

 

6

 

 

 

Beregning af korrelationen mellem to deltageres svar

Skriver vi begge deltageres svar A og B ind i en tabel og laver en indledende beregning, ser det således ud:

Udsagn

A

B

A-B

(A-B)²

1

+2

+1

1

1

2

+1

-1

2

4

3

-3

-1

-2

4

4

-2

-3

1

1

5

0

0

0

0

6

+1

0

1

1

7

-1

+1

-2

4

8

-2

-2

0

0

9

+3

+2

1

1

10

0

0

0

0

11

+2

+2

0

0

12

-1

-1

0

0

13

+3

+3

0

0

14

+1

+3

-2

4

15

-3

-3

0

0

16

-2

+2

-4

16

17

0

-2

2

4

18

-1

-2

1

1

19

+2

0

2

4

20

0

+1

-1

1

sum

0

0

0

46

De to kolonner længst til højre i tabellen viser henholdsvis differencen mellem (A) og (B)'s svar og denne difference i anden potens.

Nu kan position A sammenlignes med position B ved at beregne korrelationen mellem dem. Korrelationen er et udtryk for, hvor meget sammenfald der er mellem værdierne for A og B. En korrelationskoefficient på +1.00 betyder totalt sammenfald, og dermed er de to positioner identiske, dvs. helt enige om de 20 udsagn. Med en koefficient på -1.00 er de to positioner helt uidentiske, dvs. helt uenige. Korrelationskoefficienten betegnes r og den beregnes som følger: 

r = 1 – (sum (A-B)²/132) 

r = 1 – (46/132) 

r = 0.65 

Det ubekendte tal; 132 er kvadratroden af værdierne for A lagt sammen med kvadratroden af værdierne for B. Dvs. da A's position ser ud som vist foroven, kommer regnestykket til at se således ud: 

A = (-3)²+(+3)²+(-2)²+(-2)² ….(+3)²+(+3)² = 66 

Det samme regnes ud for B, og dermed er summen 132. 

Da r antager værdien 0.65, har vi altså fundet en korrelationskoefficient på 0.65 mellem A og B. Denne værdi fortæller os altså, at graden af enighed mellem de to respondenter er rimelig høj. Og da den ligger relativt tæt på 1.00, er der altså meget mere enighed end uenighed mellem de to. Når man i statistik skal være sikker på tallenes gyldighed, taler man om signifikans, og vedrørende de signifikante værdier ved faktoranalyse, så er den almindeligt brugte grænseværdi 0.50 eller -0.50. Fastsættelsen af denne værdi bestermmes ved et interval for usikkerheden i R-faktoranalyse. Der gør sig lidt andre principper gældende for Q-faktoranalyse (Se Brown 80 og 93). Læs mere under faktorvalidering og kriterier.

Beregning af usikkerhed

I R-faktoranalyse introduceres et mål for usikkerheden ved hjælp af standardafvigelsen, der bestemmer det område, hvor korrelationskoefficienten ikke er tilstrækkelig høj til at sige noget om graden af enighed.

Standardafvigelsen beregnes således:

S = 1/(√20), hvor 20 er antallet af udsagn i p sample og √ er kvadratroden. 

S = 1/4.47 

S = 0.22

Som en tommelfingerregel kan man sige, at korrelationskoefficienten skal være 2 til 2½ gange større end standardafvigelsen. Det betyder, at i intervallet 0.44 til 0.56 både for negative og positive værdier begynder usikkerheden at blive for stor. Værdier der ligger under dette interval, dvs. falder indenfor intervallet (-0.56) – (+0.56) kan altså ikke siges at være signifikante. Normalvis gennemføres valide analyser, hvis korrelationerne ligger højere end 0.50.

Idet den beregnede korrelationskoefficient i vores eksempel er 0.65 og altså ligger over 0.50, har vi en signifikant værdi for enighed mellem deltager A og B. 

Matrix for korrelation mellem positioner

Hvis vi forestiller os en undersøgelse med fem deltagere, vil vi kunne bestemme en grad af enighed/uenighed deltagerne imellem ved at beregne korrelationskoefficienterne. Resultatet kan skrives op i en korrelationsmatrix, hvor graden af enighed altså kan ses på alle leder mellem de fem deltagere.

Den kunne eksempelvis se sådan ud: 

 

 

A

B

C

D

E

A

1.00

0.65

0.72

0.89

-0.23

B

0.65

1.00

0.13

0.40

-0.47

C

0.72

0.13

1.00

-0.26

0.66

D

0.89

0.40

-0.26

1.00

0.39

E

- 0.23

- 0.47

0.66

0.39

1.00

Nogle korrelationer er ikke signifikante, f.eks. kan vi se, at A overfor E med -0.23 og C overfor B med 0.13 ikke er høje nok i værdien til at kunne sige noget signifikant om graden af enighed/uenighed. De negative værdier er udtryk for graden af uenighed.
Men matrixen her er ikke i sig selv interessant, da værdierne for indbyrdes enighed eller uenighed ikke fortæller os så meget om den samlede struktur mellem deltagernes positioner. Der mangler også et samlet billede af, hvad det er, man er enige om, og altså hvilke faktorer, der træder frem, når de fem deltagere vurderer og placerer udsagnene i q gitteret. Steven Brown beskriver det således:

"But it is rarely the case that the correlation matrix is of much interest since attention is usually on the factors to which the correlations lead: the correlation matrix is simply a necessary way station and a condition through which the data must pass on the way to revealing their factor structure" (Brown 93 p.121).

Opsummering

Det første trin på vejen til en faktoranalyse er nu taget, og det er forhåbentligt blevet nogenlunde klart, hvad talværdierne i en korrelationsmatrix egentlig fortæller, og hvordan de bliver til. Nu er det så den egentlige faktoranalyse der ud fra korrelationsmatrixen beregner, hvilke faktorer, der ligger som et bagvedliggende mønster i korrelationerne.

Faktoranalyse af korrelationsmatrix

Faktoranalysen er her den del af Q methodology, der kan kaste lys over, hvilke sammenhænge der karakteriserer mønstret i korrelationerne. Faktoranalysen kan identificere de fællestræk, der ligger til grund for høje korrelationsværdier mellem flere positioner (udfyldte q gitre der ligner hinanden meget). Når en gruppe positioner viser høj grad af enighed er det jo interessant at finde ud af, hvad der ligger bag denne enighed, og det er dette, faktoranalysen viser.

Et fiktivt resultat af en faktoranalyse kan for de fem deltagere se sådan ud:
 

 

Faktor I

Faktor II

Faktor III

A

0.28

0.78

-0.42

B

0.64

0.55

0.15

C

-0.31

0.20

-0.34

D

0.74

0.45

-0.26

E

-0.59

- 0.18

 0.11

% 45,96 36,24 18,80
EV 19,93 1,86 0.85
I skemaets tre kolonner vises først deltagernes korrelation med faktoren, også kaldet deltagerens ladning på faktoren. Vi kan altså se, at deltager B, D og E lader på faktor I, A og B med faktor II og ingen lader over den normale grænseværdi 0.50 på faktor III. Denne faktor er dermed umiddelbart uinteressant, med mindre andre faser i analysen, f.eks. det kvalitative materiale fra det tilhørende interview viser andet, se mere under analyse. Resultatet er et sammenfald i synspunkter og en form for enighed mellem B og D, og der udover er E uenig i dette. Hvad dette sammenfald indebærer altså af hvilken natur og beskaffenhed det fælles mellem B og D er, kan en nærmere analyse af faktoren vise. Det samme med faktor II. De to nederste rækker (% og EV) er ikke i første øjekast interessante. De fortæller noget om resultatets validitet. Læs mere om dette under faktorvalidering og kriterier her.

Analyse af faktorernes indhold

I analyse og tolkning af faktorernes indhold bruges enten såkaldte factor arrays eller factor scores, der er hvilken værdi på skalaen (-3 til +3) hvert enkelt udsagn har fået i faktoren eller den beregnede score fra højest til lavest. . De udskrives i de forskellige statistikprogrammer samtidig med faktorløsningen, og dette er materialet, der viser os, hvad deltagerne i faktorerne er enige henholdsvis uenige om. Vi vender altså nu tilbage for at se på, hvordan deltagerne har placeret udsagnene og analyserer det beregnede svarmønster - faktorerne - i materialet. Det er factor arrays eller factor scores, der viser, hvad dette beregnede svarmønster indeholder af fælles synpunkter i undersøgelsen. Udsagnene er listet op rangordnet efter den score, de har opnået, ved deltagernes placering af dem i Q gitteret. Se eksempel på factor array og factor scores her.

I vekselvirkning med analyse af faktorernes indhold inddrages deltagernes refleksioner og begrundelser for deres valg. Et udsagns placering i faktoren kan dermed også analyseres ved dets naturlige artikulation i hverdagstale. Derved skabes en analytisk dynamik mellem det beregnede prototypiske skelet og det særegne og unikke ved formuleringer i en situeret kommunikation. Læs undersøgelse med Q her og for eksempler på den kombinerede analysemetode se speciale eller læs Beyond Duality.
Litteratur:
Brown, Steven R. (1980) Political Subjectivity. New Haven: Yale University Press
Brown, Steven R. (1993) A primer on Q methodology, Operant Subjectivity, vol 18, 3 og 4, p. 91-139
Cattel, Raymond B. (1978) The scientific use of factor analysis in behavioral and life science
McCroskey, James C. (1999) Goodwill: A reexamination of the construct and its measurement, Communication Monograph, vol 66, pp. 90-103