Miroslav Disman: Jak se vyrábí sociologická znalost

Vydalo Karolinum, Praha 2002

Jakub Holý

Pozn.: Kapitoly a sekce byly přejmenovány tak, aby název víc odrážel obsah a byla tak usnadněna orientace v textu.

Obsah

 

1. Redukce dat a možná zkreslení („Jak se dělá věda“)

Nálezy společenských věd mají vždy jen pravděpodobnostní (stochastický) charakter a platí zpravidla jen pro prostředí, z nějž pochází data. Příčinou je složitost společenskovědních „přirozených systémů“ (ty, jejichž proměnné jsou navzájem silně propojeny a počet vztahů s jinými systémy je řádově nižší; proto je lze zkoumat samostatně), která je mnohem vyšší než u přírodních věd. Proto je lze popsat jen částečně a hrozí různá zkreslení, hlavně při pominutí podstatných proměnných:

Možnosti výzkum jsou objektivně omezeny, proto musíme pracovat s redukovaným popisem reality, přičemž redukce probíhá na 4 úrovních:

  1. Redukce počtu pozorovaných proměnných (=> nebezpečí zkreslení, viz výše)

  2. Redukce počtu analyzovaných vztahů mezi proměnnými – hrozí zkreslení jako v předchozím případě, navíc je redukce mnohem rozsáhlejší (je moc vztahů) a redukujeme již redukované.

  3. Redukce populace na vzorek – viz kapitola 4; za určitých okolností lze určit velikost vzniklé chyby.

  4. Redukce časového kontinua na jeden bod – naprostá většina sociálních jevů se mění s časem, což je zásadní, usilujeme-li o kauzální vysvětlení.

Vztah je kauzální, když: 1) Nastávají souběžné změny v obou proměnných, 2) Vyloučíme existenci jiné příčiny a 3) Změny v obou proměnných se objevují v logickém časovém sledu. [s.28] Přitom respektovat 2. bod je ve společenských vědách, s výjimkou experimentu, nemožné. Co se bodu 3. týče, je většinou nemožné zjistit časovou posloupnost přímo ze získaných dat a zeptat se respondenta můžeme, ale odpovědi bývají „notoricky nespolehlivé“ [s.29].

Je tedy zřejmé, že redukce časového kontinua a redukce počtu sledovaných proměnných a vztahů mezi nimi doslova vylučuje kauzální analýzu dat v neexperimentální situaci.“[s.29]

2. Experiment v sociologii („Jak studovat armádu v laboratoři“)

2.1 Typy experimentů

Značení: x ... expozice (výskyt) experimentální proměnné, On ... pozorování (observation) skupiny n. Tok času zleva doprava.

1. 2. 3. 4.
x  O1
   O2
O1 x O2
O1 x O2
O3   O4
x  O1
   O2
  1. Srovnání statických skupiny: Jedna skupina vystavena vlivu, druhá ne, pak změřeny. Skupiny nejsou utvořeny náhodně (oproti 3.). Zjistí souběžnost změn v obou proměnných (viz Kap.2, kauzalita, bod 1).

  2. Předběžné a následné pozorování 1 skupiny: Zjištění stavu před a po vystavení vlivu proměnné. Zjistí časový sled (viz Kap.2, kauzalita, bod 3).

  3. Klasický experiment: Respondenti jsou náhodně rozděleni do dvou skupin. Pouze experimentální skupina je vystavena proměnné, kontrolní ne. Měříme obě před i po. Zajišťuje všechny tři podmínky nezbytné pro důkaz kauzality.

  4. Následné pozorování na 2. skupině: Klasický experiment bez předběžného měření, jen s následným. Neodhalíme tak sice případný vliv vnější proměnné (na obě skupiny), pokud ale chceme sledovat jen existenci vlivu exp. proměnné, stačí a je levnější.

  5. Salomonův experiment na 4 skupinách: Klasický exp. + Následné pozorování (3.+4.). Jediný umožní rozlišit nejen přítomnost zkreslení, ale též o jaké zkreslení se jedná. [s.41]

Skutečný experimentální přístup, pouze na jehož základě lze učinit platné závěry o existenci kauzální souvislosti, vyžaduje, aby (1) výzkumník kontroloval experimentální proměnnou (on rozhoduje, kdo bude vystaven podnětu), aby (2) byla použita alespoň 1 exp. a 1 kontrolní skupina, a aby (3) jednotlivci byli do těchto skupin rozřazeni náhodně (pročež si obě skupiny budou podobné ve známých i neznámých vlastnostech účastníků).

Nejdůležitější typy zkreslení experimentů

  1. Historie – když nějaký vnější činitel koinciduje v čase s uvedením exp. proměnné a je mylně vykládán jako její vliv.

  2. Zrání – změny vyvolané prostě tokem času (dospívání...) jsou zaměněny za efekt exp. proměnné.

  3. Prostředí – zkreslení dané organizací experimentu, působí jen na exp. skupinu, je tedy neodhalitelné. Např. znudění, únava po předběžném měření, vyhládnutí mezi měřeními atd.

  4. Instrumentace – zkreslení vyvolané změnami v nástrojích měření či pozorovateli mezi předběžným a následným měřením.

  5. Regrese k průměru (vzácná) – byla-li exp. skupina vybraná na základě extrémních výsledků, pravděpodobně je v ní pár osob omylem, jejich extrémnost byla způsobena výjimečnou shodou okolností a při dalším pozorování již dosáhnou svého obvyklého, normálního výsledku. Odhalíme, rozdělíme-li skupinu náhodně na experimentální a kontrolní.

  6. Experimentální úmrtnost – pokud respondenti odstoupí od pokračování, a to systematicky, tj. určitá podskupina.

  7. Testování (snad nejdůležitější) – když předběžné měření samo ovlivní závislou proměnnou (donutí respondenty o tématu přemýšlet …).

2.2 Omezení použitelnosti experimentů

„ ... dlouhou řadu proměnných, zcela základních pro většinu sociálních problémů, nejsme schopni manipulovat“ [s.49], nelze tedy skutečný experiment. Šířeji použitelné je jen srovnání statických skupin, se všemi jeho potenciálními zkresleními.

3. Validita a reliabilita pozorování („Pozorování nepozorovatelného“)

Sociologie má dva epistemologické problémy: velikost přirozených systémů a transformaci informací (dík nutnosti nepřímých měření).

Mnohé sociologické koncepty jsou nepřístupné přímému pozorování („odcizení“), některé přístupné jsme stejně nuceni sledovat nepřímo. Přitom každé nepřímé měření zvyšuje riziko zkreslení.

Od otázky k odpovědi: 1) respondenti musí správně porozumět otázce, a to všichni stejně – jejich znalosti se přitom často liší od znalostí tvůrce otázky; 2) respondent se musí rozhodnout, zda je ochoten odpovědět a 3) jak odpoví (pravdivě …; člověk nerad přiznává nevědomost, což je častým zdrojem zkreslení [s.59]) a musí 4) verbalizovat odpověď, přitom hlavně v dialogu může být nepříjemné určitou alternativu vyslovit (lze obejít tím, že odpovědím přidělíme číslo a respondent jedno zvolí); nakonec 5) záznam odpovědi může způsobit zkreslení – např. při neúplném souboru alternativ a překrývajících se odpovědích.

Nemůžeme měřit přímo sociální jev, ale jen to, co považujeme za jeho ukazatel, indikátor. Nalezení správného indikátoru je tedy zásadní. Přitom jsou důležité dva pojmy [s.62]:

Některé odpovědi respondent nezná v dané formě („Jste alienován?“) či nepřizná („Jste rasista?“), proto je zjišťujeme nepřímým měřením a vzniká problém validity. Validitu měření lze ověřit:

I. skupina technik kontroly validity, asi nejmocnější, je založena na srovnání s nějakým vnějším kritériem [s.64]:

  1. Validita založená na členství ve známé skupině – testujeme na skupině mající danou vlastnost.

  2. Prediktivní validita – porovnání předpovědi založené na testovaném měření se skutečností.

  3. Souběžná validita – táž vlastnost je měřena více metodami, čím větší shoda, tím větší validita.

II. skupina:

  1. Konstruovaná validita – je konstruován test hypotéz logicky spojujících zkoumanou vlastnost s technikou měření, kterou užíváme.

III. skupina staví na obsahu měřeného jevu:

  1. Validita založená na mínění skupiny soudců, nejspíš odborníků z dané oblasti, kteří nezávisle na sobě validitu zváží.

  2. Validita testovaná výčtem obsahu – hlavně u neabstraktních, ale nejasně definovaných konceptů testujeme, zda naše měření dostatečně kryje doménu zkoumaného jevu. [s.66]

  3. Zjevná validita – když se zdá výzkumníkovi zřejmá; ale může se plést! Př.: „Vaše pohlaví?“

„Validita prokázaná v určitém kontextu a pro určitý účel je automaticky platná jen pro tento kontext a shodný účel.“ [s.67] Indikátory bývají nepřenosné třeba mezi 2 zeměmi. „Všechny závěry z empirického výzkumu, statistické důkazy atd. se nevztahují na jevy, které chceme studovat, ale jen na jejich indikátory.“ [s.76] Přitom vzdálenost mezi konceptem a jeho ukazatelem může být velká.

4. Hypotézy („Jak si nakreslit plán aneb Na co jsou hypotézy“)

„Kvantitativní výzkum není nic jiného než testování hypotéz.“ [s.76] Staví na dedukci: za východisko má teorii, na jejímž základě vytvoří hypotézy o tom, jaké vztahy mezi proměnnými by měly existovat, nasbírá data a hypotézy potvrdí či vyvrátí. Naproti tomu kvalitativní výzkum staví na indukci: začíná bez hypotéz, pátráním po pravidelnostech, které snad v objektivní skutečnosti existují, ty pak popíše ve formě předběžných závěrů, ověří dalším pozorováním a výstupem je nová teorie.

4.2 Pracovní hypotézy

Na cestě od teorie k výzkumu nejdříve utvoříme základní, obecné hypotézy (očekávání o charakteru věcí, vyvozené z teorie), ty v dalším kroku rozkládáme do souboru konkrétnějších pracovních hypotéz.

Pracovní hypotéza: 1) je tvrzení předpovídající existenci souvislosti mezi dvěma a více proměnnými; 2) všechny proměnné v ní musí mít validní operační definici (= popis operací, vedoucích k jejímu určení a změření); 3) soubor pracovních hypotéz musí zahrnovat nejen proměnné reprezentující zkoumané koncepty, ale i ty, které mohou významně zkreslit interpretaci testovaných vztahů. [s.79]

Pracovních hypotéz je mnoho – každý z indikátorů musí být použit ve zvláštní hypotéze (neb nevíme, jak je který důležitý) a musíme mít hypotézu pro každou proměnnou potenciálně hrající roli třetího v nepravé korelaci.

Je třeba si uvědomit, že operační definice není perfektní reprezentací teoretického konceptu (např. anomie ≠ četnost sebevražd). Empirický výzkum není s to testovat platnost velkých teorií a většinou ani teorií středního dosahu jako celku. [s.80]

4.3 Význam a role pracovních hypotéz

  1. „Formulace pracovních hypotéz je testem, zda je výzkum vůbec možný.“ [a.85]

  2. „Pracovní hypotézy jsou důležitým nástrojem pro optimalizaci redukce informací.“ [s.86]

  3. „Pracovní hypotézy obsahují základní informaci pro optimální rozhodnutí o technikách výzkumu.“ [s.87]

  4. „Pracovní hypotézy jsou základem pro odhad rozsahu výzkumu.“ [s.87]

5. Výběr vzorku („Kolik vran musíme pozorovat?“)

5.1 Vzorek, kvótní výběr

Vzorek = skupina jednotek, které skutečně pozorujeme.

Populace (základní soubor) = soubor jednotek, o němž předpokládáme, že jsou pro něj naše závěry platné.

Abychom z chování vzorku mohli usuzovat na chování populace, musí jeho struktura imitovat složení populace tak přesně, jak je to jen možné.

Kvótní výběr napodobuje ve struktuře vzorku známé vlastnosti populace, dbáme o stejné % zastoupení složek (věk, pohlaví, …). Populaci musíme dobře znát. Obtížný je samotný výběr, tj. nalezení jedinců odpovídajících kvótním požadavkům.

5.2 Pravděpodobnostní výběr

Má-li každá jednotka populace stejnou pravděpodobnost, že bude vybrána, máme náhodný vzorek. S rostoucí velikostí vzorku se rozdíl mezi strukturou jeho a populace snižuje.

Vlastnosti náhodného vzorku: 1) reprezentuje všechny známé i neznámé vlastnosti populace, proto pro nás podstatné proměnné budou mít ve vzorku podobné rozložení jako v populaci; 2) můžeme u něj odhadnout, jak moc se liší od populace; 3) potřebná velikost vzorku nezávisí na velikosti populace, ale jen na pro nás přijatelné velikosti chyby.

Hladina významnosti 95% znamená, že skutečná hodnota se nalézá s pravděpodobností 95% uvnitř vypočteného intervalu spolehlivosti (= výsledek měření ± chyba*N, při 95% N=2, při 99.9% N=3). Směrodatná chyba (odchylka) je funkcí homogenity populace a velikosti vzorku. Většinou neznáme rozptyl a tedy ani homogenitu proměnných, proto spoléháme na zkušenost a zdravý rozum a snažíme se o co největší vzorek. Velikost směrodatné chyby bere v potaz jen zkreslení rozdílem mezi vzorkem a populací, ne jiná, nebezpečnější zkreslení!

5.3 Techniky pravděpodobnostního výběru

Náhodný výběr tazatelem nebývá opravdu náhodný (upřednostňuje určitý typ lidí, jiným se vyhýbá).

Prostý náhodný výběr – každé jednotce populace přidělíme číslo a generujeme náhodná čísla.

Systematický výběr – do vzorku je zahrnuta každá N-tá jednotka ze seznamu, N = velikost populace/velikost vzorku, první jednotka je vybraná náhodně. Seznam nesmí být řazen dle nějakého systematického schématu (např. „každý 101. voják je důstojník“).

Náhodný stratifikovaný výběr – populace je rozdělena do skupin homogenních vzhledem k určitému kriteriu (např. hodnost v armádě) a jedinci jsou vybíráni do vzorku náhodně z těchto skupin. [107] Též tak snižujeme směrodatnou chybu, která závisí na homogenitě populace.

Vícestupňový náhodný výběr – vybíráme ve dvou a více krocích: nejdříve jsou vybrána určitá přirozená seskupení, a až z nich pak náhodně vybíráme jedince. Tento postup je náročný, drahý, ale nezbytný. Užití: A) Docílení menší prostorové rozptýlenosti respondentů a tím snížení výdajů na cestování (nejdříve náhodně vybereme reprezentativní soubor okresů, v každém z nich náhodně obec a v ní náhodný menší úsek, např. volební obvod, a nakonec vybereme jedince). B) Výběr, nemáme-li seznam populace – jako A), ale ve vybraných obcích či obvodech provedeme soupis všech sídelních jednotek (byty, domky; seznamy často zastaralé a nerozlišující nesídelní a obytné jednotky), vytvoříme z nich náhodný vzorek, a v každém vybraném sídle uděláme seznam obyvatel, z nichž vybereme, obvykle náhodně, jedince.

5.4 Nepravděpodobnostní techniky výběru

Kvótní výběr – viz výše, 5.1.

Účelový výběr je založený pouze na úsudku výzkumníka o tom, co by mělo být pozorováno a o tom, co je možné pozorovat. Jeho závěry takřka nikdy nelze příliš zobecnit. Výzkumník musí jasně, přesně a otevřeně definovat populaci, kterou jeho vzorek opravdu reprezentuje. [s.112-113]

Anketa je výběr založený na rozhodnutí respondenta zodpovědět otázky uveřejněné v masmédiích. Disman k tomu říká: „Poznávací hodnota ankety je podle mého názoru pod hodnotou dobře a zodpovědně napsaného fejetonu.“ [s.114]

Technika sněhové koule spočívá ve výběru jedinců, při kterém nás původní informátor vede k jiným členům naší cílové skupiny. „Je to technika identifikace populace, a ne vytvoření reprezentativního vzorku.“ [s.114] Je nenahraditelným nástrojem pro zkoumání jen dočasně existujících populací. Ideálně chceme dosáhnout „teoretické nasycenosti vzorku“, kdy už se noví jedinci neobjevují.

5.5 Omezení pravděpodobnostních technik

Techniky náhodného výběru vytváří nejlepší možnou reprezentaci populace, ale je reprezentativní jen pokud všichni dotázaní odpoví. „Redukce negativním samovýběrem vzniká tehdy, když část jedinců, vybraných do vzorku, odmítla na výzkumu participovat. Tento typ redukce může vážně ohrozit reprezentativnost vzorku.“ [s.116]

6. Kroky ve výzkumu („Jak se to vlastně dělá“)

Kroky: 1. Formulace teoretického či praktického sociálního problému. 2. Formulace teoretické hypotézy. 3. Formulace souboru pracovních hypotéz. 4. Rozhodnutí o populaci a vzorku. 5. Pilotní studie. 6. Rozhodnutí o technice sběru dat. 7. Konstrukce nástrojů pro sběr. 8. Předvýzkum. 9. Sběr dat. 10. Analýza dat. 11. Interpretace, závěry, teoretické zobecnění. [s.120]

Pilotní studie (def. USA) má zjistit, zda je náš výzkum v dané populaci vůbec možný. Je prováděn na malé skupině vybrané z cílové populace. Technika se podstatně liší od techniky vlastního výzkumu, zpravidla je kvalitativní. Chce zjistit, zda hledaná informace v populaci existuje a je dostupná. Může být velmi důležitá.

Předvýzkum má odzkoušet nástroje zkonstruované pro výzkum (srozumitelnost a jednoznačnost otázek atd.). Je prováděn na malém vzorku, ale větším než u pilotní studie. Opomenutí předvýzkumu je nesmírně riskantní.

6.2 Techniky sběru dat

Téměř všechny postupy jsou aplikací jedné ze základních technik: přímé pozorování („zaměřené, dobře plánované vnímání vybraných jevů. To, co bylo vnímáno, je pečlivě a systematicky zaznamenáváno.“), rozhovor, dotazník a analýza dokumentů (nevytvořených za účelem výzkumu; nejen psané materiály). Definice viz s.124.

Vlastnosti technik:

Otázky kódované respondentem jsou zdánlivě otevřené – respondent odpovídá volně, ale tazatel zaškrtne tu z daných odpovědí, jež se nejvíc jeho tvrzení blíží

Požadavky na uzavřené otázky: 1. Kategorie užité pro odpovědi musí zahrnovat všechny možné odpovědi. (Proto zavádíme „neodpověděl/neví“ či „jiná odpověď: vypište“.) 2. Kategorie se nesmí překrývat, tj. žádná odpověď nesmí spadat pod dvě. To je problém hlavně u obecných kategorií. Problém s výlučností je aktuální u otázky, která se zároveň ptá na víc věcí (nemělo by být!).

Standardizované pozorování (nestandardizované v kvantitativním výzkumu prakticky není): pozorovatel má standardizovaný záznamový arch s kategoriemi, ve kterých bude pozorované chování zaznamenáváno. Objevuje se problém reliability: „Reliabilní je taková metoda pozorování, při jejíž aplikaci skupina pozorovatelů, pozorujících nezávisle stejný jev, dospěje k shodným závěrům.“ [s. 131]

Obsahová analýza je „objektivní, kvantitativní analýza sdělení jakéhokoliv druhu“ [s.131], tzn. je to standardizovaná analýza dokumentů.

Srovnání základních technik (interference, sleduje jev/ukazatel …) – viz tabulka na straně 125.

Interference se zkoumaným systémem je zkreslení vyvolané výzkumnými stimuly [s.132]: 1) Efekt morčete: změna chování osob vědomých si svého pozorování. 2) Výběr role: zkoumaná osoba se snaží jevit v co nejlepším světle, příp. navíc co nejlépe v očích tazatele. 3) Měření jako zdroj změny: výzkumný proces může ve zkoumaných osobách vyvolat postoje, jež předtím neexistovaly. 4) Stereotypy ve volbě odpovědi: volba alternativních odpovědí je ovlivněna jinými faktory než míněním respondenta. 5) Efekt záhlaví: zkreslující efekt představy respondentů o instituci, která provádí výzkum, nebo s níž jej asociují (např. StB).
Ad 3) Až výzkum může respondenta vést k zamyšlení nad daným tématem a vytvoření (nestabilního) názoru. Proto 1. předvýzkumem zjistíme, zda je informace dostupná a 2. užijeme filtrační otázky ověřující, jak dalece je respondent kvalifikován poskytnout žádanou informaci. Ad 4) „response sets“ - např. sklon spíš souhlasit než nesouhlasit (acquiescence), sklon nevolit krajní možnosti (nucená volba – vynechání neutrální odpovědi).

Výzkumný proces, jenž bude pro respondenty nudný, vyvolá nutně zkreslení.

7. Nástroje sběru dat („Kulhavý poutník“)

Dotazník poslaný poštou má velmi nízkou návratnost a redukce vzorku na ty, kdo odpověděli, má systematický charakter. Proto „je pro seriózní výzkum většinou nepoužitelný.“ [s.142] Je-li však předmět dotazníku pro respondenty dost zajímavý, může být návratnost velká, navíc se zde připojuje výhoda anonymity. Jinou možností je osobní distribuce a sběr dotazníků, která zajistí srovnatelnou návratnost s rozhovorem, ale též vyšší časovou a finanční náročnost. Metody zvýšení návratnosti a o formách dotazníku – viz str. 143 (frankovaná obálka, slušný papír, dost místa na odpověď, ne moc dlouhý, doprovodný dopis, odměna, „follow ups“ - upomínkování). Zkreslení způsobené nízkou návratností lze částečně odhalit srovnáním demografických dat respondentů a populace, lépe pak rozhovory s mlčícími. Mezi další problémy dotazníku patří přeskakování otázek, kolektivní vyplňování, vyplnění jiným člověkem.

Rozhovor (čas tazatele) je drahý a výrazně se projevuje „interviewer bias“ - to, že respondent chce zapůsobit na osobnost tazatele; je časově náročný. Jiné formy: 1) telefonní rozhovor má nižší náklady i interviewer bias a vyšší pocit anonymity, ovšem probíhá jen na populaci vlastníků telefonů; 2) CATI (computer assisted telephone interview) – záznam odpovědí hned do počítače, pročež odpadá přepis a jeho chyby, navíc je průběžná kontrola validity odpovědí, lepší navigace větveným dotazníkem, možnost náhodně měnit pořadí otázek a bloků což minimalizuje zkreslení dané pořadím otázek, náhodná volba telefonních čísel (v určité geografické oblasti) nahrazuje výběr.

7.2 Konstrukce otázek

Otázky k otázkám: 1. Je tato otázka nezbytná? 2. Měří to, co má? 3. Bude srozumitelná všem členům vzorku, a to stejně? 4. Je respondent s to poskytnout žádané informace? 5. Neptá se otázka na dvě věci najednou? 6. Není otázka sugestivní? - např. pokud výslovně zmiňuje jen jednu alternativu, užívá emočně laděné výrazy či poukazuje na názor autority. 7. Je výčet alternativ odpovědí na uzavřenou otázku úplný a nepřekrývají se? 8. Je užití otevřené otázky opravdu nezbytné? 9. Nevyžaduje otázka nějaké příliš zobecněné údaje? (Průměrné údaje, otázky proč.) 10. Mají odpovědi všech respondentů stejnou váhu? - někteří mohou být o problému lépe informovaní - vhodné je užití filtračních otázek. 11. Není tato otázka nepříjemná, znepokojující, nemůže se respondent cítit ohrožen pravdivou odpovědí?

7.3 Nepřímé tázání (na citlivá témata)

Ptáme-li se na něco, o čem se nemluví, je podstatné přesvědčení respondentů o anonymitě výzkumu. Velmi účinné může být užití vhodného eufemismu („výchovné metody“ místo „trestání dětí“), můžeme použít záměrně sugestivní otázky k vyvážení sklonu volit líbivější odpověď, nepožádáme respondenta o přiznání určité aktivity, ale formulujeme otázku s cílem vyvolat dojem běžnosti daného chování („Kdy jste naposledy kouřil marihuanu?“), nabídnutí možnosti „čestného ústupu“ sníží počet odpovědí z nevědomosti a nabídnutí možnosti neodpovědět na nepříjemnou otázku může paradoxně zvýšit počet odpovědí.

Projekční otázky jsou nejúčinnější z nepřímých otázek. Neptáme se na postoje atd. respondenta, ale na názory jiných osob nebo lidí obecně. Předpokládáme, že je snazší projektovat své názory. Různé formy, např.: a) Test nedokončených vět („Když si vedle Jana sedne Vietnamec, tak on vždycky ...“), b) Anekdotická otázka – respondent volí jedno z nabízených řešení příběhu (např. který hrdina má pravdu). Projekční otázky jsou často ve formě jednoduché ilustrace (postavy nesmí mít žádné určité atributy jako pohlaví a věk) – předpokládá se, že vyvolají pocit nereálnosti, hry a nezávaznosti, čímž zvýší pravděpodobnost upřímné odpovědi. Navíc oživí dotazník a brání nudě. Ale není jisté, že k projekci dojde, není zaručena validita a je nutné ji ověřit. V poslední době popularita projekčních otázek pro jejich problematickou validitu klesá.

Kontrolní otázky: důležité proměnné operacionalizujeme do více otázek (přímých i projekčních), rozmístěných v dotazníku daleko od sebe. „Randome probe“ - každý tazatel dostane navíc 1 či víc z otázek s problematickou validitou a po skončení standardizovaného dotazování se k ní vrátí nestandardizovaně, nechá si objasnit respondentovo chápání a odpověď, tak může odhalit nevaliditu otázky.

7.4 Celek otázek

  1. Zjišťují naše otázky opravdu všechny informace nezbytné pro testování všech pracovních hypotéz?

  2. Nemohou předchozí otázky zkreslit odpovědi na ty následující? (Haló efekt). U dotazníku mohou všechny otázky ovlivnit všechny ostatní, je-li celý přečten před vyplněním.

  3. Jsou otázky pokládány v nějakém logickém sledu? Náhodně uspořádané otázky působí na respondenta psychologicky negativně, ale zase by neměl být schopen odhalit, alespoň ne zpočátku, cíl a hypotézy výzkumu.
    Výhybková otázka – má předejít šoku z následující kritické otázky či její špatné interpretaci.[158]

  4. Podporuje dramaturgie sledu otázek podmínky pro úspěšné a úplné dokončení rozhovoru/dotazníku? První otázky by měly být snadné, zajímavé a získat respondentovu důvěru (tj. ne demografické charakteristiky – ty uprostřed). Můžeme přidat i nadbytečné, pro výzkum zbytné otázky, které mají prolomit ledy. Vhodná úvodní otázka může minimalizovat iritaci dotazovaných určitým výzkumným tématem (ukáže pochopení jejich situace …). Méně zajímavé otázky patří doprostřed, kdy už je respondent v tempu, ale ještě není unaven. Ke konci se projevuje únava, je tedy třeba uvést zvlášť zajímavé otázky, změnit jejich formu (třeba vizuální reprezentací) apod.
    Sémantický diferenciál zaujme většinu respondentů – mají něco popsat na několika škálách, obvykle s lichým počtem kategorií, definovaných v protikladných párech slov (intro. x extrovertní). Vynikající pro zjištění stereotypů o určité sociální skupině.

  5. Podporuje stavba rozhovoru/dotazníku představu o anonymitě dotazovaného? (Žádná záhadná čísla.)

  6. Není rozhovor/dotazník příliš dlouhý? Informuj pravdivě o délce rozhovoru.

  7. Jsou odpovědi na otázky jedinou informací, kterou má tazatel zaznamenat? (Popis atmosféry ….)

7.5 Analýza dokumentů a pozorování

Standardizované pozorování neinterferuje se systémem, není-li zaznamenáno (užíváme sociální krytí pozorovatele). Je spolehlivé jen pro jevy, jež můžeme přímo vnímat. Vykládat chování jako indikátor něčeho je obtížné.

Obsahová analýza je kvantitativní, objektivní analýza sdělení jakéhokoliv druhu.“ [s.168] (An. Content Analysis.) Může se zabývat třeba obsahem, formou, autorem, adresátem. Je též důležitým nástrojem pro organizování záznamů získaných kvalitativními postupy. Organizačně se podobá výzkumu – vychází z pracovních hypotéz, ze souboru sdělení vybírá vzorek atd. Pro objektivnost musí být operační definice velmi jasné a jednoznačné, aby dva výzkumníci došli vždy k témže závěrům. Je třeba vzít v potaz možné zkreslení – úmyslné, dané různými metodologiemi záznamu atd. Musíme definovat kvantitativní jednotky, v nichž budeme měřit rozsah sdělení, a to na 2 úrovních [s.169]: 1. záznamové jednotky měřící rozsah a 2. kontextuální jednotky užívané s kraťoučkými záznamovými jednotkami, které by ztrátou kontextu mohly změnit smysl (např. ironie), slouží jako podklad pro kategorizaci. Srovnáváme-li kvantitu dvou sdělení, nestačí jen sám rozsah, ale třeba uvést i jakou část ze zdroje to představuje, navíc někdy je významnost sdělení určena i dalšími rysy – u článku zda je na titulní straně, zda má fotku atd.

Sekundární analýza dat užívá dat sebraných pro jiný výzkum, která se však vztahují k našemu.

8. Statistika

Souvislost (korelace) může být definována jako přírůstek v pravděpodobnosti správného odhadu jedné proměnné, za nějž vděčíme znalosti jiné proměnné. [s.181]

Perfektní (deterministická) souvislost znamená, že známe-li jednu proměnnou, známe 100% i druhou.

8.2 Třídy proměnných (3)

  1. Nominální (kvalitativní) proměnné – jejich kategorie jsou pouhá jména, nelze je řadit (pohlaví)

  2. Ordinální (pořadové) proměnné – kategorie mohou být seřazeny do nějaké hierarchie, ale nelze říct, o kolik je jedna nižší či vyšší než druhá (medaile na olympiádě)

  3. Kardinální (intervalové) proměnné – lze určit, kolikrát je jedna kategorie větší (počet dětí)

Každá třída má své statistické operace a platí, že operace nižší třídy (1, 2) je použitelná i na vyšší.

Indikátory střední tendence/hodnoty: aritmetický průměr pro kardinály, medián (hodnota uprostřed po seřazení dle velikosti) pro ordinály a modus (kategorie s největší četností) pro nominály.

Rozptyl ([∑(p – pi)2]/N pro populaci, /N-1 pro vzorek; p je aritmetický průměr), resp. směrodatná odchylka (√rozptyl) udává, jak se v průměru pozorování liší od průměrné hodnoty.

Normální rozložení [četnosti výskytu] – u něj jsou extrémy nejméně časté, platí pro většinu jevů v přírodě. Též zván Gaussova křivka, „bell curve“. Platí, že v intervalu průměr±směrodatná odchylka je 68%, v intervalu průměr±2*směrodatná odchylka jich je 95% (viz 5.2 – hladina významnosti).

Statistická významnost udává, s jakou pravděpodobností je náš závěr mylný. Obvykle 5% (100-95).

8.3 Vyjádření míry korelace

Souvislost (viz definice) vyjadřujeme jako „relativní redukci omylu“ (PRE: Proportional Reduction in Error). PRE = (původní omyl – omyl při znalosti související proměnné)/původní omyl. 1 je perfektní souvislost, 0 naprostá nezávislost.

Upřesnění výpočtu PRE dle Guttmana: Lambda (Guttmanův index předpověditelnosti) – založený na optimalizaci odhadu. Př.: máme informace o užívání/neužívání rtěnky, máme uhodnout pohlaví respondenta, počet mužů a žen známe (řekněme 300:200). Výpočet původní chyby (bez užití proměnné „rtěnka“): hádej o všech pozorováních, že patří do modální kategorie (té s největším počtem pozorování; zde muži => chyba ve 200 případech). Užití znalosti druhé proměnné: předpokládáme, že modální kategorie pro uživatele rtěnky je „žena“, pro neuživatele „muž“. λ= 0.75 znamená, že znalost druhé proměnné zmenšila počet omylů v prvé proměnné o ¾. Koeficient větší než 0.30 je dobrým důvodem k oslavě. λ je asymetrický koeficient, tj. jeho hodnota pro odhad X z Y není stejná, jako pro odhad Y z X.

8.4 Korelace a regresní analýza

Regresní přímka (viz r. analýza): křivku y=f(x) proložíme (aproximujeme) přímkou. Čím větší rozptyl pozorování od regresní přímky, tím menší přesnost i korelace (od shody |/ k100% nezávislosti – rozptyl v kruhu: |O ). Tomu odpovídá regresní koeficient (směrnice) v rozmezí 1 – 0 (až -1 pro Y klesající s rostoucím X), jenž udává, o kolik vzroste Y při změně X, a r2 čili proporce variance v proměnné Y, vysvětlitelné změnami v X (např. r2 říká, jaké % rozdílů v příjmech se zdá být vysvětlitelné rozdíly ve vzdělání respondentů).

Regresní koeficient (b) je sklon, směrnice regresní přímky y=bx+a, říká, co máme hádat (že y je funkce x), r udává přesnost hádání.

9. Vícerozměrná regresní analýza

V sociologii hrají v prakticky každém vztahu roli víc než 2 proměnné (faktory), 2 rozměry nestačí.

9.1 Kontrola dalším faktorem

Kontrola dalším faktorem (control for test factor) ověřuje vliv další proměnné – potenciálního původce nepravé korelace. Vzorek rozdělíme do tolika podsouborů, kolik kategorií (hodnot) má proměnná, jejíž vliv na korelaci ověřujeme, čili pro každý z nich má konstantní hodnotu. Pokud korelace v každém podsouboru vymizela či je velmi oslabena, jedná se opravdu o nepravou korelaci, způsobenou ověřovaným faktorem.

Čím víc kategorií má faktor a čím víc faktorů kontrolujeme, tím méně pozorování je v každém konečném podsouboru, což může značně zkreslit výpočet korelace v něm. Proto je metoda použitelná jen pro malý počet kategorií a kontrolovaných faktorů.

Nepravá nezávislost nastává, když souvislost (korelace) existuje jen u části vzorku (např. jen pro lidi s VŠ vzděláním), pročež je v celkovém pohledu neviditelná. Pomáhá analýza více proměnných.

9.2 Vícerozměrná regresní analýza

Pozn.: Zabýváme se zde pouze lineární analýzou, je proto použitelná jen na lineární data (tj. ne plat = funkce √(vzdělání)).

Parciální koeficient [s.229] je koeficient očištěný od (některých) zkreslujících vlivů přidružených proměnných, např. koeficient vlivu vzdělání na plat parciální vzhledem k přidružené proměnné povolání udává, jak vzroste příjem pro osoby se stejným povoláním, když jejich vzdělání vzrostlo o jeden rok. (Chceme vzdělání→plat bez nepřímého vlivu vzdělání→povolání→plat.)

Parciální regresní koeficient se značí byx.z , kde y je závislá proměnná (musí být prvá, neb jde o asymetrický koeficient), x je nezávislá proměnná (y=f(x)) a za tečkou jsou kontrolované proměnné (.z), tj. ty, jež v daném případě udržujeme konstantní, eliminujíc tak jejich vliv. Výše jsme v podstatě zmiňovali „b(y=plat)(x=vzdělání).(z=povolání)“.

Regresní plocha je obdobou regresní přímky. Je lineární, a proto „rovná“, tzn. není vlnitá apod. Je vyjádřena regresní rovnicí (kde a je konstanta): y = a + xbyx.z + z byz.x

Mnohonásobný korelační koeficient R je obdobou korelačního koeficient z dvourozměrného prostoru, stejně tak jeho čtverec R2y.zx udává proporce rozptylu v y, vysvětlitelné rozdíly v x a z, tj. ve všech nezávislých proměnných působících současně.

Parciální (dílčí) korelace r udává, jak moc určitá nezávislá proměnná přispěla k vysvětlující síle R; r2yx.z udává proporce rozptylu v y, vysvětlitelné rozdíly v x poté, co proměnné za tečkou z vysvětlily vše, co byly s to vysvětlit. Parciální korelace ryx.z je je vždy menší, než prostý korelační koeficient ryx, protože je očištěna od vlivu přidružené proměnné (zde z, tj. z se do výsledku počítá 1*).

9.3 Normalizace a „kardinalizace“ proměnných

„Regresní analýza nám umožňuje porovnat sílu různých faktorů, ovlivňujících závisle proměnnou“ [s.234]. Mnohorozměrnou regresní analýzu můžeme provádět teoreticky na jakémkoli počtu proměnných.

Parciální regresní koeficient (např. vliv vzdělání a vliv povolání na plat) nelze ihned porovnávat, musíme je nejdříve normalizovat, tzn. převést na stejný základ: všechny škály musí mít (1) týž výchozí bod a všechny proměnné musí být (2) měřeny v týchž jednotkách. Proto (ad 1) hodnotu místo v absolutních jednotkách vyjádříme jako odchylku od průměru a (ad 2) každou proměnnou měříme v jednotkách její vlastní směrodatné odchylky. Dostaneme normalizovanou (standardizovanou) regresní plochu, resp. nadplochu: y = a + ∑βixi pro N nezávislých proměnných, kde β1 = βyx1(tečka)x2x3.... xN (místo „b“ v 2D zde píšeme „β“).

Problém: regresní analýzu lze provádět jen na kardinálních proměnných, někdy však lze nominály či ordinály na ně převést:

Alternativní proměnné nabývají jen hodnot „ano“, resp. 1, či „ne“, resp. 0, a v podstatě na ně lze aplikovat statistické operace jako na kardinály. Téměř všechny data lze převést na soubor alternativních proměnných (zveme je pak formální proměnné), těch je o jedna méně než počet kategorií dané proměnné, neb jedna kategorie je nevyjádřená (němá), je reprezentována hodnotami „ne“ ve všech formálních proměnných. Jako němou je třeba volit kategorii, jež je dobře definovaná [s.280]. Formální proměnné - jejich koeficient bY. X1X2... udává, jak se změní y, když x1 se změní z němé kategorie do kategorie charakterizované danou formální proměnnou. Užití alternativních proměnných komplikuje odhad vlivu původní, nekardinální a „nerozkouskované“ proměnné jako celku na závislou proměnnou, viz později; užívá se mj. semiparciálních korelačních koeficientů.

9.5 „Path analysis“

Patří mezi nejpoužívanější postupy, hlavně proto, že je schopna popsat sílu vlivů mezi proměnnými v kauzálních modelech. Vícerozměrná regresní analýza měří vliv mnoha nezávislých proměnných na jednu závislou, path analysis měří sílu vztahů v celé kauzální síti, tzn. i nepřímých vlivů – ovšem jenom pokud jsme schopni odhadnout, v jakem kauzálním pořadí se proměnné ovlivňují.

p-koeficient je koeficient vytvořený path analýzou . Např. nepřímý vliv vzdělání na příjem prostřednictvím povolání spočteme: p-koef. (vliv vzdělání na povolání) x p-koef. (vliv povolání na příjem). P-koeficient je specifickým případem β koeficientů. P-koef. pro vztah mezi nezávislou proměnnou A a závislou B je příslušný β koeficient, kontrolovaný pro všechny proměnné (tj. jsou za tečkou '.'), z nichž vstupují přímé (kauzální) šipky do závislé proměnné B; značí se pAB.(kontrolované proměnné)

Velmi zjednodušeně je path analýza aplikací vícerozměrné regresní analýzy na systém proměnných, jež jsme schopni seřadit do spolehlivého kauzálního modelu (path analýza jej neumí vytvořit ani ověřit jeho validitu).

Residua – jakési nespecifikované proměnné, shrnující všechny modelem nezachycené vlivy na danou závislou proměnnou.

Pozn.: proměnné, reprezentující kategorie téže umělé (alternativní) proměnné nesmí být spojeny šipkami. [s.258]

Postup (na počítači): (1) Pro každou závislou proměnnou (ta, do níž vstupuje alespoň jedna šipka) vypočteme samostatnou regresi, přičemž (2) Prediktory (nezávislými proměnnými) budou pro ni jen ty, z nichž do ní vedou ony přímé šipky. (3) Vytiskneme nejen b (prosté), ale i β (parciální) koeficienty. (4) Výsledné β koeficienty jsou totožné s p-koeficienty.

Pozn.: Vypuštění kterékoli proměnné nutně vyvolá změnu všech zbývajících koeficientů. [s.260] Rozhodnutí o technice statistické analýzy může ovlivnit validitu našich závěrů (větší redukce informací vede k nižší validitě).

9.6 Diskriminační a faktorová analýza

A. Diskriminační analýza [s.265]

Slouží k optimálnímu odhadu, do jaké skupiny určitý jedinec patří (např. zda se hodí ke studiu práv nebo koho bude asi volit). Princip: analyzujeme vlastnosti osob se známým členstvím v určité skupině. Použití metody je velmi komplexní. Umí řešit problémy typu zda přijmout člověka s lehkým nadprůměrem ve všech užitých prediktorech nebo člověka v některých lehce podprůměrného, ale v jiných velmi nadprůměrného. Výsledkem analýzy je při rozlišování mezi N skupinami N-1 diskriminačních funkcí.

Diskriminační funkce přiřazuje každému prediktoru koeficient, jímž násobíme hodnotu každé proměnné pozorované pro daného jedince, součet těchto násobků pak udává jeho diskriminační skóre. Diskriminační funkce představují osy v prostoru, v němž je jako bod (centroid) reprezentována skupina i jedince, hledáme, kterému centroidu je jedinec nejblíže.

B. Faktorová analýza [s.273]

„ … netestuje hypotézy, ale je nástrojem pro jejich formulování a upřesňování“ [s.273] a též je nástrojem zjednodušování dat. Laicky řečeno je schopna nalézt seskupení proměnných, které patří nějakým způsobem k sobě, neřekne však jakým. Vstupem je korelační matice (aij = koeficient korelace proměnných xi a xj), výstupem matice faktorových zátěží (bik = faktorová zátěž – factor loading – proměnné xi pro faktor fk , tj. míra spojení proměnné s tímto faktorem). Ideálně má skupina proměnných velkou zátěž v jednom faktoru a téměř žádnou v ostatních.

Užití: např. test, že všechny otázky dotazníku měří tentýž koncept (=> velká zátěž v jediném faktoru), zjednodušení dat vytáhnutím nejdůležitější proměnné aj., ustavení validity jiných technik, odhalení falšujícího tazatele, explorativní výzkum (objevování souvislostí, a pak jejich interpretace; interpretace spočívá ve vysvětlení, co mají proměnné s vysokou zátěží v daném faktoru společného).

Faktorová analýza ukazuje stejně nejen na souvislosti obsahu proměnných, ale i na souvislosti někdy velice prozaického a mechanického charakteru [s.276] – kauzalita, shodná technika sběru dat pro proměnnou … . Naopak může též „nalézt“ víc faktorů, než je nutné, např. jsou-li dvě skupiny proměnných formálně různorodé, nejspíš objeví 2 hlavní faktory místo jednoho. Jsou s ni spojena některá úskalí a někdy nás může zavést k docela pošetilým závěrům, je radno spolupracovat na ni se statistikem.

10. Kvalitativní výzkum („Ten druhý výzkum aneb … “)

10.1 Odlišnost kvalitativního a kvantitativního výzkumu

Kvalitativní výzkum má jiné cíle, a tedy i pravidla, než kvantitativní. Cílem je „porozumění lidem v sociálních situacích“ [s.289], studium subjektivních, nikoli objektivních kategorií a vytváření nových teorií a hypotéz. Získává mnoho informací o velmi malém počtu jedinců, proto jeho závěry mají nízkou reliabilitu, ale potenciálně vysokou validitu. V kvalitativním výzkumu o redukci dat v podstatě rozhodují respondenti tím, že výzkumníkovi řeknou to, co oni považují za relevantní; on v tom pak hledá struktury.

10.2 K čemu je to dobré?

Kvalitativní a kvantitativní výzkumy se doplňují: prvý pomáhá rozumět, druhý ověřuje validitu tohoto porozumění. [s.290] Sociolog se stále setkává se (sub)kulturami, jež jsou mu alespoň částečně cizí, čímž se vystavuje nebezpečí mylného výkladu – a proto je zásadní porozumění. „V subjektivním prostoru, ve kterém jedinec pro sebe interpretuje sociální realitu a podle této interpretace také jedná, můžeme být naprostými laiky“ [s.293] – a to i kdybychom byli experty v mnoha dimenzích sociální reality.

Symbolický interakcionismus předpokládá, že sociální vztahy jsou budovány sociální interakcí na symbolické úrovni (Mead, Goffman), neusiluje o kauzální vysvětlení sociálního fenoménu, ale porozumění významu příslušného chování. Jako fenomenologové vidí svět – to, co lidé říkají a dělají – jako funkci toho, jak lidé svůj svět interpretují.

Etnometologie je „studie metod, které lidé používají, aby dali smysl situacím denního života“ [s.295], studie metod a pravidel „common-sensuálního“ porozumění. (Založil Harold Garfinkel.)

[Vhodná literatura: Jack D. Douglas: Understanding Everyday Life, 1971.]

10.3 Strategie kvalitativního výzkumu

Výzkumník musí minimalizovat zkreslení dat v průběhu výzkumných procedur, začíná proto co nejvěrnějším popisem, neredukovaným a bez interpretací.

Nejběžnější techniky: 1. Zúčastněné pozorování. 2. Nestandardizovaný rozhovor. 3. Analýza osobních dokumentů.

Vstupem kvalitativního výzkumu je sociální problém. Pak probíhá zároveň terénní výzkum, vytváření vzorku, sběr dat, jejich analýza i interpretace. Výstupem jsou nové hypotézy, případně „grounded theory“.

Grounded theory (dobře podložená teorie, Glaser a Strauss 1967) je induktivní strategie vytváření teorie (čistě) z dat. Výzkum obvykle začíná narrativem – osobní výpovědí toho, kdo daný problém prožívá, jeho definice problému. Jsou zde dva důležité koncepty [s.300]:

  1. theoretical sampling“ (vytváření teoretického vzorku) – současný sběr, kódování a analýza dat a rozhodnutí, kde sbírat další. Celý tento proces je řízen čistě vynořující se teorií, vytvářené pracovní hypotézy a vynořující se struktury jsou v každém kroku upřesňovány, nahrazovány či měněny až do chvíle, kdy nová informace nevede k dalším změnám – pak je výzkum teoreticky nasycen. Výzkumník se snaží nasycenost ověřit rozmanitostí vzorku , tzn. sbíráním informací z co nejvíce různých zdrojů.

  2. constant comparative method“ (metoda konstantního srovnávání) – současně vytváříme kódování a interpretace, tedy „metodologie výzkumu není vytvářena předem, ale v průběhu sběru dat“ [s.301], dosavadní výsledky a jejich interpretace vedou k modifikaci metody (je kladena nová otázka či vybrán určitý respondent) nebo i změně techniky sběru dat. Model kvantitativní reliability je nepoužitelný, zde my vytváříme teorii. Věrohodnost kvalitativního výzkumu „je dána naprostou jasností analytického procesu, jehož každý krok je v publikaci předložen čtenáři a jeho logická správnost může být sledována i laikem“ [s.302]

10.4 Výzkumné techniky

Vzorek je utvářen průběžně. „Cílem konstrukce vzorku v kvalitativním výzkumu je reprezentovat populaci problému, populaci jeho relevantních dimenzí.“ [s.304] Ne reprezentace populace jedinců.

Sběr dat pomoci zúčastněného pozorování „je styl výzkumu, ve kterém výzkumník participuje na každodenním životě lidí, které studuje.“ [s.305] Ne proto, aby skryl svůj záměr, ale aby lépe porozuměl. Přitom je možná čtverá míra ztotožnění s objektem výzkumu:

  1. Úplný pozorovatel – výzkumník je s participanty spojen jen prostorem.

  2. Pozorovatel jako participant – výzkumník je v sociálním kontaktu s participanty, ale nepředstírá, že je skutečným participantem.

  3. Participant jako pozorovatel – výzkumník se plně účastní na životě skupiny, netají však, že pozoruje. Hrozí nebezpečí ztráty objektivity a nadhledu, ztotožnění se se skupinou („go native“).

  4. Úplný participant – ještě větší ztotožnění než u 3. Nikdo ve skupině neví o výzkumu. Pravděpodobnost „going native“ je vysoká [s.307].

Zúčastněné pozorování zahrnuje víc technik, včetně sebereflexe prožívání participace [s.308], nestandardizovaného interview (kdy tazatel má jen obecný plán bez seznamu otázek), analýzy osobních dokumentů (pátráme v nich po existujících strukturách), ideálně s jejich výkladem tvůrcem, resp. „znalcem“. Existují další prostředky, mj. technika mentálních map – např. necháme respondenta nakreslit mapu domova a zkoumáme, co obsaženo a co vynecháno; podstatným zdrojem je přitom vlastní autorův výklad.

10.5 Záznam dat [s.311]

V kvalitativním výzkumu probíhá zároveň výběr jedinců, shromažďování dat, jejich analýza, verifikace slyšeného a metodická rozhodnutí o dalších krocích – a to vše musí být zachyceno v záznamu, aby dostatečně prokazoval validitu postupů. K tomu slouží polní poznámky (field notes) = chronologický záznam všeho, co se děje ve zkoumaném prostředí, co se s ním děje i co se děje v pozorovateli (protože jeho pocity, dojmy a nápady mají velký dopad na výzkum). [s.312]

Vytváření polních poznámek [s.313]: Magnetofon zaznamenává jen zvuk, uniká mu neverbální komunikace a nepochytí výzkumníkovy nápady a poznámky, které by s procesem získávání dat měly být synchronizovány. Záznam pozorování musí být v co nejkonkrétnějších pojmech – nezobecňovat, neusuzovat, neužívat odborný žargon. Jelikož výzkumník je hlavním nástrojem analýzy a zároveň zdrojem možného zkreslení, je třeba zaznamenat jeho pocity, dojmy a nálady. Poznámky musíme průběžně organizovat. Máme několik typů dokumentace: organizační (adresář, informace o místech a organizacích atd.), analytickou (analýzy a interpretace) a terénní (zbytek, uspořádaný chronologicky). Dokumentaci musíme v zájmu přežití pravidelně zálohovat.

V kvalitativním výzkumu je také formalizovaná redukce dat, kategorie se noří z výkladu dat. Různí autoři doporučují rozličné kódy pro označování dat – viz str. 317 – 318.

11. Srovnávací výzkum („Cizinec jako sociolog - … “)

Sociolog téměř vždy studuje jiné sociální prostředí, než své vlastní, a tedy jinou kulturu, ve které je více či méně cizincem.

Člen společnosti vnímá svět sebestředně, zná jen pro něj relevantní informace a jeho znalosti jsou nekoherentní, jen částečně jasné a plné protikladů – přesto s nimi ve svém prostředí bohatě vystačí, a to díky už hotovým, naučeným receptům na pochopení a zvládání každodenních situací – kulturním vzorcům. Ale jinde „myšlení jako obvykle“ nefunguje. Přesto máme sklon je jinde používat a nahlížet skrz ně na skupinu, do níž vstupujeme – etnocentrismus. Zatímco „domorodec“ situacím díky kulturním vzorcům rozumí, cizinec je musí racionálně analyzovat a vyložit – možná mylně, bez schopnosti rozlišit typické a individuální. (Vynikajícím vstupem do tohoto tématu je kvalitativní studie přistěhovalců Stranger (Cizinec, 1962) Alfreda Schutze.)

Člen domácí společnosti prostě nechápe, že kulturní vzorce, jež mu dávají jistotu útulku, jsou pro cizince bludištěm, kde se ztratí.

Při srovnávacím výzkumu chceme prozkoumat a porovnat dvě či více různých sociálních prostředí, třeba zemí. Přitom je zásadní problém překladu (např. dotazníku), a to hlavně díky rozdílům kulturního kontextu (ovlivňují i tak „objektivní“ vědu jako medicína, jak dokazuje srovnávací výzkum přístupu k nemoci a léčení v Německu, Francii, Britání a USA).

Indikátory: Pokud indikátor existuje jen v jedné zemi, musíme v druhé nalézt jeho ekvivalent. Máme-li skupinu univerzálních indikátorů (platných v obou zemích), pak můžeme navíc získat soubory ekvivalentních indikátorů specifických pro každou zemi tak, že kandidáty na ně zkorelujeme s univerzálními indikátory; ty s dostatečně vysokou korelací lze použít. [s.353] Statistickou analýzu pak provádíme nejdříve pro každou zemi zvlášť, což nám umožní ponechat jen ty proměnné, které skutečně dostatečně souvisí s univerzálním souborem.

Překlad vyžaduje skutečně bilingvního překladatele s hlubokou a aktuální znalostí obou kultur. Validitu překladu je třeba pečlivě kontrolovat, asi nejlepší je k tomu technika zpětného překladu – další překladatel přeloží výsledek zpět do původního jazyka a porovnáme s originálem, při nedostatečné shodě opakujeme od začátku, s jinými překladateli. Dále musíme vést v patrnosti, že jazyk je rovněž citlivý k sociální vrstvě překladatele a adresáta.

Podle Dismana je jediným řešením pro zajištění kvality mezinárodních srovnávacích výzkumů vytvoření opravdu mezinárodního týmu s lidmi ze všech zúčastněných zemí a maximální mezinárodní spolupráce u všech kroků.

Výzkumník nesmí zanedbat ani etiku: mj. musí vždy jasně ukázat omezení (platnosti) poznatků a nezapomínat, že nezkoumá jevy, ale jen indikátory. Jinak nese spoluzodpovědnost za následky zásahu, inspirovaného poznatky jeho výzkumu.