FAQ k datům SHARE

Odpovědi na časté otázky k projektu a datům SHARE můžete nalézt v podrobnější anglické verzi na hlavních stránkách projektu SHARE.

Zde vybíráme pouze obecně důležité informace.

1. Co je SHARE?

SHARE je multidisciplinární a mezinárodní longitudinální databáze (tzn. že sleduje stejné jednotlivce v čase, každé dva roky). Poskytuje mikro údaje týkající se zdraví, sociálně-ekonomického postavení a sociální a rodinné sítě více než 140,000 jednotlivců ve věku nad 50 let.

 

2.1 Kdo může data používat?


Data projektu SHARE jsou k dispozici pro výzkumníky afiliované s akademickou institucí nebo výzkumným ústavem, a to bezplatně. Data jsou určena pouze pro vědecké účely. Přístup k datům je na registračních stránkách projektu.

 

2.2 Kde si mohu stáhnout data?

Klikněte na "Přístup k datům" na internetových stránkách SHARE. Tam najdete informace o podmínkách pro využití dat a hypertextové odkazy na dokumenty, které budete muset podepsat a přijmout podmínky používaní dat. Podepsaný dokument zašlete na uvedenou emailovou adresu. Data jsou uložena v archivu CentERdata na Tilburg University a v archivu GESIS. CentERdata vám poskytne přihlašovací kód a heslo.

 

2.3 V jakém formátu jsou data?

 Data jsou ve formátu STATA, SPSS a R (statistický program R je zdarma ke stažení).

 

3. Které země se projektu účastní?

2004 základní studii (Wave 1): Jedenáct zemí SHARE - Rakousko, Belgie, Dánsko, Francie, Německo, Řecko, Itálie, Nizozemsko, Španělsko, Švédsko a Švýcarsko.
2005-06: Další údaje jsou shromažďovány v Izraeli.
2006-07 Wave 2: Česká republika, Irsko a Polsko se připojily k SHARE.
2008-09 SHARELIFE (Wave 3): SHARELIFE shromažďuje podrobná retrospektivní data o životní historii.

2010-2011 Wave 4: SHARE se bude rozšiřovat na všechny členské země EU, přistupuje Estonsko, Maďarsko, Lucembursko a Portugalsko.

2012-2013 Wave 5: všechny předcházející země, připravuje se účast Chorvatska.

2014-2015 Wave 6: všechny předcházející země plus Chorvatsko.

2016-2017 Wave 7: všechny země EU.

2018-2020 Wave 8: všechny země EU.
 

4. Jak jsou údaje shromažďovány?

Sběr dat je založen na osobním pohovoru tazatele s respondentem s použitím počítačového dotazníku (CAPI), a papírového dotazníku tzv. Drop-off. V první a druhé vlně byly také používány tzv. "vignettes" (viz. Dokumentace k datům).

 

5. Jaký druh vzorku používá SHARE?

 

Vzorek respondentů SHARE je založen na plné pravděpodobnosti (full probability sample, viz. Dokumentace k datům).

 

6. Kdo je věkově způsobilý pro vzorek SHARE?

Způsobilí jsou všechni členové domácnosti ve věku 50 a více let, plus jejich manželé, bez ohledu na jejich věk.

 

7. Dotazník SHARE

 

Dotazníky SHARE jsou k disposici na internetu, na českých stránkách, na hlavních stránkách projektu i v národních verzích.

 

8. Jaká data existují v modulech dotazníku SHARE?

 

V dotazníku SHARE jsou tři základní moduly dat:

1. hlavní dotazník (CAPI),
2. Drop off, neboli národní písemný dotazník (a tzv. Vignettes v roce 2006-2007) a
3. generované proměnné

 

8.1 Informace v hlavním dotazníku

V hlavním dotazníku je v každé vlně několik různých modulů. Jejich přehled je na hlavních stránkách.


8.2 Co znamená "coverscreen"?

 

Rozhovor začíná tzv. coverscreen, úvodní dotazník, na který odpovídá pouze jeden člen domácnosti. Coverscreen shromažďuje základní demografické informace o všech členech v současnosti žijících v domácnosti (pohlaví, měsíc a rok narození, rodinný stav), bez ohledu na to, zda je tato osoba věkově vhodná pro hlavní dotazník nebo ne. K dispozici jsou dva úvodní dotazníky: jeden na úrovni domácnosti (CV_H) a jeden na individuální úrovni (CV_R) pro každou jednotlivou osobu v této domácnosti.

 

8.3 Co je to "síla stisku" (GS)?

Tento typ měření fyzikálních zahrnuje záznam respondentova maximálního stisku

pomocí dynamometru.

 

8.4 Co je "rychlost chůze" (WS)?

Rychlost chůze je druh fyzikálního měření. Respondent je požádán, aby přešel určitou vzdálenost. Měří se čas potřebný k dokončení této činnosti.

 

8.5 Jaké informace jsou obsaženy v modulu pozorování tazatele?


Tento modul se týká pozorování během rozhovoru a je zodpovězen tazatele po pohovoru. Tyto otázky jsou důležité pro pochopení okolností rozhovoru.

 

8.6 Co je to "Drop off " dotazník?

Hlavní rozhovor je ukončen papírovým dotazníkem, tzv. Drop-off. Tento dotazník zahrnuje další otázky týkající se duševního i fyzického zdraví, zdravotní péče a sociálních sítí. Od roku 2010 může mít každá země v Drop-offu své vlastní otázky. V České republice to jsou např. otázky na životní osudy lidí během 2. světové války a komunismu. Od  roku 2011 poskytuje tým projektu SHARE v ČR prostor pro otázky externích výzkumníků. Projekt SHARE jim tak dává prostor pro jejich výzkumná témata, přístup k mikrodatům napojeným na mezinárodní data a zapojení do činnosti velké vědecké infrastruktury. Zájemci, zejména začínající výzkumníci a studenti nechť kontaktují koordinátora projektu SHARE v ČR.

 

8.7 Co jsou to "vignettes"?

Vignettes jsou speciální papírový dotazník, umožňující srovnání subjektivních odpovědí napříč respondenty a zeměmi s různými kulturami. Byl zodpovídán ve vlně 2006-2007.

Dva druhy dotazníků byly náhodně rozděleny mezi respondenty typu A a typu B. Ty se liší, pokud jde o otázku, pořadí a pohlaví respondentů.

 

8.8 Jaké vytvořené proměnné jsou k dispozici?

Datové soubory SHARE obsahuje různé vytvořené proměnné, které jsou popsány v datových dokumentacích. Vytvořené proměnné se vztahují k vzdělávání (ISCED kódování), zdravotnictví, bydlení a regionální informace (NUTS), zaměstnání a odvětví (OKEČ ISCO88 a kódování) a sociální podpoře a složení domácnosti. Kromě toho poskytuje SHARE váhy (podrobnosti viz: SHARE_Release_Guides) a vytvořené finanční proměnné v imputačních souborech (viz otázka 8.9).

8.9 Jaké imputované proměnné jsou k dispozici?

Imputační procedury byly opakovány pětkrát za účelem lepšího odhadu hodnot proměnných. Tyto hodnoty jsou potřebné při chybějících informacích, zejména proměnných ve finančních otázkách (např. příjmy). Všech pět datových souborů je k disposici a součástí souborů dat. Mohou být identifikovány pomocí proměnné "implicat".

 

9. Proč existují různé typy respondentů?


SHARE CAPI Hlavní dotazník je navržen takovým způsobem, že ne každý člen domácnosti musí odpovídat každý modul CAPI (viz tabulka 1).

9.1 Kdo je respondent o finančních otázkách?

Finanční respondent je identifikován otázkami CM002 a CM003 na začátku Demografického modulu (DN). Finanční respondent odpovídá zejména na moduly FT (finance) a AS (majetek). V jednočlenných domácnostech respondent odpovídá na všechny moduly, včetně finančních. Ve vícečlenných domácnostech může být různý počet finančních respondentů: respondenti žijící bez partnera jsou vždy finančními respondenty. Věkově vhodné páry, tj. manželé a partneři, se mohou rozhodnout v otázce CM002, že budou odpovídat na otázky o svých financích odděleně (toto proměnná "finsep"). Je také možné, že pouze jeden z manželů odpovídá na finanční otázky. V tomto případě je jeden z nich označen jako finanční respondent pro pár v otázce CM003. Toto je indikováno proměnnou "dumfinr" v úvodním dotazníku (coverscreen CV_R).

 
9.2 Kdo je respondentem za domácnost?

Respondent je vybrán v CV038 odpovědět jménem celé domácnosti všechny otázky týkající se domácnosti (např. moduly HO, HH, CO). Respondent je indikována proměnnou "dumhhr" v úvodním dotazníku (coverscreen CV_R).


9.3 Kdo je respondentem za rodinné otázky?

Respondent za rodinné otázky odpovídá na otázky modulu CH a první části modulu SP (SP001 až SP017). Jsou označeny proměnnou "dumfamr". Je vybrán v chronologickém pořadí rozhovorů v domácnosti: první rozhovor je učiněn s respondentem za rodinu v úvodním dotazníku (coverscreen CV_R).

 

10. Jsou dovoleny rozhovory se zástupcem (proxy interview)?

Rozhovory se zástupcem (proxy interview) jsou provedeny v případě fyzických nebo kognitivních omezení respondenta. Rozhovor pomocí zástupce nejsou povoleny např. v modulech: kognitivní funkce (CF), duševní zdraví (MH, částečně), síla stisku (GS), rychlost chůze (WS), aktivity (AC) a očekávání (EX). Každý datový modul obsahuje proměnnou, která udává, kdo odpověděl na otázky v příslušném modulu.

11. Jak mohu sloučit soubory dat?

Chcete-li sloučit data vždy používat uniktátní identifikaci jednotlivců podle proměnné mergeid.

Datové sady z hlavního rozhovoru CAPI mají mají také identifikátory pro jednotlivce (respid) i domácnosti (hhid)


 
12. Jak jsou tvořeny názvy proměnných (konvence pojmenování)?


12.1 Co je obecné pojmenování formátu?

Obecně platí, že názvy proměnných v hlavním rozhovoru mají následující formát:
MMXXX_YY

MM identifikátor modulu, např. DN
XXX otázka číslo, např. 001
_ Oddělující znak, pro dummy proměnné (otázka 12.2) je nahrazen znakem 'd'
YY nepovinná číslice(čísla) pro kategorii nebo smyčky v otázkách; v případě dvou číslic znamená první z nich 'vnější smyčku' a druhá odkazuje se na 'vnitřní smyčku'. Jestliže smyčka přesahuje 9 a je jen jeden znak k dispozici, číslování pokračuje s (= 10), b (= 11) atd.

Formát se mírně liší v případě proměnných označujících částky v eurech (otázka 13) nebo proměnné z odpovědí pomocí nabízených hodnot (unfolding brackets, otázka 14).


12.2 Jak jsou pojmenované dummy proměnné?

Odpovědi na všechny otázky, které umožňují více odpovědi mají jako konečné údaje dummy proměnné. Např. Otázka BR005 ("Co kouříte nebo co jste kouřil/a ") má tři kategorie odpovědi:

1. Cigarety
2. Fajfka
3. Doutníky nebo doutníčky

Datový soubor obsahuje tři dummy proměnné: BR005d1, BR005d2 a BR005d3 odpovídající třem kategoriím. Hodnota "1" znamená, že respondent vybral konkrétní kategorii/odpověď, v případě "0" respondent nevybral konkrétní kategorii/odpověď.

V případě, že respondent odpoví "Nic z uvedeného", "Nevím" nebo "Odmítám odpovědět", pojmenování dummy proměnných má následující strukturu:

MMXXXdno "Nic z uvedeného" MMXXXdrf "Odmítnutí" MMXXXddk "Nevím"

V případě, že otázka vyžaduje smyčku (loop), druhá číslice od konce udává číslo smyčky (#), poslední písmeno značí odpověď v kategoriích:
MMXXXd # n "
Nic z uvedeného" MMXXXd # r "Odmítnutí" MMXXXd # "Nevím"

13. Jak jsou uváděny peněžní částky a jak jsou srovnatelné (konverze k euru)?

Všechny odpovědi ohledně peněžních částek jsou přepočteny na eura. Pro země, které nemají euro je vybrán pevný směnný kurs. Pro země s eurem je částka v eurech nebo převedené na euro z doby, kdy země ještě nemělo euro, protože respondentům v zemích byla dána možnost, aby určili tehdejší cenu v eurech, nebo ve měně před jeho zavedením.


Formát proměnné je uvedeno výše, s výjimkou oddělujícího identifikátoru '_', jenž je nýní nahrazen 'e'. Číslice, které mohou následovat znamenají číslo smyčky.

Když respondent dává "Nevím" (DK) nebo "Odmítnutí " (RF) jako odpověď na otázku indikující finanční částku, jsou v datech tyto odpovědi kódovány:
 -9999998: Odmítnutí
 
-9999999: Nevím

Směnné kurzy jsou dokumentovány v aktuální Dokumentaci ke každé vlně na webových stránkách

 

14. Co jsou to odopovědi pomocí nabízených hodnot (unfolding brackets)?

Když respondent neví (DK), nebo odmítne (RF) odpověď na otázku o hodnotě v penězích, obvykle následuje nabídka hodnot, v kterých se možná částka může nacházet. K dispozici jsou tři počáteční body, z nichž je jeden vybrán náhodně. Všechny podrobnosti o sekvenci nabízených hodnot jsou uloženy v datovém souboru. Nicméně, ve veřejně dostupných datech je zahrnuto pouze několik (souhrnných) proměnných. Všechny sekvence jsou specifické pro každou zemi (v eurech) a vždy ukazují poslední odpověď, kde respondent skončil. Je-li DK nebo RF udáno během nabízených hodnot, je hodnota pro konečnou kategorii nastavena na DK nebo RF.

Formát shrnující nabízené hodnoty je následující:
MMXXXubY
MM je identifikátor modulu, např. HC
XXX je číslo otázky, např. 045
Y volitelný číselný údaj pro smyčku

Proměnná udávající, kde respondent nakonec skončí může mít sedm hodnot:
1. Méně než nízký počáteční bod
2. Stejný jako nízký počáteční bod
3. Mezi nízkým a středním počátečním bodem
4. Stejný jako střední počáteční bod
5. Mezi středním a vysokým počátečním bodem
6. Stejný jako vysoký počáteční bod
7. Více než vysoký počáteční bod.

Specifické hodnoty pro každou zemi jsou označeny:
MMXXXv1, MMXXXv2 a MMXXXv3
V případě smyčky, číslice pro smyčku předchází 'v1', 'v2', a 'v3'.

15. Jaké informace obsahuje proměnná "PHrandom"?

 
Existují dva druhy odpovědí na otázku o subjektivně vnímaném zdravotním stavu, které každý respondent odpovídá dvakrát (na začátku a na konci modulu PH).
Zda se jedná o výběr PH002/PH052 nebo PH003/PH053 je vybráno náhodně. Proměnná phrandom označuje, který druh je vybrán: 1 pro PH002/PH052, 2 pro PH003/PH053.

16. Jak jsou vybírány děti v otázce CH009 a CH020?

Otázky CH009 k CH020 v modulu CH o dětech jsou položeny pouze o maximálně čtyřech dětech. Pokud existují více než čtyři děti, program CAPI vybere čtyři děti takto:

1. Třídí děti ve vzestupném pořadí podle
• dospělosti (je definována jako 0 pro všechny děti ve věku 18 a více let a 1 pro všechny ostatní),
• geografické blízkosti (CH007) a
• roku narození.

2. Vybere první čtyři děti. Když jsou všechny tříděné proměnné stejné, program CAPI vybírá dítě náhodně. Proměnné "chselch1" až "chselch4" obsahují počet dětí, které byly vybrány v rámci programu.


17. Jaký druh ovážení vzorku (weights) jsou k dispozici?

SHARE nabízí dva různé soubory ovážení vzorku:
ovážení vypočtené pouze na základě respondentů (datový soubor naleznete dle instrukcí v dokumentaci, jeho název končí *_gv_weight_resp_only)
ovážení počítáno včetně partnerů, kteří neodpověděli dotazník (non-responding partners, datový soubor naleznete dle instrukcí v dokumentaci, jeho název končí *_imputations)

SHARE zahrnuje tři různé typy
ovážení:
1. ovážení designované,
2. kalibrovaných ovážení domácností
3. kalibrované ovážení individuální.

V zemích se vzorky nabízejících vignettes každé ovážení existuje ve třech variantách:
1. pro hlavní vzorek,
2. pro vzorek vignettes a
3. pro oba tyto vzorky dohromady. 

SHARE nabízí váhy pro každou vlnu (cross-section) a pro panelový vzorek (longitudinal weights).


Proměnná samptype určuje, ke kterému vzorku domácnost patří. Další podrobnosti jsou uvedeny v dokumentaci.

 

18. Jak mám používat ovážení vzorku?

Vhodný druh ovážení závisí na  výzkumné otázce. Prosíme prostudujte si dokumentaci ke každé vlně sběru dat. V souborech jsou vytvořeny váhy pro každou vlnu i pro panelový vzorek.

 

18.1 Který ovážení mám použít?

Pro většinu účelů kalibrované ovážení. Ve většině zemí máme kalibrované ovážení vůči národní populaci podle věku a pohlaví a regionu NUT1. Prosíme prostudujte si dokumentaci ke každé vlně sběru dat. V souborech jsou vytvořeny váhy pro každou vlnu i pro panelový vzorek.

 

18.2 Proč potřebuji designované ovážení?


Pokud byste chtěli udělat svoji vlastní kalibraci, potřebujete designované ovážení  (viz dokumentace).

 

18.3 Kdy mám použít ovážení pro domácnost, kdy pro jednotlivce?

Ovážení domácností je užitečné pro vědecké otázky používající populaci domácností, ovážení jednotlivců pro otázky používající populaci jednotlivců  (viz dokumentace).


18.4 Proč jsou některé ovážení chybí?

Data mohou být o partnerech mladších 50ti let. Jiná data potřebné pro kalibraci mohou chybět (viz dokumentace).