7. Néhány statisztikai paradoxon

Ebben a fejezetben néhány egyszerű statisztikai érdekességet és paradoxont mutatunk be.

7.1. feladat:

Egy erdőgazdaság elhatározza, hogy az erdőből fenyőfákat vágnak ki. A környezetvédelmi tiltakozások hatására a gazdaság vezetője igyekszik megnyugtatni az érdekelteket: az erdő 99%-a fenyőfákból áll, a favágás után pedig az erdő 98%-a még mindig fenyő lesz. Az erdő hány százalékát akarják kivágni?

Eredmény:

50 %.

7.2. feladat:

Egy politikai rendezvényre 140 ember jött el. Az alábbi táblázat a résztvevők életkorát mutatja be nagyság szerint rendezve:

15

15

16

16

16

17

17

17

17

18

18

18

18

18

19

19

19

19

19

19

20

20

20

20

20

20

21

21

21

21

21

22

22

22

22

23

23

23

24

24

25

25

25

26

26

26

27

27

28

30

32

33

35

37

38

38

39

39

39

39

40

40

40

40

41

41

41

41

41

42

42

42

42

42

42

42

42

42

42

43

43

43

43

43

44

44

44

44

44

44

45

45

45

45

45

46

46

46

46

46

46

47

47

47

48

48

48

48

49

49

49

49

50

50

50

52

52

52

52

53

53

54

54

54

56

56

57

58

58

59

60

60

61

64

65

67

67

68

68

69

Próbáljuk megmutatni - alkalmas grafikonválasztással, a tényeket szigorúan megőrizve - hogy:
a) "A fiatalok nem érdeklődnek a politika iránt."
b) "Mindenekelőtt a fiatalokat érdekli a politika."
c) "A középkorúakat érdekli legkevésbé a politika."

Megoldások:


a) Négy korcsoportra osztjuk a résztvevőket:
I: 15 - 19 év közöttiek: számuk 20 fő;
II: 20 - 29 év közöttiek: számuk 29 fő;
III: 30 - 44 év közöttiek: számuk 41 fő;
IV: 45 - 69 év közöttiek: számuk 50 fő.

Ábrázoljuk pl. oszlopdiagrammal az egyes korcsoporthoz tartozó résztvevők számát! A kapott grafikon jellege:

b) Vegyük figyelembe az egyes korcsoportok időbeli szélességét, legyen pl. ezzel arányos az oszlopdiagramok szélessége! Ekkor az (életkor intervallum)/(szavazók száma) értéket ábrázolhatjuk korcsoportonként.

c) Legyen a három korcsoport pl. az alábbi, ekkor az a) grafikon módosul.
I: 15 - 24 év közöttiek: számuk 40 fő;
II: 25 - 39 év közöttiek: számuk 20 fő;
III: 40 - 69 év közöttiek: számuk 80 fő.

Megjegyzés:

Vizsgáljuk meg az alábbi táblázatot, mely a résztvevők számát mutatja  a település kormegoszlása tükrében.

korcsoport:

15 - 19 év

20 - 29 év

30 - 44 év

45 - 69 év

lakosok száma:

359

527

718

878

ebből ott volt:

20

30

40

50

százalékban:

5,6%

5,7%

5,6%

5,7%

Ebből a táblázatból úgy tűnik, hogy minden korosztály egyformán érdeklődik a politika iránt.

7.3. feladat:

Férfiakon és nőkön kipróbáltak egy új gyógyszert. Kérdés, hogy a kezelés hatásos vagy nem. Találunk-e valami furcsaságot a dokumentált táblázatban?

 

FÉRFIAK

NŐK

ÖSSZESEN

 

 

 

 

 

kezelt

nem kezelt

kezelt

nem kezelt

kezelt

nem kezelt

 

 

 

 

 

 

 

gyógyult

700

80

150

400

850

480

nem gyógyult

800

130

70

280

870

410

összesen

1500

210

220

680

1720

890

Megoldás:

A kezelés a férfiak körében sikeres volt: a kezelt férfiak 46,7%-a gyógyult meg, míg a nem kezeltek között ez az arány 38,1%.
A kezelés a nők körében is sikeres volt: a két arányszám 68,2% és 58,8%.
Ami viszont megdöbbentő: ha az adatokat összesítjük, kiderül, hogy a kezelt emberek 49,4%, míg a nem kezeltek 53,9%-a gyógyult meg.

Vagyis: ez a gyógyszer hatásos a férfiak és a nők számára is, de káros az emberek számára.

Megjegyzések:

1. Ha az Olvasó lenne a gyártó gyógyszergyár igazgatója, hogyan döntene: piacra dobja az új gyógyszert vagy nem?

2. A példánk azt mutatja, hogy óvatosan kell bánni az „adatok egységesítésével”. (Elvileg csak az azonos szórású sokaságokat lehetne összevonni, de a gyakorlatban ilyenek nem nagyon vannak.) De vegyük észre, hogy az eljárás fordítva is problematikus! Ha egy politikusnak jó statisztikusa van, bizony előfordulhat, hogy egy negatív eredményű adathalmazt szét tud bontani pozitív eredményű részekre, főnöke nagy-nagy megelégedésére.