E-learning 2. Analýza dat 2.1. Obecný průběh analýzy 2.1.2. Porovnávání skupin (vyhledávání rozdílů mezi skupinami) 2.1.2.1. Výpočet velikostí účinku

Výpočet velikostí účinku vysvětlíme na příkladu analýzy genové exprese, ale může být zobecněn na jakýkoli typ dat.

Nejjednodušší způsob, jak změřit rozdíly mezi dvěma skupinami je zodpovědět si otázku: “Kolikrát je exprese určitého genu větší ve skupině A ve srovnání se skupinou B?” . Odpověď získáme, když vypočítáme průměr genové exprese ve skupině A, průměr genové exprese ve skupině B, a pak průměr skupiny B vydělíme průměrem skupiny A. Tomuto se říká fold change (FCH).

Fold change je míra, která náleží skupině měření zvané míry velikosti účinku . Velikost účinku je míra síly vztahu mezi dvěma proměnnými a fold change je samozřejmě míra mezi genovou expresí a skupinou. Například, pokud průměrná exprese genu je 4 ve skupině A a 8 ve skupině B, pak je hodnota fold change rovna 2 a můžeme říct, že exprese genu ve skupině B je dvakrát větší než ve skupině A.

Nejčastěji se jako mezní hodnota pro biologicky relevantní rozdíl v expresi používá 2-fold change. V tomto případě je 2-fold change hranice použita k selekci odlišně exprimovaných genů mezi skupinami. Všimněte si, že 2-fold change platí v obou směrech (když porovnáváme skupinu A s B, obě hodnoty FCH >= 2 nebo FCH<= ½ jsou významné).


Nicméně, hodnocení biologické relevance nebo ne-relevance není z následujících důvodů zcela jasné:

  • Některé geny s relativně slabými účinky mohou mít v koordinaci s jinými geny podstatně velký vliv.
  • Dále hodnota FCH může být, podle kvality vzorku použitého pro extrakci mRNA, systematicky zmenšena směrem dolů k nule. Kvalita vzorku odráží heterogenitu buněk ve zkoumaném vzorku a metodu přípravy/uchování vzorku. Nádorový vzorek je například téměř vždy směsí nádorových a normálních buněk. Existuje také heterogenita mezi samotnými nádorovými buňkami, protože různé části nádoru můžou mít odlišná stádia vývoje. Hodnoty FCH mohou být kvůli tomuto zdroji proměnlivosti zkresleny. Jinou záležitostí je příprava/uchování vzorku. Čerstvě zmrazené vzorky mají jistě vyšší kvalitu než formalínem fixované, parafínem zapuštěné vzorky. Nakonec RNA obecně degraduje rychleji, což může mít za následek menší specifickou hybridizaci, a proto horší intenzity signálu a menší hodnoty FCH.
  • Závěrem, prostým filtrováním podle změny v expresi se ztrácí informace o věrohodnosti výsledku. Jak víme, že velikost účinku je skutečná a není jen způsobena chybami v experimentu nebo náhodným výběrem vyšších hodnot genové exprese v jedné skupině? Odpovědí je určit statistickou významnost, která může být  odhadnuta pouze tehdy, jestliže během experimentu byla provedena opakovaná měření stejného genu (ve smyslu vícenásobných vzorků). K určení významnosti změn genové exprese mezi jednou nebo více skupinami může být použito testování statistické hypotézy nebo regresní techniky.