E-learning 2. Analýza dat 2.1. Obecný průběh analýzy 2.1.2. Porovnávání skupin (vyhledávání rozdílů mezi skupinami)

Většina genomických/proteomických experimentů je ve své povaze komparativní. Jinými slovy, když provádíme takový experiment, je našim cílem porovnat geny/proteiny v různých situacích, abychom odhalili, které z nich jsou aktivní/přítomné za různých podímnek/skupin. Tomu se říká porovnávání skupin. Nejjednodušší a nejběžnější případ porovnání skupin je porovnat geny/proteiny mezi dvěma různými skupinami. Například, můžeme chtít znát, které geny jsou aktivní ve skupině pacientů, kteří trpí konkrétní nemocí, ve srovnání se skupinou kontrolních pacientů. Nebo můžeme mikročipový experiment vést ke studiu odlišností v proteinové expresi konkrétního bakteriálního druhu kultivovaného v různých podmínkách, například aerobní versus semi-aerobní podmínky. Jiný experiment může mít za cíl srovnat profily genové exprese tumorových vzorků v čase diagnózy a progrese.
     Jak již bylo zmíněno, nejjednodušší případ srovnání je porovnat dvě skupiny, ale porovnávat tři a více skupin již obvyklé není. Můžeme například porovnat genovou expresi lymfatických buněk ze tří nebo více druhů lymfomu. Nebo si představme jinou situaci, pokud máme skupinu pacientů se stejnou diagnózou rozdělenou do dvou podskupin podle jejich léčby a skupinu kontrolních pacientů, pak můžeme porovnat jejich odezvu (odpověď) s ohledem na kontrolní skupinu.
     Ale jak lze všechna tato porovnání provést? Nejjednodušší způsob, jak nalézt odlišnosti mezi zkoumanými skupinami, je porovnat expresi každého genu napříč všemi skupinami.

Obecně existují tři přístupy, které mohou tyto odlišnosti odhalit. První je založen na výpočtu velikosti účinku, druhý na testování statistické hypotézy a třetí zahrnuje regresní strategie. Výpočet velikosti účinku je nejjednodušší přístup a nevyžaduje žádné speciální statistické nástroje. Nicméně, v tomto případe schází informace o věrohodnosti expresních změn. Oproti tomu testování statistických hypotéz a regresní strategie věrohodnost výsledku počítají. Volba mezi těmito dvěma strategiemi záleží na skutečnosti, zda si přejeme prozkoumat účinek působící na rozdíly mezi skupinami více než jedné proměnné. Analýza s jednou proměnnou může být úspěšně provedena testováním statistických hypotéz. Pro analýzu více proměnných bychom měli aplikovat regresní metody, dokonce i když může být provedena jednoproměnná lineární regrese a je rovnocenná s t-testem (popisovaným níže).

     V následujících částech představíme velikosti účinku, principy testování statistických hypotéz a vybrané regresní strategie pro porovnání a odhalení rozdílů mezi studovanými skupinami.