(NMST 551) Statistický projektový seminář (ZS 2025/26)
Čt: 09:00 - 10:30 | @K9 | (Zdeněk Hlávka & Matúš Maciak)
Všeobecné informácie
Hlavným cieľom Statistického projektového semináru -- NMST551 je získať prax v štatistickej analýze reálných dat a podrobnom vypracovaní záverečnej výskumnej správy -- t.j. príprava odborného textu s výsledkami analýzy, korektnou interpretáciou výsledkov a dobre štrukturovaného komplexného vedeckého článku (PDF dokument). Počas semestra budú študenti pracovať na zadanom probléme (t.j., jeden konkrétny datový súbor), ktorý má za cieľ odpovedať na explicitne formulované vedecké/odborné hypotézy/otázky.
V priebehu semestra je postupne nutné spracovať a pripraviť data, vypracovať exploratívnu analýzu, aplikovať vhodný štatistický model (diskutovať rôzne možnosti štatistickej analýzy a voľby pravdepodobnostného/stochastického modelu), implementovať jednotlivé metódy v programe R a vypracovať záverečnú správu s výsledkami analýzy a ich interpretáciou (so všetkými potrebnými formálnymi náležitosťami, ktoré sú neoddeliteľnou súčasťou kvalitného vedeckého článku).
Na tejto stránke bude postupne zverejňovaný a priebežne aktualizovaný zoznam úloh, ktoré bude nutné v jednotlivých týždňoch vypracovať.
Na konci semestra každý študent odovzdá finálny článok (PDF súbor) -- odborný vedecký text (resp. výskumnú správu), vypracovaný podľa pokynov zadávaných v priebehu semetra. Súčastou získania zápočtu je aj vypracovanie stručného oponentského posudku na članok niektorého z kolegov/spolužiakov v poslednom týždni semestra.
Formát výuky
- Jednou týdně společná beseda (štvrtok, 9:00 v K10C)
- Každý týden samostatná práce dle zadání
- Postupné vypracování písemné zprávy
- Na závěr vzájemná oponentura výzkumných zpráv
Zadanie projektu: Agresívne interakcie medzi sumcami
a ich vzťah k rôznym fyziologickým charakteristikám
- Podrobný popis experimentu a expertných hypotéz: zadanie projektu
- Podkladové datové súbory a dokumentácia: v systéme SIS (po prihlásení)
- Ďalšie podrobnosti: Počas prvého semináru
(t.j., vo štvrtok, 02.10.2025, od 09:00, v posluchárni K10C)
Sylabus a úlohy pre samostatnú prácu
- Úkol č.1 | Due to 09/10/25
Samostatne si preštudovať povinnú a doporučenú literatúru uvedenú nižšie (hlavne prvé štyri zdroje). Zo zoznamu odborných článkov uvedenných v sekcii ``Názorné ukážky'' si vybrať jeden konkrétny článok, ktorý je nutné prečítať a následne kriticky zhodnotiť (explicitne sa zamerať na štatistické spracovanie). Nejde o posúdenie článku v zmysle všeobecných formulácii typu ``článok je hezky napsaný'', alebo ``vo formulácii anglického textu sa objavuje príliš veľa chýb'', ale hodnotenie musí byť explicitné a konkrétne -- napr. ``z uvedených intervalov spoľahlivosti nie je zrejmé, na akej hladine sú spočítané'' a pod. Preštudovať dokumentáciu k podkladovým datam a pokúsiť sa porozumieť celkovej štruktúre datových súborov.
- Úkol č.2 | Due to 16/10/25
Naštudovať štruktúru jednotlivých datových súborov a načítať datové súbory do programu R. Premyslieť a navrhnúť možnosti, ako jednotlivé súbory vzájomne propojiť -- resp. vytvoriť jeden poločný dataset (data.frame).
- Úkol č.3 | Due to 22/10/25
Na základe datových súborov vypracovať exploratívnu analýzu a to buď vo forme vhodnej tabuľky s podstatnými popisnými charakteristikami, prípadne pomocou vhodného ilustrativného obrázku (pripadne jedno aj druhé zároveň).
Výsledný PDF súbor s tabuľkou, prípadne obrázkom zaslat emailom na [hlavka,maciak]@karlin.mff.cuni.cz najneskôr v stredu, 22.10.2025.
- Úkol č.4 | Due to 29/10/25
Finalizovať tabuľku s popisnými charakteristikami pre všetky tri datove súbory (t.j., sociálno-agresívne interakcie, fyziologické parametre z krvných testov a stresové hormóny) a doplniť tabuľku vhodným ilustratívnym obrázkom (resp. obrázkami). Tabuľku aj obrázok doplniť plnohodnotným informatívnym popiskom.
Výsledný PDF súbor s tabuľkou, aj obrázkom zaslat emailom na [hlavka,maciak]@karlin.mff.cuni.cz najneskôr v stredu, 29.10.2025.
- Úkol č.5 | Due to 05/11/25
Tabuľku s popisnými charakteristikami a obrázok doplniť o text, ktorý náleží do sekcie "Výsledky" (t.j., prvá časť výsledkov, tzv. exploratívna analýza). Test by mal explicitne odkazovať a interpretovať konkrétne hodnoty z tabuľky, prípadne z obrázku. Súčasťou textu by mala byť referencia na tabuľku aj obrázok.
Výsledný PDF súbor zaslat emailom na [hlavka,maciak]@karlin.mff.cuni.cz najneskôr v stredu, 05.11.2025.
Povinná a doporučená literatúra
- Zásady psaní výzkumných zpráv (M.Kulich)
- Ako písať vedecký článok (J.S.Dodd)
- Ako pracovať v LaTeXu s tabuľkami (L.F.Mori)
- Ako pracovať v LaTeXu s obrázkami (D.P.Carlisle)
- The Problem of Numeracy (A.S.C.Ehrenberg)
- Writing Technical Papers or Reports (A.S.C.Ehrenberg)
- The Science of Scientific Writing (G.D.Gopen & J.A.Swan)
- A Case for Simple Tables (M.A.Koschat)
- What Makes a Good Graph? (S.P.Duke)
- Online katalóg LaTeXových balíčkov a dokumentace (LaTeX)
Názorné ukážky niekoľkých (dobrých ale tiež nie ideálnych) vedeckých článkov
- Analysis of Human Brain Structures
- Neuroanatomical norms in the UK Biobank
- Wounding of Whale Calves by Kelp Gulls
- Prediction of Post-Operative Liver Dysfunction
- Predictors of Career Success
- Native American Ancestry, Body Mass Index and Diabetes Risk
Na záver
The fundamental purpose of scientific discourse is not the mere presentation of information and thought, but rather its actual communication. It does not matter how pleased an author might be to have converted all the right data into sentences and paragraphs; it matters only whether a large majority of the reading audience accurately perceives what the author had in mind.
George Gopen & Judith Swan
Disclaimer
Vrámci platných Pravidiel pro organizaci studia na Matematicko-fyzikální fakultě Univerzity Karlovy (ze dne 23.června, 2023), sa vzhľadom k Čl. 8, dds.2 týchto pravidiel týmto vyhlasuje, že povaha předmětu vylučuje právo studenta na jeden řádny a dva opravné termíny pro získaní zápočtu. Získaní zápočtu sa riadi výhradne pravidlami uvedenými vyššiena tejto web stránke (a tiež na stránke predmetu v SIS).
