Bayesiánský hon na bimodálně rozložené znaky u člověka
Thesis title in Czech: | Bayesiánský hon na bimodálně rozložené znaky u člověka |
---|---|
Thesis title in English: | Bayesian hunt for bimodal distributions in human traits |
English key words: | bimodal distribution, mixture distributiona, Bayesian statistics, information criteria, replication |
Academic year of topic announcement: | 2024/2025 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Department of Philosophy and History of Science (31-107) |
Supervisor: | Mgr. Petr Tureček, Ph.D. |
Author: | Bc. Petr Varga - assigned and confirmed by the Study Dept. |
Date of registration: | 27.10.2024 |
Date of assignment: | 27.10.2024 |
Confirmed by Study dept. on: | 16.01.2025 |
References |
Akre, K. L., & Johnsen, S. (2014). Psychophysics and the evolution of behavior. Trends in ecology & evolution, 29(5), 291-300. Archer, J. (2019). The reality and evolutionary significance of human psychological sex differences. Biological Reviews, 94(4), 1381–1415. Kowal, M., Sorokowski, P., Pisanski, K., Valentova, J. V., Varella, M. A., Frederick, D. A., ... & Mišetić, K. (2022). Predictors of enhancing human physical attractiveness: Data from 93 countries. Evolution and Human Behavior, 43(6), 455-474. Lynn, S. K., & Barrett, L. F. (2014). “Utilizing” signal detection theory. Psychological science, 25(9), 1663-1673. Schilling, M. F., Watkins, A. E., & Watkins, W. (2002). Is Human Height Bimodal? The American Statistician, 56(3), 223–229. Tureček, P., & Jelínek, J. (2017). Project Cicero: Semantic pareidolia introduced. 17th Annual Gatherings in Biosemiotics, 94–95. Zietsch, B. P. (2024). Genomic findings and their implications for the evolutionary social sciences. Evolution and Human Behavior, 45(4), 106596. |
Preliminary scope of work |
Bimodální rozložení, tedy rozložení, jejichž distribuční funkci charakterizuje přítomnost dvou podobně vysokých vrcholů, předznamenávají velmi silné statistické efekty – aby se rozložení v grafu promítlo bimodálně, vzdálenost skupin musí přesahovat Cohenovo d = 2,0 (Schilling et al., 2002). Obecně však bývá nejvhodnější je charakterizovat jako smíšená rozložení (mixture distribution), skládající se ze dvou unimodálních a jednoho binomického. Nastavovat Cohenovo d > 2,0 jako kritérium bimodality, je problematické, jelikož Cohenovo d lze počítat pouze pro předem známé skupiny (např. mezipohlavní rozdíly; Archer, 2019). Pokud si data nevizualizujeme a spoléháme na předdefinované testy, či korelace, riskujeme, že přehlédneme i jednoznačně bimodální rozložení. Bezmyšlenkovité používání standardních metod má potenciál vysvětlit, proč se podaří v literatuře z oblastí evoluční psychologie narazit na bimodální rozložení jen vzácně – vědci odpublikují slabý efekt pohlaví či jiné a-priori definované distinkce, zatímco neočekávané bimodální rozložení jim unikne. Dalším důvodem však může být evoluční nestabilita alel s velkým účinkem. Většina intenzivně studovaných znaků, ve kterých se lidé liší, je determinována obrovským počtem lokusů pod negativní selekcí a jejich variabilita odpovídá rovnováze ustavené mutacemi, selekcí a driftem (Zietsch, 2024). Spojité unimodální predispozice však mohou vést ke kolapsu behaviorálních projevů nebo jejich psychologického podloží do dvou protipólů, jak naznačuje Signal Detection nebo Error Management theory (Lynn & Barret, 2014, Akre & Johnsen 2014, Tureček & Jelínek, 2017, Lynn & Barret, 2014). Cílem práce je navrhnout metodu hledání bimodálních rozložení nepřecitlivělou k velikosti vzorku (jako např. Hartigan’s dip test), a následně detekovat kandidátská bimodální rozložení alespoň v těchto třech datasetech: World Value Survey (velký, známý, všemi používaný dataset), Pokusní králíci (monumentální monokulturní dataset, ke kterému máme exkluzivní přístup) a Dataset o úpravě zevnějšku a doprovodných atraktivitu zvyšujících činnostech z Kowal et al. 2022 (kde je silné teoreticky podložené podezření na přítomnost bimodality, o zevnějšek se danému jedinci vyplatí pečovat poměrně dost nebo skoro vůbec, ale ne tak nějak napůl). Případné pozitivní výsledky se práce pokusí replikovat prostřednictvím vlastního dotazníkového šetření. |
Preliminary scope of work in English |
Bimodal distributions, characterized by the presence of two similarly high peaks, suggest strong statistical effects; for a distribution to appear bimodal in a graph, the group distance must exceed Cohen’s d = 2.0 (Schilling et al., 2002). However, it is generally best to characterize these as mixture distributions, consisting of two unimodal and one binomial distribution. Setting Cohen’s d > 2.0 as a criterion for bimodality is problematic since Cohen’s d can only be calculated for predefined groups (by, e.g., sex; Archer, 2019). If we do not visualize the data and rely on predefined tests or correlations, we risk overlooking even clearly bimodal distributions. The unreflective use of standard methods may explain why bimodal distributions are rarely encountered in the literature within fields like evolutionary psychology. Researchers may publish weak sex effects or other a priori defined distinctions while missing unexpected bimodal distributions. Another reason could be the evolutionary instability of alleles with large effects. Most intensively studied traits in which humans vary are determined by a large number of loci under negative selection, and their variability corresponds to the mutation-selection-drift balance (Zietsch, 2024). Continuous unimodal predispositions may, however, lead to the collapse of behavioral expressions or their psychological underpinnings into two poles, as suggested by Signal Detection or Error Management Theory (Lynn & Barrett, 2014; Akre & Johnsen, 2014; Tureček & Jelínek, 2017). The aim of this thesis is to propose a method for identifying bimodal distributions that is not overly sensitive to sample size (like Hartigan's dip test) and to subsequently detect candidate bimodal distributions in at least the following three datasets: the World Value Survey (a large, well-known, widely used dataset), "Pokusní králíci" (or “Czech labrabbits” a monumental monocultural dataset to which we have exclusive access), and a dataset on grooming and attractiveness-enhancing activities from Kowal et al., 2022 (where there is strong theoretical suspicion of bimodality, as grooming is either considerably worthwhile for an individual or hardly at all, with little in between). The study will attempt to replicate any positive findings through own subsequent survey research. |