Bohemian genetic genealogy: November 2017

Wednesday, November 29, 2017

Genetická genealogie pro začátečníky - Genetika a Příjmení - část 1

Genetika a příjmení - část 1 - základy + hluboká minulost

Co jiného bych si mohl vybrat pro svůj první blog pro genetické genealogy začátečníky, než úspěšný český projekt "Genetika a Příjmení".

Že jste o něm ještě neslyšeli? Tak hybaj na stránky projektu. Tam se dovíte, že se jedná o projekt pro české (a hlavně prý moravské :) muže. Díky podpoře z grantů projekt umožňuje nechat si (na základě dostatečně zpracovaného rodokmenu) udělat zdarma základní STR test vašeho chromozomu Y. Tzn. nahlédnout trošku na kořeny vaší otcovské linie (otec otce otce otce otce ...).

Biologické a chemické stránce se budeme podrobněji věnovat v některém z dalších dílů, ale troška základů pro začátečníky. Chromozom Y je tzv. pohlavní chromozom, a má ho každý muž právě jednou (druhý pohlavní chromozom je X, který mají muži jednou, a ženy dvakrát).
Chromozom Y je specialní tím, že se jen s minimalními změnami (mutacemi) v každé generaci dědí z otce na syna.
A v době, kdy číst DNA nebylo vůbec jednoduché přišli vědci na zajímavý způsob jak změřit jak jsou si dva chromozomy Y vzdálené / blízké. Zjistili, že chromozom Y je protkán úseky, ve kterých se krátké kousky DNA (např. TCTA, ATT ap.) několikrát opakují - v angličtině "short tandem repeats", STRs. Takže když se podiváme na tyhle opakující se úseky, můžeme chromozom Y popsat. Např. se podíváme na dvanáct různých míst Y, 12 opakujících se kusů DNA - tzv. STR12.
Tím získáme sekvenci jako [14, 24, 15, 11, 14, 15, 11, 13, 13, 13, 11, 31].

Muže pak můžeme pomocí těchto počtů opakování STR porovnávat. Čím podobnější čísla, tím větší příbuznost.

A kolik těchhle STR čísílek člověk dostane z GAPu? 23. A kolik to teda vlastně je, dvacet tři? Inu, docela málo, člověku budou lehce vycházet jako genetické shody lidé, se kterými má společné předky třeba 2000 let v minulosti. Na tom není samo o sobě nic špatného, jen je třeba si to uvědomit, a s výsledky podle toho pracovat.

Tím jsme se oklikou dostali k tomu, co může člověk od výsledků čekat.

Jsou vlastně dvě hlavní kategorie.

1. Dávná minulost vaší otcovské linie. Díky tomu, jak se chromozom Y předává beze změn z otce na syna, je skvělou sondou do dávné minulosti vaší otcovské větve.
Umožňuje vám zjistit, kde vaši otcovští předci byli před 20ti, 10ti a pravděpodobně 2ma tisíci lety. (Ty 2 tisíce už vyžadují trochu štěstí a trochu práce).

Již docela dávno si lidé všimli, že ty STR čísla roztřiďují lidskou populaci do podobných tříd, tzv. "haploskupiny", nebo také haplogrup. Haplogrupy dostaly písmenka abecedy, kde úplně ta první, nejstarší, větev tzv. Y-chromozomálního Adama (praotce nás všech homo sapiens sapiens po otcovské linii) se jmenuje A. Velmi častá je skupina R, u nás pak druhá je skupina I.

Tyhle haploskupiny vlastně již tvoří strom (takový superhrubý rodokmen) našich otcovských linií:

(courtesy wikitree.com)

Tohle písmenko, pravděpodobně i s malým ocáskem dalších čísel a písmenek dostanete právě z GAP.
Tak hlavně, co ten ocásek? Je to vlastně docela jednoduché.
Písmenko vaší haplogrupy je první dělení. Představte si zjednodušeně, že to je váš prapra...prapraděda po otcovské linii.
Za písmenkem vždy následuje číslo, a za číslem zase písmenko.
Co tedy to první číslíčko znamená? Je to označení pořadí vaší podvětve, tedy zjednodušeně první syn (s unikátní mutací) ma číslo 1, třeba R1, druhý číslo 2, tj. R2, atd.
A v dalším kroku se zase jedná o větvení stromu (pořadí potomka), jen použijeme písmena, tj. R1a, R1b, atd.
Problém téhle notace je v tom, že se musela pořád předělávat, jak s dálším testováním přibývaly další větve. Takže se mohlo stát, že po chvíli se vaše I2b změnilo na I2a2 a pak na I2a2a atp.
Proto se dnes téměř bez výjimky přistupuje na notaci Jméno_haploskupiny-Jméno_SNP, např. I-M423.
A co je to teda to SNP? Česky čteme "snyp". SNP je "single nucleotide polymorphism" - místo v DNA, které může nabývat víc hodnot. Např. na pozici 16984211 máte třeba písmenko G nebo A. Pokud máte A, a jste právě v haplogrupě I, jste M423-pozitivní.
Pomocí těchto SNiPů se pak dá vybudovat ještě lepší strom, než pomocí STR.
Na jeden takový se můžete podívat na https://www.yfull.com/tree/.

Tak teď už snad trošku víte, co znamenají ta písmenka a čísla a můžeme se podívat na tu minulost.
Na české wikipedii je úplně strašně malinký popisek, ale je česky.

Zdaleka nejlepší místo, kam se podívat, pokud jen trošku ovládate angličtinu, nebo jste ochotni podstouput strojový překlad Googlu, je eupedia.com.
Tam naleznete velmi pěkné množství aktuálního materiálu, které by vám mělo dát do začátku rozumnou představu, kdo byli ti vaši otcovští předci zač.

Příště bychom se v části 2 podívali na tu druhou kategorii výsledků, naše Y-DNA shody. A v důsledku se pomocí nich zase vrátili k dnešní kategorii, dávné minulosti.

Pokud si chcete o GaP popovídat, neváhejte využít komentářů k blogu, nebo českých genealogických fór taby.cz a nebo klub na okoun.cz

Jo, a mimochodem, pokud se chcete GaP zúčastnit, tady je vstupní formulář: http://www.genebaze.cz/cgi-bin/gap/gap_ud.cgi

Tuesday, November 21, 2017

Cíle 2.2 roku 2017 - identifikace poloviny mých 7xpra dědy z otcovy strany

Pomalu se nám rok 2017 blíží ke konci, a já sotva napsal nějaký blog. Jak už jsem psal minule, bylo to hlavně kvůli narození našeho třetího dítka, a celkovému nedostatku času.

Jak jsem se i přesto vypořádal s vytyčenými cíli?
Se ctí můžu předvést alespoň jeden úspěch. Novou vlnu výzkumu předků mého dědy z tátovy strany - Emila Krcháka.

Na konci loňska jsem si tedy vytyčil cíl vypátrat alespoň polovinu mých 7xpra z dědovy strany.
A tady teď jsem (počet nalezených předků dědy Emila, generace na řádku):

Ač mi chybí už dva z mých 4xpra prarodičů, dokázal sem se dostat na vysněnou metu 64 7xpra. Další generace jsou bohužel zcela beznadějné...

Proč?
[- Na nějaké indexy pro takhle staré matriky rovnou zapomeňte. Zřejmé, ale velmi bolestivé.]
- Je náročné zkrotit s každou generaci dvojnasobný počet.
- Starší materiály jsou náročnější na práci. Žádné informace o rodičích, ani na svatebních záznamech, žádná čísla domů, žádná příjmení manželek...
- Neustálenost příjmení. Bohužel, příjmení nejsou ještě zcela fixována ani na přelomu 17ého a 18ého století.
- Některá příjmení jsou naopak velmi častá, a oplývá jimi klidně pětina vesnice.
- Čím hloubějí zkoumáme, tím širší množství far musíme pokrýt, a vypátrat v této době jakékoliv stěhování je obzvlášť oříšek...

Poznámka: všechen popisovaný výzkum probíhal na předtolerančních matrikách z Horňácka na actapublica, Velka nad Velickou [tehdy jen "Velká"].

Takže jak adresuju výšene uvedené problémy, abych si s nimi poradil?

Neustále si udržuju seznam aktuálních příjmení, a snažím se je zapamatovat. Prakticky to vypadá tak, že na 90% procentech obrazovky mám otevřenou matriku, a na zbylých 10ti mám úzký sloupeček s příjmeními.
Není prostě možné, procházet stejnou matriku znova a znova, a hledat při tom jen jedno, nebo pár příjmení. Projít matriku jednou (několikrát málokrát) zapisujíce rovnou všechny výskyty z celého seznamu příjmení je mnohem efektivnější.
A kolik příjmení je rozumné? Já se snažím zkoumat na jednou všechna příjmení svých 7x pra. Na táhle úrovni se už většinou trošku opakují. Takže ja jich teď mám 38 - některá neznám, některá se opakují a u některých vím, že jsou z jiné fary.
Udržuji si index všech svých předku napsaných tužkou na papíře.
Kdykoliv potřebuju, můžu se podívat na vše co vím o svých předcích na této části stromu, se všemi jejich známymi daty a místu. Zcela nepostradatelná pomůcka.
Zapisuju si každý detail.
Jenom důkladným výzkumem všech nositelů mých příjmení z celé fary dokážu odlišit jeden z mnoha páru, kde se muž i žena jmenují úplně stejně (bohužel neměli ti naši předci na křestní jména příliš fantazie). Bez čísel domů a příjmení manželek potřebujeme pomoc nepřímých informací jako jsou jména kmotrů, vztah narození dětí se smrtí matky.
Obdobně jako u stejně se jmenujících párů nám tato technika přináší schopnost propojit několik vdoveckých vdavek tak, abychom věděli, že jde o stejnou osobu.
Trpělivost.
Tohle všechno vyžaduje čas. Pokud nejste ochotni strávit 5 hodin a nezískat při tom jedinou informaci přímo o vašich předcích, tenhle postup asi není pro vás.
Začínám se svatbama.
Rozhodně nejlepší způsob je vybudovat si kvalitní základnu dospělých párů a pak je ověsit dětmi. A až úplně nakonec to doplnit o údaje o úmrtích.
Prakticky to dělám nějak takhle: první svatby pro generaci T, pak děti z generace T+1, znova svatby, z generace T+1, děti T+2, a konečně úmrtí T+2...
Ještě trochu víc trpělivosti.
A potom partneři, kamarádi, babičky a strýčkové.
Já v tomhle směru moc úspěšný nejsme, ale všechno o čem píšu krásně škáluje s počtem lidí. Takže jestli můžete, zapojte ostatní.

Hodně štěstí vašemu předtolerančnímu výzkumu. Pokud se do toho pustíte pořádně, určitě zjistíte, že nejedna informace vašich vzdálených příbuzných o vašich předcích je nepravdivá - chybní rodiče, potomci dítka, které zemřelo po 5ti dnech, ap. A to je pro mě pěkná odměna za dobře odvedenou práci.

Na druhou stranu, bez pořádného DNA výzkumu je ten papírový strom jenom jedna velká hodně nejistá hypotéza.

Monday, November 20, 2017

2017 Goal 2.2 - half of my 7th great grandparents on paternal grandfather's side identified

So 2017 is running to an end and I have barely blogged. As I explained, it was largely due to my 3rd kid and first son being born and generally time being at a premium.

So how did I fare against my goals?
Well I can report at least one success. The research of my paternal grandfather, Emil Krchak.

The goal was to identify half of my 7th great grandparents on Emil's side of the family.
And here is where I am (number of identified Emil's ancestors, generation per line):

While I am already missing two 4th great grandparents, I managed to hit the coveted 64 7th great grandparents. Unfortunately after that, the amount on known ancestors totally plummets...

Why?
[- Forget indices. Obvious, but always a tough one.]
- It is hard to keep fighting the ever increasing number of ancestors.
- The older materials are harder to work with. No parent information even on marriage records, no house numbers, no surnames for wives...
- The instability of surnames. Unfortunately, it seems the surnames are not completely stable any longer around the 17th to 18th century transition.
- There are several surnames, that cover significant portion of a village.
- The deeper we go, the more locations we need to cover, and any move is very hard to track...

Note: these are all Hornacko parish records on actapublica, i.e. Velka nad Velickou [then "Velka"] parish pre-tolerance.

So what do I do to combat the problems above?

I maintain a list of all relevant surnames, and try to memorize it well.
It is just not feasible to go through the same parish book over and over again, with one of few surnames in mind. Going through it once, or few times, with many surnames in mind is more time efficient.
So how many? I try to cover all known 7th great grandparent surnames. They start to repeat, so this makes it around 38 surnames currently (some unknown, some repeated, some known to be in a different parish).
I maintain a pen&paper ancestral index at hand.
Having a quick reference of my ancestors, with all relevant where & when is indispensable tool.
Note down every detail.
Only by diligent research of every bearer of the surname in the parish can you distinguish the many occurrences of multiple pairs with the same name of husband & wife. Without house numbers, you need to use the indirect information - names of godfathers, alignment of children being born with mother's death.
Similarly, only this can help you connect your multiple time widowed ancestor wedding information as being about the same person.
Patience.
It takes time. If you are not willing to pull 5 hours of work without obtaining a single new bit of information about your actual ancestors, this approach is not for you.
Work on the weddings first.
It is best to establish the known pairs who made it too adulthood, than decorate them with children. And only at last, fill in the details from the death records.
The best approach to timeline for me being: generation T weddings first, then generation T+1 kids, then generation T+1 weddings, then T+2 kids and last but not least generation T+2 deaths...
Some more patience.
Have partners, friends, grandmas or great uncles work with you.
Unfortunately, I did not succeed in this direction much, but clearly, all of the effort above scales well with people. Get them on board.

Best of luck to anyone, who decides to go for it. You definitely find matches with the wrong parents, descendants of a kid who died at 5 days of age, etc. when you compare your well researched surname results to less systematic research of some cousins. And that feels good.

On the other hand, without the DNA to back the tree up, it is all just a shaky hypothesis.

Monday, November 6, 2017

Vít, nový Krchák na světě!

Srdečné pozdravy všem čtenářům. Přijměte prosím mou omluvu za dlouho odmlku. Zmiňoval jsem se už, že vést dvojjazyčný blog je dvakrát víc práce než jednojazyčný blog?
A propos, už jsem zmiňoval, že tři děcka jsou vlastně jako dvě děcka, až na to, že na koníčky máte teda rozhodně míň času než dřív?

Nu což, vzhůru do práce. Nejste tady, aby jste poslouchali, jak si stěžuju.

Takže Vít. Vítek Krchák. Třetí v této (~2010) generaci Českých Krcháků. Po pravdě nic moc. Zdá se, že Krcháci v Čechách do pár generací vymřou.

A kdo tedy jsme? My chlapi, Krcháci? Z Horňácka, jihovýchodní Moravy, kraje chudého, ale na tradice bohatého? Mé první nakouknutí na naši otcovskou linii se odehrálo pomocí autozomálního testu u 23andMe, verze 4. Ten obsahoval několik tisíc SNiPů na Y chromozomu.

Podle jejich starého způsobu značení jsem byl I2b*. Nicméně trošká výzkumu proti Y stromu na ISOGG ukázala, že jsem ve skutečnosti větev I-M423, tedy I2a1b starou notací. Větev původních Evropských lovců a sběračů - Evropan jak poleno :D
23andMe nabízí o Y haplogrupách vlastní povídání, ale zdaleka nejlepší info jsem se dočetl na eupedii. Hlavně tam jsem se dověděl o základní historii I-M423.

Po trošce průzkumu jsem jasně viděl, že SNiPy jsou na výzkum chromozomu Y mnohem mocnější zbraň, než STRka. Díky jednoznačnosti a bohatější struktuře. Jako další krok jsem si tedy vybral I-M423 panel na yseq.net. To je Y test s daleka nejlepším poměrem cena výkon na trhu (pokud znáte svoji haplogrupu), a tým z yseq.net dělá vše proto, abych jejich panely zahrnovi vždy ty nejnovější známé mutace. Velká chvála Thomasovi Krahnovi.
Výsledky panelu mi poskytly mou "konečnou" (z hlediska dosud dosažených znalostí o Y stromě) SNP mutaci I-Y16473 and 4 nejbližší shody - Narog, Telencio, Rohaly and Girya. Polsko, Polsko, Maďarsko a Ukrajina. Nejbližsí společný předek 200 n.l. Expanze Slovanů na západ!
Úžasné.
Být schopen si spojit mutaci I-S17250 a její nejbližší podtřídy tak zřejmě se Slovanským stěhováním národů v první polovině prvního tisíciletí našeho letopočtu byl jeden z nejlepších výsledků, co jsem zatím z genetického testování dokázal vymáčknout.

Dalším krůčkem ve výzkumu mé Krchákovské linie bylo dohánět co jsem zanedbal - malý STR test. Ten jsem uskutečnil pomocí unikátního českého projektu "Genetika a příjmení", které se snaží mapovat česká příjmení na haplogrupy - genebaze.cz/gap.html. Pokud jste to ještě nezkusili, rozhodně se ozvěte! Je to úžasný způsob jak zadarmo s genetickým testováním začít.
Tak co jsem se dověděl? Jak by mohl malinký STR panel dodat nějakou informaci k SNP testu, obsahujícím všechny nejnovější větve? Jednoduše. Všude je TOLIK genealogů, kteří si nechali udělat jen STR test. Takže ač je SNP testování rozhodně mocnější co se týče časové umístění vašich shod a vytvoření stromu otcovských linií, neměli by jste STRka rozhodně zcela vynechat - umožní vám získat další (trochu neurčité) shody.
V mém případě to znamenalo nějaké blízké Slovenské shody, které žadné SNP testování nepodnikly. To krásně podpořilo rodinou legendu, že Krcháci přišli na Horňácko ze Slovenska.
(To je navíc dále podpořeno Slovenskými autozomálními shodami na čtvrtine DNA od mého dědečka Krcháka.)
Macák. Orava. Doufám, že jednou je na SNP test nalákam.
Moje IDčko na ysearch.org je AH7EK. Rovněž rovázané s mým WikiTree účtem.

Jak vždy říkám, jsou dvě cesty kterýma se může člověk ve světě Y-DNA vydat. Aktivní nebo pasivní.
Pasivní znamená čekat, až vaše shody absolvují všemožné testy, až vám vydláždí cestu. Je to ta levnější cesta. Ale možná vás nikam nedostane.
Aktivní znamená konat! Udělat si sekvenování chromozomu Y. Najít vaše nové mutace. Spolupracovat s testovacíma společnostma, aby jste vaše soukromé SNiPy dostale jak do panelů, tak do dlouhých seznamů testů na samostatné SNiPy. Pracovat s vašimi shodami, zda nemají některé vaše mutace společné. Snažit se navnadit vzdálené bratrance, aby se do toho sekvenování taky pustili. Tohle je mnohem dražší varianta, ale povede k výsledkům mnohem pravděpodobněji, v mnohem kratším čase.

Ja si samozřejmě vybral tu aktivní cestu. Takže můj další krok byl logicky BigY test of FTDNA. Nebo ne?

Aby jste si od FTDNA mohli koupit BigY test, musíte u nich první otestovat nějaké STRka. Ono je to nakonec asi v pořádku, protože nikdo nechce utratit 400 dolarů, aby zjistil, že jeho bratranec měl ve skutečnosti adoptovaného pradědečka.
Pomocí projektu je možné si objednat 12STR, aby člověk minimalizoval náklady. Ale když už se má člověk do té FTDNA STR databáze dostat, tak ať ty shody stojí zato. Začal jsem raději rovnou s 37STR indikátory. Tedy asi 15 navíc proti těm co už jsem měl z GaP.

Stálo to za to? Ani ne. Šel bych do těch 37mi radši než do 12ti znova? To zas jo.
Problém je, jak přísný limit na shody FTDNA na úrovni 37STR indikátorů má. Snaží se motivovat lidi ke koupi 67mičkových a 111kových panelů. Je to hnusná vydírací taktika, ale holt to tak je. FTDNA si na živobytí vydělává hlavně pomocí STR testů, a vždycky se snažila tu být předně pro genetické genealogy (ne jako některé jiné společnosti, kterým jde opravdu jen o zisk).
Takže 37STR test žádné nové poznatky nepřinesl, ale vždycky může zkoušet všechny své blízké STr shody přesvědčovat na BigY test.

Se splněnou podmínkou v podobě STR testu byl BigY konečně na dohled. Akorát byl dál, než to vypadalo. Několik odložených slíbených časů dodávky, a déle než 3 měsíce čekání... Ale když jsem se konečně dočkal tak to rozhodně stálo za to.

Nová finální větev s mou shodou - Larrym Telenciem. I-FGC40352. Paráda. Skvělé. Úžasné. Takhle se tvoří Y strom.
Navíc jsem dostal 8 soukromých mutací, které teď čekají na další shody.
Potenciál pro další výzkum, blíže současnosti. Sem s ním!

A tím se jako s testováním skončil? Ne tak úplně. Sekvenování je známé nelehkostí interpretace. A FTDNA to dělá obzvlášť blbě. Proto taky většina lidí, která Yové sekvenování podstoupí, jde o krok dál. Objedná si detailní analýzu souboru BAM za 49$ na https://www.yfull.com.
Tam se výsledky dostávají postupně:

SNP výsledky - tohle je podstata analýzy, najív nové finální listy v Y stromě a identifikovat vaše soukromé mutace (a míru jejich spolehlivosti).
STR výsledky - několik stovek STRek, které se dají pomocí NGS přečíst. A taky STR shody.
nový Y strom - vám konečně ukáže vaši novou, vysněnou větev Yového stromu s vaší soukromou mutací - a odhadem jejího stáří.

Tak jsem s tím výzkumém Y chromozomu, co můj syn ponese dál do budoucnosti, docela pokročil, ale stále je kam jít.

Přesvědčit blízké shody, aby rovněž absolvovali sekvenování chromozomu Y, a nebo alespoň otestovali přítomnost mých soukromých mutací v jejich DNA. Snad se mi to u některých (z Vás) podaří.
Koupit BigY pro známé vzdálené bratrance po otcovské linii, abychom lépe definovali, které z mých soukromých SNiPů jsou ty starší. A rovněž za účelem umístění Krchákovské větve na rozličné Y stromy (YFull, ISOGG, FTDNA).

Další rok, další krok kupředu. Už se těším co se na poli Y výzkumu dovím v roce 2018.

Jo a taky si můžu odškrtnout můj první cíl ze seznamu na rok 2017. Uff.

Language switching