Language switching

Saturday, November 19, 2016

23andMe matches update

  Thank you so much to all my cousins that accepted. It was not a total win, but I think combined with the blog, the campaign was a success. I am sure we will have more accepts in the coming days and weeks.

  So last week, we started at 2793 outstanding invitations, and we were able to bring it down to
2718. Not too bad. But I would prefer 1900 or 900 or 0 :D
Well, it is, what it is. We'll just have to live with this inconvenience of not tapping into the whole 23andMe DB.

So how did we fare on the individual accounts? Let's see.
DNA matchesAccepted%
926 (+8)330 (+22)35.63714903
1077 (+1)474 (+13)44.01114206
902 (+4)305 (+14)33.81374723
914 (+3)296 (+17)32.38512035
886 (+4)259 (+31)29.23250564

We did not quite reach the goal of 20/20/20/20/40, but we did not land too far from it. Additional matches over the next week might close the gap for some of the kits.

Again, my kit here is the effect of double dipping - we invite some of these matches twice (my account as well as the grandparent's account) and it can help.

One interesting thing to note for people not aware of this - getting your matches to accept reveals you new matches that are not recent. In the last week, I got between 0 and 2 new recent matches per account, but most of the kits got a few more new matches in their list. Accepting is good for increasing the amount of visible cousins.

It's not only numbers, I got my closest cousin from paternal's grandfather side to accept. Likely a 3C1R of my father. She did not react to follow-up questions and internet searches/ancestry searches ran dry. But I have a nice 5 segment match I can utilize in the future. 
I still have a large backlog of messages to work through, and I am going for that after finishing this blog. That could yield more accepts as well as more identified common ancestors.


The final conclusion is, that even for a European ("Eastern" one at that), you are able to get close to 50% utilization of the 23andMe database, without Open Sharing taking in the account (none available on the old experience). With some basic work, you're able to get around one third of your cousinship to engage (this was only my second invite wave on my wife's account).

Jdou hudba a matematika ruku v ruce?

  Tohle téma mě moc zajímá. Mám totiž v rodině jak hudebníky, tak matematiky. Občas dokonce v jedné osobě :)

23andMe na základě odpovědí na své dotazníky udělala nový výzkum v téhle oblasti.

Prozkoumávání závislosti znaků na genech v populaci se anglicky říká GWAS - genome-wide association study. Tedy "podívejme se do celého genomu, zda tam nenajdeme asociace".
Vezmeme si tedy spoustu lidí co jim jde muzika, a koukneme se, jestli se nějakým snipem (konkrétní odchylkou písmenka DNA) nepodobají. Totéž s matematiky, a navzájem.

Tady je anglické shrnutí: https://ep70.eventpilot.us/web/page.php?page=IntHtml&project=ASHG16&id=160123095

Vypadl například rs6882046 jako snip korelující s hudebních sluchem.
Matematicky nadaní zase měli často rs10555297 a/nebo rs4500960.

Jako úplně nejzajímavější je pak fakt, že vědci z 23andMe našli jak případy, kde hudební a matematické vlohy jdou dohromady, tak takové, kde se naopak bijí. Tohle bezvadně odpovídá mé zkušenosti s oběma světy.

Nové Y-ové haplogroupy na 23andMe

Tenhle týden se nám dostalo nového hezkého update od 23andMe. Máme teď k dispozici Y haploskupiny založené na snipech - alternativních DNA bazích. Bohužel se tahle novinka dostala jen na jejich nové stránky (a tam zatím Evropany nepouštějí).

Tady to podrobně popisují v blogu: https://blog.23andme.com/ancestry/updates-to-23andme-paternal-haplogroup-assignments/

My se zaměříme na podstatu změny.
Na začátku se Y strom tvořil pomocí písmen a číslic. Pokud jsme měli nějakou haplogrupu, např. R, tak první rozvětvení jsme označili jedničkou, další dvojkou, atd.: R1, R2. Pro další větvení jsme použili písmena - R1a, R1b, a pak zase čísla R1a1, R1a2 atd.
Problém byl v tom, že nalezení nových dělení nám mohlo (a typicky taky dělalo) tyhle větvení přeházet. Čím blíže současnosti, tím víc se vše měnilo a nebylo stabilni.
Proto jsme zavedli definici pomocí snipů - ty označují, která konkrátní mutace k danému větvení vedla. Pokud došlo mutací na pozici L160 k vytvoření nové větve, je jedno jestli je třetí nebo patá. Tohle značení je mnohem stabilnější.

A tohle tedy David Poznikskvělý výzkumník chromozomu Y, na 23andMe zavedl.
Obnovil údaje na úroveň ledna 2016, pomocí ISOGG stromu.

Nyní tedy každý uvidí, jak vypadá jeho kousek Y linie:

Tohle hlavně zamezí zmatkům. Ani nevíte, kolikrát přišel do našeho FTDNA projektu nebo Facebookové skupiny někdo zcela popletený výsledky z 23andMe.

Rovněž bude mnohem jednodušší pomocí 23andMe výsledků objednat ten správný SNP panel z FTDNA nebo YSeq.

Skvělá práce od Davida, těším se, že o něm neslyšíme naposledy!
(pro technicky znalé - můžete se podívat na jeho prográmek, kterým výsledky zaktualizoval)

New Y haplogroups at 23andMe

What a nice and useful update from 23andMe. We now have SNP-based haplogroup info! As expected, this feature only made it to new experience (yes, as a European, I am still at the old one).

The blog: https://blog.23andme.com/ancestry/updates-to-23andme-paternal-haplogroup-assignments/
What do we have here?
David Poznik, great Y chromosome researcher, is working hard to bring us some improvements.
He has updated all the results to recent (January 2016) ISOGG phylotree.

Now everyone will have a small image representing his position in the tree:

First and foremost, this will help reduce confusion, as unexperienced users often didn't understand the old notation, it's relation to the new SNP one. (People were coming to my FTDNA project of Facebook group with misunderstandings from 23andMe all the time.)

It will be also easier to jump to SNP panels at FTDNA or YSeq based on this info.

All-in-all great work from David, and I hope to see more from him!
(For tech savvies, you can check out his utility they used for this haplogroup update.)

FTDNA sales

It's holiday season! Hope you will have a great great time with your family all.

At https://www.familytreedna.com they're giving us some lowest prices in history, to celebrate with some family research.

You can utilize a crowd sourcing document https://docs.google.com/spreadsheets/d/1CgXRKz2TySvRqSInveSIYoslO7yexAc9d-BzpNhaY1c/edit#gid=1338933495 - where everyone is sharing the coupons they do not need.

I can definitely recommend to grab a bunch of those 59$ autosomals, if you're still missing some family members. It will only bring more order in your testing.

If you still miss your mtDNA haplgroup at phylotree.org, I suggest you fix that. An uploaded full mtDNA will guarantee your group being used in any future scientific articles, for great satisfaction and clarity. And if someone with your mtDNA haplogroup is still missing autosomal, go for the combination, easy 10$ :)

And finally BigY. Except of (more expensive) Y Elite at FGC, this is the only possibility to map your paternal line all the way to present. If you have those 400+$ in your genealogy budget, this is one of the most interesting genetic options today. You will create a path for your cousins to follow and your paternal lineage will be researched so much better, than one without NGS testing.

Slevy na FTDNA

Američané mají velký svátek - Thanksgiving. S ním je spojené nákupní šílenství, známe jako Černý Pátek. V tomto slevovém období se každoročně vyplatí nakupovat i genetické testy.

Na https://www.familytreedna.com tak najdete nejnižší slevy v historii. 59$ za autozomální test, v kombinaci dokonce 49$.

Na mitochondriální DNA (linie matek matek) je sleva dokonce 40%.

A jak STR testy tak NGS test Big Y, zabývající se linií otců otců jsou za nejnižší ceny vůbec, pokud využijete maximálních slev.

Pro to se vám vyplatí kouknout na https://docs.google.com/spreadsheets/d/1CgXRKz2TySvRqSInveSIYoslO7yexAc9d-BzpNhaY1c/edit#gid=1338933495 - dokument, kde celá genealogická komunita sdílí slevové kódy.

Co doporučuju?

Autozomál po 59$ je špička, pokud stále ještě pokrýváte nejbližší, jděte do toho.

Pokud by jste rádi dostali tu vaši mitochondriální haplogrupu do phylotree.org, aby s váší haplogrupou pracovali vědci ve vědeckých pracích, spojte to s autozomálním testem pro někoho s rodinou s vaší mitochondriální haplogroupou, u koho autozom ještě nemáte. 10$ dobrých :)

A konečně BigY. Kromě dražšího (i když zrovna také slevněného) Y Elite u FGC, je to jediná možnost, jak zmapovat vaši otcovskou linii až do současnosti. Pokud těch 10000 máte, je to jedna z nejzajímavějších genealogických investic dnešní doby. Vytyčíte tím totiž svým bratrancům cestu, a vaše linie se probádá mnohem lépe, než jakákoliv bez NGS testování.

Jak přemluvit shody na 23andMe ke sdílení?

  Pod vlivem svého prvního blogu jsem teď trochu polevil v genetické genealogii a trochu víc (když čas dovolí) se věnuju rodokmenům.
  Za účelem tohoto blogu bych se rád vrátil na svou "domovskou" stránku - 23andMe, kde jsem otestoval nejvíc lidí a zpracoval nejvíc dat.

Mám tam téměř 2800 neodsouhlasených žádostí o sdílení DNA. Ano, DVA TISÍCE, teda spíš tři. Pěkná pruda... Jak pak má člověk dělat nějaké objevy?!

Co chci udělat - obeslat všechny shody, které mohu, žádostí o sdílení. A nakonec chci změřit úspěšnost tohoto pokusu.

Tak jak si na tom se shodama stojí mých 5 nejzajímavějších profilů?
DNA shodySdílející shody% sdíleno
já (Kuba)91830833.55119826
babička z máminy strany107646142.84386617
babička z tátovy strany89829132.40534521
děda z máminy strany91127930.62568606
manželka88222825.85034014

Jak vidíte, nejvíc jsem se věnoval shodám me babičky z mamčiny strany. Na shodách mé ženy jsem nepracoval o nic méně intenzivně, ale sebe a mou ženu jsem testoval až více než rok po prarodičích (a má vlastní čísla jsou důsledkem práce na prarodičích).

Co tak můžeme čekat? Budu rád, pokud se nám podaří získat 20 nových sdílení pro každého prarodiče (a s trochou štěstí 20 pro můj vlastní profil) and snad i 40 pro mou ženu.

Co uděláme? Napíšeme všem jednotný email. Napsat každému zvlášť by bylo skvělé, a zvýšilo naše šance, ale je možné to dělat opravdu jen s nejbližšími shodami. Psát osobní zprávu dvěma tisícum shod by bylo na rok.

Takže co hlavního budeme psát?

1. Kdo jsme - spousta Američanů má obavy, že se je někdo snaží podvést. Ustanovit přátelskou, rodinnou, důvěrnou atmosférou je základ.

2. O co nám jde (proto taky píšu tenhle blog, aby to bylo jasné).

3. Něco o naší rodině - veřejný odkaz na rodokmen, naše genetická data na gedmatch.com, ap.


Hello, 

my name is is Kuba Krchak and I am living in the Czech republic. I work as a computer scientist, with huge interest in genealogy, genetics, population genetics, next generation sequencing et.al. 

I maintain a blog bgengen.blogspot.com, where I just wrote about the struggle with matches on 23andMe. Please, check it out if you have a little bit of time. http://bgengen.blogspot.cz/2016/11/can-i-get-any-more-people-on-23andme-to.html

I am trying to work on the project of creating a recombination map for me and my family and eventually mapping the DNA to ancestors. 
You are one of my unshared matches and you accepting my sharing request would tremendously help me in my efforts.
I am eager to talk to you about your ancestry, but that is optional. Just accepting my sharing request is very valuable to me. 

Here is my basic public tree: www.wikitree.com/treewidget/Krchak-1/5 
My most up-to-date tree is http://krchak.myheritage.com
I also do have an ancestry tree: http://trees.ancestry.com/tree/82403601/family
My gedmatch ID is M240291. 

Best regards, 
Kuba 

Podle toho, o koho půjde jen pozměníme odkazy na strom a gedmatch. Aby lidé nemuseli sami hledat babičku ve stromě. Čím víc to můžeme ulehčit, tím lépe.

Tak pojďme do toho. Ozvu se asi za týden se shrnutím, jak se nám tahle kampaň povedla. Je nutné mít na paměti, že už jsme 30-40% shod měli. Pokud bychom začínali, tak je úspěšnost samozřejmě lepší.

Saturday, November 12, 2016

Can I get any more people on 23andMe to accept?

So in my first blog, I talked about the need to work on our family trees as the basis of successful genetic genealogy. And I have been doing just that. Working on the trees, studying the parish records and had some success, given the invested time.

For the purpose of this blog, I would like to return to my "home" DNA testing site - 23andMe.

Out there, I have almost 2800 unaccepted requests for DNA sharing. Yes, TWO THOUSAND, or rather close to three. This is frustrating. Very.

I want to do an invitation wave - send messages to my unaccepted matches, urging them share (hello, if you're actually reading the blog). And I want to measure the impact and share it with all of you.

So where do stand we with matches on 5 of my most interesting kits?
DNA matchesAccepted% accepted
me (Kuba)91830833.55119826
m. grandma107646142.84386617
p. grandma89829132.40534521
m. grandpa91127930.62568606
wife88222825.85034014

As you can see, I have worked most on my maternal grandmother. I have not particularly worked less on my wife, but I tested her year and something later then my grandparents (and I owe my numbers to the work on the grandparent matches).

What can we realistically expect? I would be happy if we get 20 matches per my grandparents (this could lead to more than 20 for my kit, if we're lucky) and perhaps 40 for my wife.

What will do? Write a common message to everyone.


Hello, 

my name is is Kuba Krchak and I am living in the Czech republic. I work as a computer scientist, with huge interest in genealogy, genetics, population genetics, next generation sequencing et.al. 

I maintain a blog bgengen.blogspot.com, where I just wrote about the struggle with matches on 23andMe. Please, check it out if you have a little bit of time. http://bgengen.blogspot.cz/2016/11/can-i-get-any-more-people-on-23andme-to.html

I am trying to work on the project of creating a recombination map for me and my family and eventually mapping the DNA to ancestors. 
You are one of my unshared matches and you accepting my sharing request would tremendously help me in my efforts.
I am eager to talk to you about your ancestry, but that is optional. Just accepting my sharing request is very valuable to me. 

Here is my basic public tree: www.wikitree.com/treewidget/Krchak-1/5 
My most up-to-date tree is http://krchak.myheritage.com
I also do have an ancestry tree: http://trees.ancestry.com/tree/82403601/family
My gedmatch ID is M240291. 

Best regards, 
Kuba 

We will slightly change it when writing to the match of a grandparent/wife, to include their information (tree, gedmatch, ..).

Let's do this and hope for the best. I will try to follow-up in a week with details how successful this campaign was. If you have any ideas, how to improve this approach, I am all ears.

MyHeritage begins it's own DNA autosomal testing!

  Wow! What a surprise! Just a few days after working out their DNA matching, MyHeritage is starting their own autosomal DNA testing.

Here is the official announcement: http://blog.myheritage.com/2016/11/introducing-myheritage-dna/
So what do we have here, compared to the market?

MH is using a stadnard autosomal chip of roughly 700 000 SNPs. Pretty much state of the art for autosomal genotyping. The only difference is that both 23andMe and Ancestry (v2) have more health related SNPs on their chips. If you care mostly for genealogy, though, that is not much of a problem.

MH is using the Gene By Gene lab, same one that FamilyTreeDNA does. There's no need to worry. GeneByGene is an excellent, well known lab with good reputation.

The price is very competitive too!

You will be able to download your raw data and use it at the local suspects:
gedmatch.com for genetic matching and additional ancestral estimates,
promethease.com for health information,
and dna.land for both, and more.

So is it worth testing at MyHeritage?
Well if you have testing anywhere else, don't do it (just yet)! (Unless you want to learn about the system so you can teach others, but than you don't need my advice anyway ;).
You can upload your raw data from anywhere and come up with the same result, without paying anything. The only thing you're loosing out on is the ancestral coverage, and that is not worth 79$, period.

But if you haven't tested anywhere yet? I would still start elsewhere. Not sure where though, as Ancestry->FTDNA transfer no longer works. Thinking about it more, I would do either 23andMe or FTDNA if I were doing my first test.
I hate the lack of chromosome browser at Ancestry, that just completely invalidates their large DB in my eyes.
Well feel free to ask in the comments, I'm glad to help!


Bibliography: Some info was taken from http://blog.myheritage.com/2016/11/myheritage-dna-your-questions-answered/

MyHeritage rozjíždí vlastní autozomální testovaní DNA

  Něco co jsem rozhodně nečekal! Jen několik dní po zprovoznění DNA shod rozjíždí MyHeritage i vlastní DNA testování.

Tady je odkaz na (anglické) oficiální prohlášení: http://blog.myheritage.com/2016/11/introducing-myheritage-dna/
My si to samozřejmě projdeme pěkně popořádku v češtině.

Hlavně - co od toho můžete očekávat?

Předně genetické shody! Ty vám pomůžou:
1. potvrdit svůj strom - ať si faráři píšou co chtějí, dokud příbuznost neověříte DNA, máte jen domněnku.
2. máte někde v rodokmenu otce neznámé? Pomocí DNA můžete zjistit, kdo to byl!
3. chybí někde dokumenty? I to se s troškou štěstí dá pomocí DNA prorazit.
4. nemůžete přijít na to, odkud se váš předek přistěhoval? Sem s DNA :)

A potom, také zajímavý, je rozklad na jednotlivé populace.

Jste jen východní Evropan? Slovan jak poleno?
Nebo snad máte hodně západní krve? Ostsiedlung? Germáni?
A co třeba nějaká ta židovská DNA? Odkud se ve vás bere? I to se dá dohledat.




Chcete-li se na cokoliv zeptat, neváhejte! Rád pomůžu.

A teď podrobněji.

Jedná se o stadnardní autozomální chip o cca 700000 snipech. To jest dostanete přibližně to, co jinde. Jediný rozdíl je, že na 23andMe a Ancestry (v2) dostanete o něco více zajímavých zdravotních snipů. Nicméně pokud vás víc zajímá genealogie, není to žádný velký problém.

Laboratoř MH používá americké Gene By Gene, tedy stejnou laboratoř jako FamilyTreeDNA. Rozhodně není tedy potřeba se bát. Jedná se o kvalitní, známou a dlouhou dobu zajetou firmu.

Cena je velmi konkurenceschopná.

Data si budete moci stáhnout a použít i jinde.
gedmatch.com pro genetické shody.
promethease.com pro zdravotní informace.
dna.land pro obojí.

Myslím, že pro našince velmi zajímavé. MyHeritage totiž na rozdíl od všech ostatních zvládne prezentaci v češtině!

Takže pokud jste ještě DNA test nedělali, ale uvažovali o něm, jděte do toho! Ukáže a odhalí věci, které nikdy v žádných matrikách nenajdete.

Bibliografie: Některé informace jsem čerpal z http://blog.myheritage.com/2016/11/myheritage-dna-your-questions-answered/

Saturday, November 5, 2016

DNA shody na MyHeritage již fungují!


  Dobré zprávy, obzvláště v našich zemích, kde MyHeritage je jednička na trhu. Po dvou měsících úvodního provozu přišel tolik očekávaný update a hledání DNA shod na MyHeritage nyní funguje. Tady je blog, kde ohlašují, že se už od 3. listopadu nepovažují za "betu" (testovací provoz).  Podíváme se na to podrobněji.


  Úvodní nastavení genetických shod bylo velmi volné. Každý viděl stovky a stovky údajných bratranců a sestřenic, ale při ověřování na gedmatch.com to byly všechny mylné shody. Tohle chování je naštěstí opravdu pryč. Nicméně skákat do stropu radostí není na místě - z velmi benevolentního systému se stal nejpřísnější konzervativec široko daleko. Můžeme se tedy těšit ze shod, kterým se dá důvěřovat, ale moc jich (alespoň zatím) nebude.


Tady jsou počty genetických shod, které systém nabízí pro mě a mou rodinu:
Já:  1 single match (with no associated tree)
Rodiče: 5, 1 
Prarodiče (3 které jsem testoval): 3, 0, 3
Manželka: 5

Důvěryhodnost zvyšuje, že nejednu z těchto shod znám z 23andMegedmatch nebo Ancestry. Takže pravděpodobně se bude u všech jednat o opravdové v ne příliš dávné minulosti spřízněné bratrance a sestřenice.
Dalším veledůležitým pozitivem je, že téměř každá shoda má na MyHeritage svůj rodokmen. O tom se nám na Ancestry, natož jinde, nemůže ani zdát. Zbývá si jen přát, kéž bychom měli více shod.

  Proč máme tak málo shod? MyHeritage totiž používá proces tzv. imputace. V této metodě na základě výsledků z genotypovacího čipu (kupy písmenek - snipů - rozházených všude možně v naší DNA) statisticky odhaduje mnohem větší souvislé části naší DNA. K tomu používáme veřejné databáze uplných sekvencí DNA, jako např. 1000 Genome Project. Z podstaty imputace ale musíme být opatrní. Jinak budeme shody vyhlašovat na základě imputací vyrobených shodných sekvencí, bez reálného základu v naměřených hodnotách. Tak jak se dělo v původním MyHeritage beta systému.
  DNA.land používá stejný přístup a také tam mám pouze jednu shodu pro sebe, a má babička se 3mi shodami na MyHeritage tam má shody 2.

  Jaký je tedy závěr? Nová verze hledání genetických shod funguje mnohem lépe, ale tolik užitečná není. Potřebovali bychom více shod! Rozhodně se ale jedná o krok správných směrem. Pokud ještě náhodou na MyHeritage svá data nemáte, není nač váhat. Velmi příjemně vás překvapí kolik shod bude mít k dispozici rodokmen.

MyHeritage DNA matching now works!


  Big news! MyHeritage DNA matching now works. They consider themselves out of beta, but that may be a little premature. Why?

  Well they went from loose to pretty conservative. Now, you can be fairly confident with all of your matches, but do not expect a lot of them.


Let me show you how many matches (that I have not uploaded myself) me and family have:
Myself:  1 single match (with no associated tree)
My parents: 5, 1 
My 3 tested grandparents: 3, 0, 3
My wife: 5

The good news is I know some of these matches from 23andMe, gedmatch or Ancestry. So they all seem to be the real deal.
Another positive thing is the highest % of trees among my matches from any service I have used so far! If only there were more matches.

  So why is there just a handful of matches? Imputation is a method where based on a handful of letters (SNPs) in your genotyped result, much larger portion of your genome is statistically reconstructed - using database of full sequenced genomes (like the 1000 Genome Project). The nature of imputation calls for conservative approach, else you will confirm people based on identical imputed sequences, without any ground in actual genotyped data.
  DNA.land uses the same approach and I also have but a single match there, and my grandmother with 3 on MyHeritage has 2.

  The verdict? This is much better, but useful only a little bit. We need more matches! Still I encourage anyone serious in genealogy and genetic genealogy to upload, there is no thing like fishing in too many ponds. And the amount of matches with trees is unprecedented for me.