Η κοινοποίηση γενετικών σκορ κινδύνου μπορεί να αποκαλύψει πολλά μυστικά

Το γενετικό σκορ κινδύνου, το οποίο συνοψίζει την πιθανότητα εμφάνισης συγκεκριμένων παθήσεων υγείας σε ένα άτομο, μπορεί να εκμεταλλευτείται μέσω μαθηματικών τεχνασμάτων για την αποκάλυψη κρυφών λεπτομερειών του DNA του.

Η μέθοδος θα μπορούσε θεωρητικά να χρησιμοποιηθεί από ασφαλιστικές εταιρείες υγείας για την ανασύσταση γενετικών δεδομένων από μια συνοπτική γονιδιωματική αναφορά, αποκαλύπτοντας κινδύνους υγείας που δεν έχει δηλώσει ο ασθενής. Εναλλακτικά, άτομα που κοινοποιούν τα σκορ τους ανώνυμα θα μπορούσαν να αναγνωριστούν με την εξαγωγή των γενετικών δεδομένων και την αναζήτηση σε δημόσιες βάσεις δεδομένων γενεαλογίας.

Τα πολυγονιδιακά σκορ κινδύνου μετρούν την επίδραση δεκάδων έως χιλιάδων μεμονωμένων παραλλαγών γραμμάτων στο γονιδίωμα, γνωστές ως μονονουκλεοτιδικοί πολυμορφισμοί (SNPs). Τα σκορ, που χρησιμοποιούνται από ερευνητές και εταιρείες γενετικών ελέγχων για τη σύνοψη πιθανών κινδύνων υγείας, κοινοποιούνται μερικές φορές δημόσια, για παράδειγμα, από άτομα που ζητούν συμβουλές για την ερμηνεία των σκορ τους.

Η αποσυμπίεση ενός πολυγονιδιακού σκορ κινδύνου είναι σαν να προσπαθείς να βρεις έναν αριθμό τηλεφώνου γνωρίζοντας μόνο ότι τα ψηφία του αθροίζουν στο 52. Είναι ένα παράδειγμα του προβλήματος του σάκου (knapsack problem) στα μαθηματικά, το οποίο είναι υπολογιστικά δύσκολο. Εξαιτίας αυτού, τα σκορ θεωρούνται ότι έχουν χαμηλό κίνδυνο απορρήτου.

Ωστόσο, κάθε τιμή SNP που χρησιμοποιείται σε ένα σκορ κινδύνου πολλαπλασιάζεται με μια εξαιρετικά ακριβή στάθμιση – έως και 16 ψηφία – η οποία αντικατοπτρίζει τη συμβολή της στον συνολικό κίνδυνο ασθένειας. Αυτό καθιστά τα μικρά μοντέλα κινδύνου ευάλωτα σε επιθέσεις.

«Επειδή το τελικό πολυγονιδιακό σκορ κινδύνου περιορίζεται από έναν πεπερασμένο αριθμό τρόπων με τους οποίους μπορείτε να φτάσετε σε αυτόν τον αριθμό, και μια στατιστικά πιθανή διάταξη των υποκείμενων SNPs, μπορεί να συναχθεί με υψηλό βαθμό ακρίβειας», λέει η Gamze Gürsoy στο Πανεπιστήμιο Columbia της Νέας Υόρκης.

Η Gürsoy και ο Kirill Nikitin, επίσης από το Columbia, ανέλυσαν 298 πολυγονιδιακά μοντέλα κινδύνου που χρησιμοποιούν 50 SNPs ή λιγότερα σε γενετικά δεδομένα από 2353 άτομα. Δουλεύοντας ανάποδα, υπολόγισαν όλα τα πιθανά γονιδιώματα που θα μπορούσαν να έχουν παραγάγει κάθε δεδομένο σκορ, φιλτράροντας εκείνα με πολλές ασυνήθιστες μεταλλάξεις.

Εφόσον ένα SNP μπορεί να χρησιμοποιείται από πολλαπλά πολυγονιδιακά μοντέλα κινδύνου, η Gürsoy και ο Nikitin μπόρεσαν να συνδέσουν την επίθεσή τους, χρησιμοποιώντας SNPs που αποκαλύφθηκαν από μικρότερα μοντέλα για να βοηθήσουν στην επίλυση μεγαλύτερων.

Κατόρθωσαν να ανασυνθέσουν το γονότυπο του δότη με ακρίβεια 94,6%, προβλέποντας σωστά 2450 SNPs ανά άτομο. Οι δοκιμές έδειξαν ότι 27 SNPs ήταν αρκετά για να αναγνωριστεί ένα άτομο σε ένα σύνολο μισού εκατομμυρίου δειγμάτων, και τα μέλη της οικογένειας μπορούσαν να προβλεφθούν με ακρίβεια έως και 90%. Άτομα αφρικανικής και ανατολικοασιατικής καταγωγής αναγνωρίστηκαν ευκολότερα, καθώς αναπαρίστανται λιγότερο σε γενετικές βάσεις δεδομένων.

Σύμφωνα με την Gürsoy, 447 μικρά, υψηλής ακρίβειας μοντέλα σε μια δημόσια βάση δεδομένων πολυγονιδιακών σκορ είναι ευάλωτα σε αυτή την επίθεση.

«Θέλαμε να επισημάνουμε ότι ο κίνδυνος είναι χαμηλός, αλλά υπό [ορισμένες συνθήκες], μπορεί ακόμα να υπάρχει κάποια διαρροή», λέει η Gürsoy. «Θα πρέπει να το λάβουμε υπόψη μας κατά τον σχεδιασμό ερευνητικών μελετών, ειδικά αν εμπλέκουμε ευάλωτους πληθυσμούς.»

Η Ying Wang στο Γενικό Νοσοκομείο της Μασαχουσέτης λέει ότι τα υπάρχοντα μέτρα προστασίας δεδομένων και τα υπολογιστικά εμπόδια περιορίζουν τον κίνδυνο εκμετάλλευσης των πολυγονιδιακών σκορ κινδύνου με αυτόν τον τρόπο. «Τα αποτελέσματα μπορεί να χρησιμεύσουν ως προειδοποίηση ότι τα μικρά μοντέλα θα πρέπει να αντιμετωπίζονται ως δυνητικά ευαίσθητα δεδομένα σε κλινικές αναφορές και συζητήσεις για την ενημερωμένη συναίνεση», λέει.

via

Μπορεί επίσης να σας αρέσει