Anuncio

Usar las secuencias propias de ADN ha puesto en peligro la privacidad de otras personas

Share

La secuencia de ADN de todos es única. Pero para aquellos que desean mantener su privacidad genética, puede que no sea lo suficientemente exclusiva.

Un nuevo estudio argumenta que más de la mitad de los estadounidenses podrían identificarse por su nombre si lo único que se tiene es una muestra de su ADN y algunos datos básicos, como dónde viven y qué edad tienen.

No sería sencillo y no sería barato. Pero el hecho de que se ha hecho factible nos obligará a todos a repensar el significado de la privacidad en la era del ADN, dijeron los expertos.

Anuncio

Hay poco tiempo para perder. Los investigadores detrás del nuevo estudio dicen que una vez que 3 millones de estadounidenses hayan subido sus genomas a los sitios web públicos de genealogía, casi todos los estadounidenses se identificarán solo por su ADN y con algunas pistas adicionales.

Más de 1 millón de estadounidenses ya han publicado su información genética, y docenas más lo hacen todos los días.

“La gente se ha estado preguntando cuánto tiempo pasará antes de que pueda usar el ADN para detectar a casi cualquier persona”, dijo Ruth Dickover, directora del programa de ciencia forense en UC Davis que no participó en el estudio. “Los autores dicen que no va a pasar mucho tiempo”.

Esta nueva realidad representa la convergencia de dos tendencias.
Una de ellas es el aumento de las pruebas genéticas directas al consumidor. Compañías como Ancestry.com y 23andMe pueden secuenciar el ADN de cualquier persona por aproximadamente $100. Todo lo que tiene que hacer es proporcionar una muestra de saliva y entregarla por correo.

El otro elemento esencial es la proliferación de bases de datos para búsquedas públicas de genealogía como GEDmatch. Cualquiera puede cargar un genoma completo en estos sitios y las computadoras lo atraparán, buscando tramos de secuencias de ADN que puedan usarse para construir un árbol genealógico.

Para probar el creciente poder de estos sitios, los investigadores dirigidos por el científico informático Yaniv Erlich de la Universidad de Columbia se propusieron ver si podían encontrar el nombre de una persona y, por lo tanto, su identidad, si todo lo que tenían era una parte de su ADN y una pequeña cantidad de información biográfica.

Comenzaron con una secuencia completa de ADN de una persona cuya información genética se publicó de forma anónima como parte de un estudio científico no relacionado. (En realidad, habían identificado a esta mujer en un estudio anterior, pero para los efectos de este trabajo, fingieron no saber quién era ella).

Erlich y sus colaboradores subieron su código genético a GEDmatch y realizaron una búsqueda para ver si tenía alguna relación con otra información en el sitio. Encontraron dos: una en Dakota del Norte y otra en Wyoming.

Los investigadores pudieron decir que todos estaban relacionados porque compartían varios polimorfismos de un solo nucleótido o SNP. Estas son letras individuales en puntos específicos entre los aproximadamente 3 mil millones de A, C, Ts y G que conforman el genoma humano. Cuanto más comparten los SNP, más estrechamente relacionados están.

Al comparar el ADN de los tres familiares, el equipo de Erlich pudo encontrar una pareja ancestral común que era la bisabuela de la mujer de Utah.

A continuación, los investigadores buscaron en los sitios web genealógicos y otras fuentes en busca de descendientes adicionales de esa pareja de hace mucho tiempo. Encontraron 10 hijos y cientos de nietos y bisnietos.

Luego comenzaron a seleccionar su lista masiva de descendientes. Eliminaron a todos los hombres de la muestra, luego a los que no estaban vivos cuando se secuenció el ADN de la mujer de Utah. Los autores también sabían que su sujeto estaba casado y cuántos hijos tenía, lo que les ayudó a concentrarse en su objetivo.

Después de un largo día de arduo trabajo, los investigadores pudieron nombrar correctamente al propietario de la muestra de ADN.

Los autores dijeron que el mismo proceso funcionaría para aproximadamente el 60% de los estadounidenses de ascendencia europea, que son las personas con mayor probabilidad de usar sitios web genealógicos, dijo Erlich.

Aunque las probabilidades de éxito serían menores para las personas de otros orígenes, aún se espera que funcionara para más de la mitad de todos los estadounidenses, aseguraron.

Para llegar a esta conclusión, los investigadores analizaron una base de datos diferente que consta de 1.28 millones de personas anónimas cuyo ADN ha sido secuenciado por MyHeritage, una compañía de pruebas de ADN e historia familiar de la que Erlich es el director científico.

Si puedes encontrar al primo tercero de una persona en una base de datos genealógica, entonces deberías poder identificar a la persona con una cantidad razonable de búsquedas, dijo Erlich.

Así que el equipo verificó cuántos parientes de un primo tercero o más cercano podían encontrar por cada individuo en su conjunto de datos.

Encontraron suficientes: el 60% de los 1.28 millones de personas se relacionaron con un pariente que era al menos tan cercano como un primo tercero, y el 15% tenía un pariente que era al menos tan cercano como un primo segundo.

Los hallazgos fueron publicados en la revista Science, el 11 de octubre.
Hasta ahora, Joseph James DeAngelo, de 72 años, es la persona más famosa que se identifica de esta manera. Puede que lo conozca como el presunto asesino de Golden State, acusado de 13 cargos de asesinato y 13 cargos de intento de secuestro.

Cuando los oficiales de la ley usaron una base de datos de ADN de acceso público para capturar a DeAngelo en abril, fue solo la segunda vez en la historia que la estrategia se implementó con éxito en la búsqueda de un criminal.

Desde entonces, al menos 13 sospechosos han sido identificados de la misma manera.

“La resolución del caso del Golden State Killer señaló este método como una posibilidad y otros laboratorios que buscan criminales lo están aprovechando”, dijo Dickover. “Claramente es una tendencia que ha comenzado a desarrollarse”.

Los ciudadanos privados también se están beneficiando de la tecnología. Las personas adoptadas han encontrado padres y hermanos biológicos, y otros han encontrado primos lejanos que pueden arrojar una nueva luz sobre sus orígenes y el patrimonio de una familia.

Pero a medida que más de nosotros cargamos ADN en bases de datos de búsqueda pública, las implicaciones pueden ser espeluznantes.

“Cuando la policía atrapó al asesino de Golden State, fue un muy buen día para la humanidad”, dijo Erlich. “El problema es que la misma estrategia puede ser mal utilizada”.

Piensa en los gobiernos extranjeros que usan esta técnica para localizar a ciudadanos estadounidenses, o para perseguir a manifestantes y activistas.

Erlich y sus coautores propusieron una estrategia que dificultaría la carga de una secuencia de ADN desconocida en una base de datos genealógica y la búsqueda de una coincidencia.

Sugieren que las empresas de pruebas de ADN directas al consumidor incluyan un código especial en los archivos de datos sin procesar que envían a sus clientes. Los sitios de genealogía podrían entonces aceptar que las personas carguen secuencias de ADN solo si tienen un código válido. Esto aseguraría que las personas pudieran realizar búsquedas relacionadas solo con su propio ADN.

Un sistema como este no impediría que la policía use bases de datos genealógicas para buscar sospechosos, dijo Erlich.

El objetivo final es permitir que las personas utilicen su ADN para descubrir más sobre sus propias familias sin sacrificar su privacidad, dijo Erlich.

Apenas este 2018, su primo adoptivo encontró a una hermana biológica que vive a medio mundo de distancia, dijo. “Es por eso que tenemos esta técnica”.

Para leer esta nota en inglés, haga clic aquí.

Anuncio