Ordinateurs

Une nouvelle technique stocke des téraoctets de données sur l’ADN avec une précision de 100 % – High-teK.ca

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

À mesure que la technologie progresse et que nous intégrons plus fréquemment des activités numériques dans notre routine quotidienne, nous avons besoin d’une quantité toujours croissante d’espace de stockage pour héberger les données que nous collectons. Le stockage évolue à un rythme raisonnable, mais les technologies conventionnelles ont leurs limites et les chercheurs sont constamment à la recherche d’alternatives plus puissantes. L’un de ces supports de stockage consiste à stocker d’énormes quantités de données sur l’ADN. Aujourd’hui, les chercheurs ont mis au point une nouvelle technique pour stocker des données sur les molécules d’ADN et y accéder.

L’année dernière, les scientifiques de Harvard ont réussi à bourrer 5,5 pétabits (environ 700 téraoctets) de données sur un seul gramme d’ADN. Comme nous l’avons expliqué précédemment, la méthode utilisée pour stocker les données sur le gramme d’ADN est similaire à la façon dont elles sont stockées sur un périphérique de stockage standard. Des brins d’ADN qui tenaient 96 bits de données binaires chacun ont été synthétisés, puis les données pourraient être lues à l’aide d’un processus de séquençage d’ADN standard.

Cependant, il existe quelques obstacles dans la progression de l’écriture et de la lecture de l’ADN. Premièrement, les erreurs d’écriture et de lecture sont courantes et sont causées par la répétition de lettres codant sur les brins d’ADN. L’autre problème important est qu’actuellement, les scientifiques ne peuvent créer que de courts brins d’ADN, ce qui limite l’espace global avec lequel travailler.

Psssssst :  Les nouveaux GPU RX 500X d'AMD sont des marques OEM, pas de nouvelles cartes - High-teK.ca

La nouvelle méthode de stockage et de lecture des données sur l’ADN, créée par le Bioinformatics Institute (BI), consiste à décomposer les données en de nombreux petits fragments qui se chevauchent et vont dans les deux sens afin d’éviter la répétition des lettres – 117 lettres dans chaque chaîne. Parallèlement à cet agencement spécifique, les données codées nécessitent des informations d’indexation pour dicter où chaque fragment s’intègre dans les données globales. La nouvelle technique nécessitait également une nouvelle méthode de codage qui réduisait la possibilité de répéter les lettres.

Modèle ADNAfin de tester la nouvelle technique, la société californienne Agilent Technologies a proposé de stocker des données sur les chaînes d’ADN. BI a envoyé à l’équipe Agilent divers fichiers encodés à l’aide de la méthode susmentionnée qui réduirait les erreurs, qui consistaient en un fichier .txt de tous les sonnets de Shakespeare, un clip de 26 secondes du discours « I Have a Dream » de Martin Luther King Jr. , un .jpeg du Bioinformatics Institute, un .pdf de l’article de Watson et Crick qui détaille la structure de l’ADN, et un fichier qui explique le processus d’encodage réel utilisé.

Agilent a téléchargé ces fichiers sur Internet et mis les informations sur des centaines de milliers de chaînes d’ADN, ce qui a donné quelque chose de la taille d’un petit morceau de poussière. Agilent a ensuite renvoyé les chaînes codées semblables à de la poussière à BI, où les chercheurs ont réussi à séquencer et à reconstruire les fichiers sans erreur.

Le chercheur en BI Nick Goldman note que la technique de codage crée des résultats dans un stockage support qui peut durer dix mille ans ou plus, et peut être lu par n’importe qui tant qu’il a accès à une machine capable de lire l’ADN et ce qui est essentiellement le chiffrement pour reconstruire la méthode de codage.

Évidemment, ADN Les clés USB ne sont pas à portée de main, car divers problèmes pratiques doivent d’abord être surmontés, comme, vous savez, ne pas avoir deux laboratoires de recherche différents et tout l’équipement approprié impliqué dans le processus d’encodage et de reconstruction. Cependant, étant donné que l’ADN ne deviendra probablement jamais obsolète et qu’il a déjà été démontré qu’il stocke d’énormes quantités de données, nous ne pouvons qu’espérer que des progrès significatifs dans le domaine seront réalisés assez rapidement pour que nous puissions voir un lecteur d’ADN de notre vivant.

Psssssst :  Le processeur TensorFlow dédié de Google, ou TPU, écrase Intel et Nvidia dans les charges de travail d'inférence

Document de recherche: Vers un stockage d’informations pratique, à haute capacité et nécessitant peu d’entretien dans l’ADN synthétisé

Bouton retour en haut de la page