Un SSD est-il nécessairement très fiable?

Un SSD est-il forcément plus fiable qu’un disque dur (HDD)? Si oui, pourquoi? Comment évaluer la fiabilité d’un SSD et quels sont les premiers signes qui doivent inquiéter, indiquant que celui-ci est en train de rendre l’âme? Nous tentons de répondre à ces questions…

Le SSD, un disque solide, sans composants mécaniques.

Le SSD est basé sur des puces de mémoire flash (NAND), un controlleur et – pas toujours – une puce de DRAM, mémoire vive permettant de stocker de manière accessible très rapidement certaines données dont le controlleur a besoin. Dans le controlleur on retrouve un processeur ARM et un programme: le SSD est en fait comme un ordinateur miniature, concentré sur la gestion de vos données.

Comparé au disque dur, qui a un fonctionnement mécanique, avec une aiguille qui se déplace pour lire et écrire des données sur des plateaux, le SSD semble bien plus solide: peu de risque de casse en cas de choc par exemple. Et effectivement: un SSD est recommandé pour une machine qui peut subir des chocs et sera moins fragile, plus fiable – et plus durable – dans ce cas là.

Mais comme on le voit un SSD est aussi un appareil très complexe, de haute technologie. Si certains modèles anciens – et quelques modèles actuels dédiés aux datacenters – disposaient d’un controlleur qui compressait les données pour qu’elles usent le moins possible les puces, et utilisaient des puces 2D avec un système similaire à un RAID permettant de faire face à la fin prématurée d’une puce sans perte de donnée, l’arrivée et la généralisation des puces 3D avec de plus en plus d’étages change radicalement la donne.

En effet, sur les disques récents la densité de stockage est telle qu’une ou deux puces peuvent contenir l’intégralité du contenu du disque: si la puce « cramme », les données sont perdues. Certains constructeurs, comme Crucial avec sa technologie RAIN viennent ajouter un bloc de parité permettant la reconstruction des données en cas de défaillance d’un bloc mémoire. Bien entendu si toute une puce venait à tomber en panne, cela ne fonctionnerait plus: ces technologies sont interessantes mais ne remplaceront jamais un RAID ou un bon système de sauvegardes (backups).

Pourtant, les disques SSD restent très fiables, quand ils sont de bonne qualité et – pour les disques SATA – s’ils comportent de la DRAM. Les disques DRAMLess (sans DRAM) sont en effet à éviter pour qui souhaite avoir un usage intensif de son disque, sur le temps long, ou alors il faut veiller à ce qu’ils aient un controlleur de qualité, pour limiter tout usage prématuré de la NAND dans la zone sur laquelle le disque stoque tant son firmware (le logiciel interne utilisé par le controlleur) que les métadonnées, principalement la cartographie du SSD nécessaire au FTL (flash translation layer).

Comme on peut le voir dans l’analyse d’Usenix, basée sur les disques utilisés en datacenter (et donc de qualité globalement meilleure que les disques grand public!) certains disques, même de la meilleure qualité cessent de fonctionner totalement et sans raison claire (32.78% des remplacements de disque dans l’étude), quand les autres défaillances sont plus progressives, laissant le temps de récupérer les données. Comme le remarquent Narayanan et al. dans leur étude « SSD failures in datacenters: What? When? and Why? » qui s’interesse aussi aux disques grand public de qualité avec de la mémoire MLC, la défaillance concerne environ 0.5 à 1% de ces disques en moyenne anuelle – dans le contexte d’un usage intensif – alors que le taux descend à 0.1% sur les meilleurs disques de qualité datacenter/entreprise.

Les défaillances de disques SSDs sont donc relativement rares, comparativement aux disques magnétiques dont le taux de défaillance est variable mais peut atteindre plusieurs pourcents par an, mais elles ne sont pas impossible. Comment alors les reconnaitre?

Signes qui indiquent qu’un SSD va bientôt tomber en panne.

En général, un SSD n’arrête pas de fonctionner d’un coup, même si cela arrive. Certains signes doivent inquiéter et faire comprendre qu’il est temps de changer de disque, ou a minima de sauvegarder très régulièrement ses données.

  • Difficultés au démarrage (besoin de redémarrer l’ordinateur pour qu’il boot correctement).
  • Corruption du système de fichier.
  • Lenteurs à l’écriture ou à la lecture de données (mises à jour bien plus lentes que d’habitude, par exemple).
  • Disque qui se met en « lecture seule ».
  • Disque reconnu par le BIOS de manière aléatoire.

La durée de vie d’un SSD est liée en partie à la technologie utilisée pour le stockage (SLC/TLC/MLC/QLC), mais aussi au type de controlleur utilisé et à la présence ou non de DRAM (dont nous évoquons l’importance dans notre guide « comment bien choisir son SSD »). En effet c’est dans cette puce de DRAM (DDR3 ou DDR4) qu’est stoquée la « cartographie » indiquant où les données sont stockées sur le disque. Si le disque est DRAMless, sans DRAM – comme le sont les modèles les plus économiques – alors ces informations ainsi que l’ensemble des informations dont à besoin le controlleur seront stockées sur la NAND.

Si le controlleur est très bien fait et les puces NAND de haute qualité, cela n’est pas forcément un problème. Et ce n’est généralement pas un problème avec les disques NVMe, vu que leur protocole est adapté à un fonctionnement sans DRAM. Mais dans le cas de disques SATA, cela peut devenir problématique lorsque le disque est plein, et si la gestion de l’écriture de données est effectuée a minima et que le controlleur écrit et lit sa cartographie toujours sur les mêmes cellules du SSD. Cela peut créer une usure prématuré de certaines zones de la NAND, qui peuvent entrainer une mise en défaut du disque. Si des cellules de la NAND nécessaires au fonctionnement du disque ne sont plus opérationneles, il se peut que celui-ci refuse de démarrer, n’arrivant par exemple plus à charger le firmware du controlleur, son programme interne, ou la cartographie de vos données.

Or il n’est pas aisé de récupérer les données d’un SSD, c’est bien plus compliqué que sur un disque dur, comme nous allons le voir maintenant.

Récupérer ses données quand son SSD est en panne.

Il est très compliqué de récupérer les données d’un SSD pour plusieurs raisons. Contrairement à un disque dur où la suppression de données ne supprimera que le « lien » vers celles-ci, permettant de les récupérer si besoin, sur un SSD la commande « TRIM » réorganise les données et entraine un effacement irréversible de ce qui a été effacé. Il est donc impossible pour le commun des mortels de récupérer des données effacées après un passage de TRIM. Mais qu’en est-il d’un disque défaillant, cassé, qui a « grillé »?

Le problème est complexe: comme nous l’avons vu le controlleur va décider où et comment organiser les données sur les puces de NAND: il ne suffit donc pas de déssouder la puce pour pouvoir en lire le contenu, sans le controlleur – qui dans certains cas ajoute une couche de chiffrement – le contenu de la puce est impossible à extraire, à interpréter. Si certaines sociétés spécialisées peuvent effectuer ce travail à un prix rébarbatif, ces sociétées sont rares et l’opération ne vaut pas le coût pour un usage général.

De plus il se peut que la défaillance ne soit pas au niveau du controlleur, mais d’une puce NAND elle même, or celle-ci peut subir un certain nombre de cycles d’écriture / lecture, après quoi les cellules sont usées: si celles-ci sont « rincées », comment récupérer des données en bon état?

Plutôt que chercher à récupérer ses données, il me semble important d’avoir une bonne stratégie de sauvegarde: copier régulièrement ses données sur un disque externe par exemple (qui peut être basé sur un disque dur de récupération dans un boitier USB: il vaut mieux avoir plusieurs copies sur des supports à la fiabilité relative, qu’une seule copie sur un support en théorie très fiable, mais qui pourrait bien venir à défaillir!). Certaines données importantes pourraient être sauvegardées en ligne, sur un serveur de stockage – penser alors au chiffrement! – ou sur un disque dur déposé chez un parent ou un ami, afin de se prémunir en cas d’incendie ou d’innondation.

Mais que faire si l’on a pas ancitipé, et que son SSD rend l’âme? Si les données ont une grande importance, il est possible de faire appel à une société spécialisée. Le cas échéant, il faut prendre cet accident avec philosophie, et être plus vigilant à l’avenir, en prennant des sauvegarde régulières des ses données les plus importantes, mais aussi en investissant dans un disque de bonne qualité, moins à même de connaitre une défaillance qu’un disque à bas coût, doté de mémoire de mauvaise qualité et d’un controlleur ancien, avec un fonctionnement pas forcément optimal pour une longue durée de vie du disque.

SSD vs HDD: pour quels usage un disque dur sera plus fiable qu’un SSD?

Si comme nous l’avons évoqué un SSD sera le bienvenu dans un environnement dans lequel l’appareil qui l’utilisera subira des chocs, des vibration, rendant celui-ci très pertinent pour un PC portable par exemple; pour certains usages un « bon vieux » disque dur mécanique sera meilleur.

Cela peut sembler contre intuitif. Alors que les mémoires NAND QLC (avec 4 bit par cellule) se développement et que les prix au téraoctet baissent, il est tentant de partir sur 100% de SSD dans l’idée d’éviter toute défaillance mécanique. Pourtant, un SSD n’est pas infaillible, nous l’avons souligné, même si un bon SSD devrait durer sans problème des années, et peut encaisser bien plus d’écriture que la limite indiquée par le constructeur. Mais un SSD a besoin d’un courrant electrique pour fonctionner: deconnecté d’un ordinateur, sa capacité à conserver des données est moins bonne qu’un disque dur, surtout s’il reste débranché durant plusieurs années. Pour un support de sauvegarde longue durée qui restera chez un parent par exemple, un disque dur sera plus approprié qu’un SSD.

Le coût au TO est encore en faveur d’un disque dur pour certains usages, comme un NAS ou un disque de sauvegarde utilisé quelques fois par an pour y copier ses données importantes: aucune nécessité de passer en SSD dans ces cas là. Un SSD en SATA dans un boitier USB peut s’avérer interessant pour concevoir un petit NAS « fait maison » avec un routeur sous OpenWRT par exemple. Mais même dans ce cas là, un disque dur en 2.5 fera bien souvent l’affaire, même si le taux de défaillance étant en faveur du SSD peut faire pencher la balance en faveur d’un SSD, en l’absence de RAID.

Pour un usage de particulier, dans une station de travail, le SSD est interessant en disque système, car il permet un temps de démarrage réduit, ainsi qu’à l’ouverture des applications. Si vous avez suffisament de mémoire vive, ces bénéfices sont à relativiser: une fois le programme ouvert une fois, il reste en cache dans la mémoire vive un certain temps et s’ouvrira très rapidement la seconde fois. Pour stocker des fichiers accédés peu souvent, comme des vidéos, un second disque, mécanique celui-là peut être pertinent. Il pourra être mis en veille par le système d’exploitation quand il n’est pas utilisé.

Conclusion

Un SSD bien conçu, fruit du travail d’un constructeur sérieux, devrait durer des années et pourra dépasser sans problème les limites théoriques en écriture (TBW) indiquée sur sa fiche technique, qui sont données pour limiter la garantie, et non pour informer le consomateur sur limites indépassables des puces de mémoire flash du disque.

D’après les études de TechReports, la plupart des SSDs grand public de qualité peuvent encaisser plus de 700 TO d’écriture et lecture, et certains modèles peuvent survivre jusqu’à 2.5 pentaoctets de données écrites et lues (!). En comparaison, l’analyse de Blackbase portant sur plusieurs miliers de disques durs fait état de défaillances régulières, même avec des modèles de disque durs de la meilleure qualité. Pour autant, les SSDs ne sont pas immortels, et dans certains usages un disque dur mécanique sera plus pertinent. Il faut dans tous les cas chercher à anticiper au mieux et sauvegarder régulièrement ses données les plus importantes, tout en gardant à l’esprit que certains fichiers peuvent être récupérés sur Internet à tout moment: il n’est pas nécessaire de chercher à tout conserver en double!

Facebooktwitterredditpinterestlinkedinmail

Vous aimerez aussi...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.