tiistai 7. lokakuuta 2025

SSD-levy ei ole ikuinen

Moni vaihtoi mekaaniset kiintolevyt SSD-levyihin ja uskoi, että niissä data säilyy ikuisesti, koska liikkuvia osia tai magneettikenttiä ei ole. Valitettavasti myöskään SSD ei ole ikuinen.

Kopioin tiedostoja SSD-levyltä mekaaniselle levylle kun kopiointi pysähtyi virheilmoitukseen:

Pelätty lukuvirhe.

Kopioinnissa tapahtuva lukuvirhe ilmoittaa selvästi itsestään, mutta ohjelman käytössä tapahtuva lukuvirhe ei välttämättä niin tee. Windowsin Taphtumienvalvonta (Event viewer) tallentaa lukuvirheen koodilla 7, mutta niitä pitää osata hakea.

Tapahtumienvalvonta kirjaa virheet koodilla 7.

Jostain syystä Windows ei ilmoita käyttäjälle suoraan lukuvirheestä. Työpöydälle pitäisi tulla isolla punainen ilmoitus, että tiedoston lukeminen on epäonnistunut ja että levyn muutkin tiedostot voivat olla vaarassa.

Valitettavasti myöskään Windowsin oma levyntarkistus ei kerro mitään asiasta, koska se tarkistaa vain kirjanpidon loogisen oikeellisuuden. 

Windowsin mielestä levy on ihan kunnossa.

Näytä tiedot avaa Tapahtumienvalvonnan ja näyttää pitkän listan chkdsk-ajosta, joka luettelee vain kirjanpitoon tehdyt tarkistukset. Vika ei ole niissä vaan levyn pinnassa (SSD:n tapauksessa muistipiireissä).

Samsungin SSD-levyjä käyttävän kannattaa asentaa valmistajan oma Magician-ohjelma. Siinä on monenlaisia työkaluja levyn kunnon ja suorituskyvyn seurantaan. Diagnostic Scan -tarkituksen nopea versio meni virheittä läpi, mutta 1-3 tuntia teratavua kohti kestävä Full Scan löysi punaisen täplän.

Punainen täplä kertoo vika-alueesta.

Tarkistuksen jälkeen ohjelma tarjosi Recovery-toimintoa, mutta jostain syystä se ei saanut yhteyttä levyyn ja oli siis hyödytön.

Normaalisti tässä vaiheessa olisi aika kaivaa esiin varmuuskopiot (SSD ei tee varmuuskopioista tarpeettomia!). Omassa tapauksessani kyse oli vain testikoneesta, eikä yhden 127 megatavun tiedoston menettäminen ollut mikään ongelma.

Vain 8 teratavua kirjoitettu.

Testikoneen Samsung 870 EVO 1 TB on halpislevy, jolta ei voi odottaakaan suurta kestävyyttä tai huippunopeutta. Silti vikaantuminen jo kahdeksan teratavun kirjoittamisen jälkeen on yllättävää, määrän pitäisi olla ainakin kymmenkertainen. 

Toisaalta levy oli lähes täynnä ja Over Provisioning oli nolla prosenttia. SSD-levyä ei koskaan saisi päästää liian täyteen, jotta elektroniikalla on tilaa siirrellä tiedostoja muistisolusta toiseen niiden tasaisen kulumisen varmistamiseksi. 

Magician-ohjelmassa on myös SMART-tietojen näyttö. Se on vanha standardi, jolla levy pystyy kertomaan teknisiä tietojaan diagnostiikkaohjelmalle.

SMART-tiedot.

Kuten listasta näkyy, Uncorrectable Error Count näyttää punaista, samoin ECC Error Rate. Tätä levyä ei kannata enää käyttää mihinkään tärkeään, koska virheitä voi tulla lisää.

Mitä tästä kannattaa muistaa?

  • Pidä varmuuskopiointi ajan tasalla myös SSD-levyillä
  • Huolehdi, että SSD-levyllä säilyy vähintään 25 % tyhjää tilaa
  • Aja diagnostiikkaohjelman oma Full Scan säännöllisesti
  • Vilkuile myös Windowsin Tapahtumienvalvontaa ja suodata mahdolliset 7-virheet näkyville

9 kommenttia:

  1. Samsung SSD 870 EVO 1TB vuoden 2021 versiossa on ollut yleisesti tiedossa olevia ongelmia ja osaan on auttanut firmware-päivitys. Googlen tekoäly toteaa sen nimellä hakemalla ja laittamalla perään "failures" seuraavaa:

    "Samsung 870 EVO 1TB drives, particularly those from specific early 2021 batches, have been reported to experience
    premature failures due to firmware issues and high write amplification. While some manufacturing issues have been fixed in newer batches, older affected drives may remain unreliable. Users experiencing failures should try updating firmware, running diagnostic scans with Samsung Magician, and checking for S.M.A.R.T. status, but also be aware that a failing drive may require professional data recovery."

    EVO:a hieman kalliimmassa PRO versiossa vastaavaa ongelmaa ei ole ollut. Muillakin valmistajilla on ollut bugeja ja ongelmia. ks. HP:n ja Dell:n (Sandisk OEM) levyt oli vika jossa jos levyn firmware ei ollut päivitetty ennen tiettyä päivämäärää levy lopetti toimintansa.

    Tietokoneista hieman enemmän kun peruskäyttäjää enemmän ymmärtävän kannattaa yrittää seurata joitakin lähteitä, josta vioista yleensä tiedotetaan tai vaikka rekisteröityä valmistajien palveluihin tuotteen yhteydessä sikäli kun kestää sitten jonkin verran markkinointispämmiä jota sieltä tulee myös.

    Dell ja HP hoitivat asian varsin mallikkaasti yritysasiakkaille, en tiedä sitten miten nämä yksityisksektorin asiakkaille hoituvat.

    VastaaPoista
  2. ... jatko
    Kun en Windowsin ohjelmista tiedä tarkemmin tuosta Samsung Magician ohjelmistosta, mutta ilmeisesti se toimii myös taustalla valvoen ainakin valmistajan omien levyjen kuntoa.

    Mutta jos ei niin Smartmontools, on toiminut jonkin aikaa jo myös jotenkin Windowsissa ja siitä saa näperreltyjä komentoriviltä luultavasti paljon tarkempia raportteja ja automatisoida hälytyksiä skriptien kanssa kaikenlaisilta levyiltä joita on ja joissa on S.M.A.R.T mukainen SCSI:stä alun perin peräisin oleva rajapinta. Useimmissa levyissä sellainen on ollut jo 2000 luvun alkuvuosista lähtien. Valitettavasti USB-muistitikuissa kuitenkin harvemmin sitä on. Ennen kuin asentaa Smartmontools -ohjelmistoa web-sivulta, niin ehkä katsoa onko tuo Magician vain käyttöliittymä edelisen päällä, eli onko konellla jo valmiiksi smartmontools asennettuna. Linuxissa ja *BSD alustalla johon smartmontools on ensin kehitetty se on yleensä jakelun pakettina valmiiksi asennettavissa. Applen macOS:n kanssa se ei enää sisäisen SSD levyn kanssa toimi. Apple on estänyt muilta kuin heidän allekirjoittamiltaan binääreiltä raw-atapi komentoja, joita smartmontools tarvitsee. Kaupallinen TechTools Pro toimii hyvin, eikä ole kovin kallis ostaa.

    VastaaPoista
  3. ... jatko
    Paneutumatta tässä miten varmuuskopioita kannattaa tehdä, niin alalta oma pitkän työuran opettama kokemus on että varmasti riittävästi. Hyviä tapoja tehdä oikein on useampia, samoin tapoja tehdä riittämättömästi ja väärin luulleen tekevänsä oikein.

    Varmuuskopinnin toteutuksessa ei kannata jättää mitään asioita sen yksittäisten osien tai asioiden rikkoutumisen varaan. Oli ne sitten tulipalo tai ehkä tulvaa vastaavia pahempia ja vähemmän vakavissa yksittäisten käytettyjen tallennusvälineiden vikaantumisen havaitsemattomuuteen, katoamiseen tai varastamiseen. Vrmuuskopioihin joiden palauttamista ei myöskään muisteta sopivin määrävälein testata luottaminen tekee koko varmuuskopioinnista keskimäärin yhtä luotettavan kuin jättää kokonaan tekemättä varmuuskopioita.

    Varmuuskopiointia kannattaa siksi ajatella riskien hallintana ja suhteuttaa ehkä toteutuvaa riskiä kustannukseen joka aiheutuu käytännössä. Enempää kun sen menetetyn sisällön arvoa tai uudestaan tekemisen työmäärän hintaa ei siihen kannatta yleensä rahaa käyttää, mutta jos kyse on aivan tärkeimmistä asioista niin silloin kyllä kannata olla kitsas ja laiska luottaen hyvään onneen, koksa:

    On olemassa vain kahdenlaisia laitteita. Niitä jotka ovat jo rikki ja niitä jotka eivät ole vielä rikki.

    Kovalevyt, SSD:t tai jotain muuta on laite ja sen vikaantuminen on vain ajan kysymys. Hyvin harvoin sellaisen pystyy itse korjaamaan. Kaupallisia tiedon palauttamiseen erikoistuneita yrityksiä on, mutta niiden palveluiden käyttäminen ei ole halpaa eikä ne valitettavasti aina kykene palauttamaan tietoja. Varsin paljon riippuu siitä miten vikaantuminen on tapahtunut.

    VastaaPoista
  4. Itse laitoin RAID1:een 4 TB Samsung EVO:n ja 4 TB Transcendin, ajatuksella että jos on jokin tyyppivirhe niin ei mene koko pakka kerralla. Eli kannattaa hajauttaa myös valmistajat.

    Jälkikäteen paljastui että tuo Transcend oli pieni munaus, lämmönpoistoa ei ole suunniteltu oikein, joten käy hieman kuumana joten välillä tulee thermal throttlingia. Toisaalta tämä oli tarkoituskin, voisi harmittaa jos olisi pari Transcendiä. Firmispäivitys onneksi korjasi suurimman osan ongelmista: https://www.reddit.com/r/DataHoarder/comments/1hytjia/transcend_ssd230s_4gb_teardown_and_cooling_upgrade/

    RAID ei toki ole backup mutta suojaa juuri siltä että levy hajoaa.

    VastaaPoista
  5. Samsungin Magician tarkistaa ssd-levyjensä firmware-versiot ja päivittää ne automaattisesti, joten sen puolen pitäisi olla kunnossa. En kuitenkaan tarkistanut versionumeroita.

    Tarkistin muutkin ssd- ja m.2-levyt, yhtä lukuunottamatta niistäkin löytyi punaisia täpliä, mutta Tapahtumienvalvonta ei kuitenkaan ollut lokittanut 7-virheitä. Ehkä levyissä ollut Over Provisioning oli vaikuttanut? Ssd:n sisäinen elämä on jotenkin mystistä, eivätkä valmistajat kerro, mitä siellä oikein tapahtuu. OP:n hyödyllisyydestä liikkuu ristiriitaista tietoa. Trim-toiminnosta ei enää puhuta mitään?

    Varmuuskopioita kannattaa olla, mutta niidenkin hallinta voi tuottaa ongelmia ja olla tietoturvariski, jos usb-tikkuja/levyjä tms. unohtuu lojumaan eri paikkoihin ja tarpeen osuessa kohdalle on työlästä selvittää, mitä versiota kukin backup oikein on. Parempi tietenkin vanha versio kuin ei mitään.

    Kaikkia RAID-pakan levyjä ei pidä hankkia kerralla juuri siksi, että jos yksi levy hajoaa, samasta valmistuserästä johtuen viereinen levy hajoaa sekin pian, ja ellei ole ehtinyt korvata levyä edessä on katastrofi. Mielellään eri merkkisiä, tai ainakin eri valmistuseristä.

    Tämä ala on ikuista opiskelua, aina oppii uutta.

    VastaaPoista
  6. Varmuuskopiointiin olen todennut että aivan mainio ja halpa ratkaisu on AWS S3-ämpäri ja rclone. S3:een määritellään muodoksi Glacier Instant Access, jossa idea on että levossa oleva data maksaa minimaalisesti, käytännössä teratavu maksaa noin dollarin kuussa säilyttää. Jos backuppia ikinä tarvitaan, palautus sitten maksaakin jo kympin teratavulta, mutta ajatushan on että backuppia tarvitaan harvoin. Ransomwarelta suojaudutaan määrittämällä että tiedostot myös versioidaan ja vasta esim. 90 päivän ikäiset vanhat versiot poistetaan. Instant Access tarkoittaa että kustannusrakenteesta huolimatta data on suoraan mountattavissa rclonella, eikä tarvitse tehdä mitään "palautuspyyntöä" mitä syvemmät Glacier-luokat vaativat.

    S3-Ämpäri mountataan rclonella vain silloin kun backuppia tehdään. Tämän voi aika helposti automatisoidakin ja laittaa skriptin tekemään. Jopa vanha kunnon xcopy *.* /S/M toimii :). Kryptauksen (lokaalilla) avaimella voi myös tehdä jolloin AWS:lläkään ei ole pääsyä tiedostoihin.

    https://ryansouthgate.com/rclone-cheap-backups/ on jonkun toisen tekemä sama löydös.

    VastaaPoista
  7. Kieltämättä hyvä ja mielenkiintoinen idea!

    VastaaPoista
  8. https://www.grc.com/sr/spinrite.htm

    VastaaPoista
  9. Nykylevyt osaavat siirrellä tietoja vaikka olisivat täynnä.

    VastaaPoista