Často umírající HDD v diskovém poli SYNOLOGY/QNAP? 12 rad co s tím

Bymirra

Led 21, 2025 #často umírající disk, #diskové pole, #HDD, #hdd kazítko, #hdd pole, #nas, #qnap, #RAID5, #raid6, #san, #storage, #synology

Zdravím všechny, včetně kolegy, který se na mě s tímto obrátil. Možná se tento problém děje i vám a mě napadlo, že bych tímto článkem pomohl více lidem. Svět skladování dat se dělí na 2 typy uživatelů. Ti, kteří o svá data ještě nepřišli (i já k této skupině patřím) a na ty, kteří ještě o data nepřišli. Ze zkušeností v článku poznáte, že už jsem se setkal s nejrůznějšími situaci, kvůli kterým jsem já, nebo někoho, koho znám, o data přišel. Pamatujte, NAS ani RAID neslouží k záloze dat, ale k pouze jejich skladování a shromažďování.

Možná je to váš případ, kdy máte třeba diskové pole na kamery, nebo i nějaké domácí diskové pole na skladování dokumentů a podezřele často (rozumějte několikrát do roka), vám v tom umře disk a ten reklamujete.

Jakým diskům se doporučím vyhnout do diskového pole

WD RED, WD Green (ty už se naštěstí nevyrábí), WD Blue, měl jsem pár mrtvých WD Purple, které jsou třeba specializované na kamerové systémy a nepřetržitý kontinuální zápis.
Do diskových polí bych necpal ani nejlevnější řady od Seagatů a třeba na Linuxových strojích jsem měl problém se SMARTem u disků Seagate Exos. Mohl jsem zrovna trefit špatnou sérii, dost možná budete mít lepší zkušenosti, než já.

Vyřaďte možnost že vám disky ničí nebo jen odmítá diskové pole

Pod dalším nadpisem se dočtete rad, týkajících se nastavení diskového pole, zejména power managementu. Setkal jsem se i s bizarnostmi, kde hardwarový RAID řadič LSI MEGARAID 2208 disk označil za vadný a vyřadil ho z pole, ale starý QNAP si disk načetl bez problémů a fungoval v poli další roky bez jakýchkoliv problémů.
Může se vám taky v případě provozování Linuxového úložiště stát, že máte nějaké další disky připojené na SATA3 řadiči, připojeném do Pci-express 1x slotu na desce a naprosto bezproblémový disk vám při zápisu, nebo resynchronizaci bude pravidelně vypadávat. V takovém případě ověřte, že nemá problém řadič, do kterého je disk připojen.

12 rad které vám pomůžou vyhnout se ztrátě dat

Na vašem Synology/Qnap vypněte power management disků (vypínání při nečinnosti). Je obecně známo, že diskům škodí méně 24/7 provoz se stabilními teplotami, než schladnutí na 20°C, zapnutí a tím pádem zteplání na 35 – 40°C a pak zase schladnutí na 20°C a takto pořád dokola, než mít stabilně nějakou teplotu, která se během dne liší např. jen o 2°C.
Chlazení disků – stačí aby byl každý disk ofukován ventilátorem. Většina synology, qnapů mají v sobě ventilátor, bývá to navrženo tak, aby proud vzduchu, který ventilátorem prochází, ty disky dostatečně zchladil. Vyhýbejte se teplotám nad 40°C, to pak vzniká vyšší riziko výskytu vadných sektorů.
Nemějte pole strčené někde v nějaké knihovničce, nebo v nějakém uzavřeném zákoutí, odkud nemá kam unikat teplý vzduch z pole. Takže pole pak pojede s ventilátorem možná i na maximální otáčky a bude se čím dál víc zahřívat a pak to dopadá špatně jako v předchozím bodě.
Nedávejte pole nikdy k oknům, kde bývá větší vlhkost vzduchu, svítí tam na to slunce, mnohem více se tam střídají teploty během dne. Ráno je tam chladněji, přes den tepleji a od noci zase teplota klesá. Chcete se vyhnout střídání teplot. Střídání teplot urychluje stárnutí jakéhokoliv hardwaru. Pokud máte nějaká stará skla ve starém domě, kde ještě není UV ochrana, zvažte, že dáte pole někam do nějaké komůrky.
Nemějte diskové pole v blízkosti schodů, nebo v místech, kde se dupe. Dokonce existují případy úmrtí disků v klubech, kde hraje extrémně hlasitá hudba, nebo v prostředí, kde jsou extrémní změny tlaku, nebo extrémní hluk od hašení. Další zdroj. Další zdroj.
Diskové pole mějte vždy za záložním zdrojem, který pomáhá vykrýt i různé výkyvy napětí v síti.
Disky ničí i cigaretový kouř, smrad z kuchyně. Filtry, které v discích jsou (pokud se nejedná o disky napuštěné heliem), nejsou tak jemné na to, aby profiltrovaly cigaretový kouř, který počítače, či disky nasají. Roste pak pravděpodobnost výskytu vadných sektorů na disku.
Chtějte disky, které mají CMR zápis. SMR zápis bývá problém při vzájemném překrývání zapsaných stop, disk to detekuje a diskové pole může zamrznout i na několik hodin, než disk přepíše předchozí stopu, aby nedošlo ke ztrátě dat.
Nejlepší zkušenosti mám s disky od HGST, Hitachi v případě WD tak řady RE (raid edition) též nazývané WD GOLD, nebál bych se ani black edition, ale tam očekávám vyšší teploty disků. Taky mám Toshiby a tam mi taky doposud žádná toshiba neumřela. Já používám 8TB, 18TB disky a jsem zatím spokojen. Pokud narazíte na disky, na kterých je napsáno ultrastar, tak to jsou vynikající disky. (dříve hitachi, později WD). Obecně do diskových polí používám s velkým zájmem disky se zárukami okolo 5 let. Když potřebuji ušetřit, nebojím se recertifikovaných disků, které prošly všemi náročnými testy v továrně výrobce, než byly vráceny po opětovném namagnetizování disků do oběhu. Standardně se testují u výrobce každý 100. disk. V případě reklamovaného disku prochází stejnými testy každý jeden disk, který je následně prohlášen za recertifikovaný.
Sledujte před nákupem žebříčky poruchovosti harddisků od společnosti Backblaze. Která provozuje velká datová centra a ročně vyměňuje stovky tisíc disků a monitoruje jejich poruchovosti dlouhodobě.
Vyhněte se RAID 5. Mějme modelový příklad se 3 disky v RAID 5. Ten vám umře vždy v následující situaci. Umře 1 disk, běžíte sice ještě bez rozpadu pole neredundantně se 2 disky, vadný disk vyměníte a při resynchronizaci disků pole narazí na nečitelné bloky dat na jednom ze zbývajících disků, vyřadí zbývající disk a pole se vám rozpadlo v tom nejnevhodnějším okamžiku. Samozřejmě nejsou ani výjimky v případě, kdy vám vypadnou 2 disky současně, protože jste měli např. SSD pole složené ze stejných disků, stejné značky, stejné série a v tomto případě vás zachrání druhé pole, kde máte s nějakým zpožděním data uložena. U
Používejte vždy ve vašem poli disky jiných značek. Máte RAID 1? Kupte si jeden disk třeba od HGST a druhý od WD, nebo Toshibu. Není nic horšího, když vám umře pole kvůli tomu, že jste trefili celou špatnou sérii disků. V některých případech výrobce bohužel až pozdě zjistí, že všechny disky dané řady umřou bez výjimky, protože obsahují např. chybu ve firmwaru, nebo nějaké kazítko. Např. u RAID 6 ze 4 disků mějte po 2 disících od 2 výrobců. Pokud selže jeden výrobce, nebo série, máte pravděpodobnost, že sice ztratíte redundanci, ale je menší riziko, že se vám rozpadne pole úplně. U RAID 1 ze 2 disků mějte 1 disk od každého výrobce jiný. U dat na strojích, která jsou už hodně důležitá, tak skládám automaticky už RAID 1 ze 3 disků od 3 výrobců. Pokud se v dané oblasti disků (nebo SSD disků) nejsou skladem disky od více výrobců, zvolte alespoň různé řady disků od jednoho výrobce. Tím se aspoň vyhnete pravděpodobnosti selhání na úrovni firmwaru.

Druhé diskové pole je levnější, než extrémně drahá obnova dat ve speciálních Laboratořích

Záleží samozřejmě od kapacity pole, množství dat, počtu disku v raidu, jeho nastavení, kombinaci a dalších informacích, které laboratoři předáte a taky jak rychle potřebujete data obnovit. Z toho pak vychází i závěr, že čím dražší data máte, tím více se vám vyplatí je držet současně na více místech. Na 2 strojích, na dalším stroji v jiné lokalitě. A samozřejmě dle víry, můžete využít i cloudová úložiště, která jsou ale extrémně drahá s přibývajícím množství větších dat, která chcete skladovat.

Závěr

Vaše další zkušenosti a rady můžete zmínit v komentářích. Disková pole provozuji cca od roku 2009 a za tu dobu jsem se setkal s nejrůznějšími bizarnostmi. Budu rád i za vaše příběhy, které pomohou mě, nebo dalším čtenářům si uvědomit, na co bychom si měli dát pozor.

Zdroje uvedeny v článku.

By mirra

Hardwaru a počítačům se věnuji již od roku 2003. Za tu dobu jsem poskládal stovky počítačů, opravil tisíce počítačů a vyřešil nespočetně problémů, vad a chyb, se kterými se setkávali uživatelé. Od roku 2005 se zabývám servery, zejména těmi herními, v roce 2007 jsem se začal věnovat Valve Source SDK level designu, který šel od roku 2009 k ledu kvůli studiu Informatiky na univerzitě. Podílel jsem se chvíli i na provozu síťové laboratoře MENDELU, dnes spravuji v jedné osobě cca 100 serverů/diskových polí na univerzitě, řeším IT v malých a středních firmách tak, aby firmy ušetřily nemalé částky při zlepšení kvality a soustředím se na snižování nákladů na IT od licencí až po hardware, software, provádím konsolidace a audity platnosti licencí, které firmám šetří rovněž nemalé peníze. Z velkých firem jsem měl příležitost s dalšími kolegy řešit správu 8000 serverů po celé západní Evropě s vysokou mírou automatizace a poznávání nejrůznějších evropských pracovních mentalit. Dále jsem řešil hybridní cloud ve velké firmě, orientované na trhy střední a východní Evropy. Posledních několik let se věnuji Devops pro velké zákazníky v Azure cloudu, spravuji kubernetes (AKS), Gitlab.

hardware

kvalitninavody.cz

Často umírající HDD v diskovém poli SYNOLOGY/QNAP? 12 rad co s tím

Bymirra

Jakým diskům se doporučím vyhnout do diskového pole

Vyřaďte možnost že vám disky ničí nebo jen odmítá diskové pole

12 rad které vám pomůžou vyhnout se ztrátě dat

Druhé diskové pole je levnější, než extrémně drahá obnova dat ve speciálních Laboratořích

Závěr

By mirra

Related Post

Geforce RTX řady 5000 mají defekt, který Linux nezjistí

HotSpot 105°C na Geforce RTX 3090

Levné čističky vzduchu jsou past na peníze a jak vybrat tu správnou

Napsat komentář Zrušit odpověď na komentář

You missed

Azure: This cluster is in a failed state. If you didn’t do an operation, AKS may resolve the provisioning status automatically if your cluster applicatins continue to run.

Úvod do umělé inteligence (AI): Díl 3. Ladíme rychlost LLM na vašem počítači QWEN-2.5 32B

mount(2) system call failed: No route to host.dmesg(1) may have more information after failed mount system call.

Epicky zaseknutý Proxmox VE – jak ho restartovat, když nejde restartovat