Впервые обнародованы данные по отказам жестких дисков на более чем 100.000 реальных случаях. Эти данные развеивают некоторые распространенные мифы. Самые интересные выводы исследователей:
1) Процент отказа жестких дисков за год работы значительно превышает прогнозы производителей - это как минимум 3%, но может доходить и до 13.5%. Так что новые винчестеры тоже надо контролировать.
2) Отказы винчестеров не связаны с типом их интерфейса, SCSI, SATA или оптоволоконным. Самый надежный массив был составлен из SATA дисков, хотя бытует мнения, что они менее надежны, чем SCSI или оптоволоконные.
3) Бездоказательно считалось, что жесткие диски несколько чаще отказывают в начальные период эксплуатации, затем несколько лет работают с низкой вероятностью отказа, а уже потом начинают изнашиваться и отказывать. Реальные данные опровергли эту теорию. Вероятность отказа диска по времени непрерывно постепенно возрастает, без "плато".
4) Считается, что "у каждого диска своя судьба". Однако в реальной жизни эти судьбы часто оказываются похожи. Отказы дисков одной партии сильно коррелируют между собой. Если отказал один диск из партии, вероятно, скоро откажет еще один. Если вы используете распределенные массивы дисков (RAID-массивы), - желательно распределять диски из одной партии в разные массивы, во избежание потери данных из-за отказа дисков-"родственников".
5) Говорят, что "чем сильнее используется диск, тем раньше он умрет". Связь между загрузкой дисков и их "смертностью" оказалась значительно слабее, чем ожидалось. Более того, был обнаружен обратный эффект! Малозагруженные диски часто отказывали чаще, чем среднезагруженные, а в случае дисков трехлетнего возраста малозагруженные отказывали чаще, чем сильнозагруженные.
6) Бытует мнение, что "высокая температура диска - ведет к его отказу". С точностью до наоборот - была обнаружена явная обратная связь между температурой диска и его отказом. Это не так только для очень высоких температур (выше 55 градусов Цельсия). Связь между высокой температурой и отказами была установлена только для дисков трехлетнего возраста. Автор статьи считает, что это связано с тем, что производители, проводя для новых моделей дисков температурные тесты, "эволюционно научились" производить диски, более устойчивые к высоким температурам, однако ценой ухудшения характеристик работы при низких.
7) SMART и отказы. (SMART или S.M.A.R.T. - внутренняя диагностическая система жесткого диска, по параметрам которой можно судить о его "здоровье") Вообще говоря, любой негативный "диагноз" системы SMART является признаком возможной скорой "смерти" диска. По данным исследования в течение 8 месяцев после первой ошибки SMART 30% дисков отказывают полностью. С другой стороны, 36% отказов дисков происходит "без какой либо видимой причины и предупреждения", они не выдают ошибки SMART, и их рабочая температура не превышает нормальной. Крупные фирмы, использующие для хранения данных распределенные массивы дисков, могут продолжать использовать диски даже после обнаружения ошибок SMART, поспешная замена дисков не оправдывает себя экономически. А вот пользователям персональных компьютеров рекомендуется после выявления ошибки SMART серьезно задуматься о полном резервном копировании важных данных, если, конечно, они не хотят их потерять или платить большие суммы за "спасение" информации с отказавшего винчестера без каких-либо гарантий. Автор статьи, Валери Хенсон, утверждает, что своевременное выявление ошибок SMART и копирование данных дважды уберегло ее лично от проблем с потерей данных в результате отказа жесткого диска в ноутбуке.
Источник: Opinion: Real-world disk failure rates offer surprises, Valerie Henson - Linux file systems consultant specializing in file system check and repair.
Документы:
№1 Failure Trends in a Large Disk Drive Population
№2 Disk failures in the real world: What does an MTTF of 1,000,000 hours mean to you?
От себя также добавлю, что о регулярном резервном копировании данных в абсолютно любом случае забывать не стоит. Напоминаю - 36% отказов дисков происходит без каких-либо предупредительных сигналов.
Источник:http://forum.obozrevatel.com/viewtopic.php?t=14876