Технология самотестирования, анализа и отчетности (S.M.A.R.T.) — это новый промышленный стандарт, в котором описаны методы, позволяющие предсказать появление ошибок жесткого диска. При активизации системы S.M.A.R.T. жесткий диск начинает отслеживать определенные параметры, чувствительные к неисправностям накопителя или указывающие на них. На основе отслеживаемых параметров можно предсказать сбои в работе накопителя. Если расчетная вероятность появления ошибки возрастает, S.M.A.R.T. генерирует для BIOS или драйвера операционной системы отчет о возникшей неполадке, который указывает пользователю на необходимость немедленного резервного копирования данных до того момента, когда в накопителе произойдет реальный сбой.
На основе отслеживаемых параметров S.M.A.R.T. пытается определить тип ошибки. По данным компании Seagate, 60% ошибок механические. Именно этот тип ошибок и предсказывается S.M.A.R.T. Разумеется, не все ошибки можно предсказать, например появление статического электричества, внезапную встряску или удар, термальные перегрузки и т.д.
Технология S.M.A.R.T. была разработана IBM в 1992 году. В том же году IBM выпустила жесткий диск формата 3,5 дюйма с модулем Predictive Failure Analysis (PFA), который измерял некоторые параметры накопителя и в случае их критического изменения генерировал предупреждающее сообщение. IBM передала на рассмотрение организации ANSI спецификацию технологии предсказания ошибок накопителя, и в результате появился стандарт ANSI — протокол S.M.A.R.T. для устройств SCSI (документ X3T10/94190).
Интерес к развитию этой технологии привел к созданию в 1995 году рабочей группы с участием IBM, Seagate Technology, Conner Peripherals (в настоящее время является подразделением Seagate), Fujitsu, Hewlett-Packard, Maxtor, Quantum и Western Digital. Результатом их работы стала спецификация S.M.A.R.T. для накопителей на жестких дисках с интерфейсами ATA и SCSI, и они сразу же появились на рынке.
В накопителях на жестких дисках с интерфейсами IDE/ATA и SCSI реализация S.M.A.R.T. подобна, за исключением отчетной информации. В накопителях с интерфейсом IDE/ATA драйвер программного обеспечения интерпретирует предупреждающий сигнал на копителя, генерируемый командой S.M.A.R.T. report status. Драйвер запрашивает у накопителя статус этой команды. Если ее статус интерпретируется как приближающийся крах жесткого диска, то операционной системе отсылается предупреждающее сообщение, а та, в свою очередь, информирует об ошибке пользователя. Такая схема в будущем может дополняться новыми свойствами. Операционная система может интерпретировать атрибуты, которые передаются с помощью расширенной команды report status. Что касается накопителей с интерфейсом SCSI, то в этом случае S.M.A.R.T. информирует пользователя только о двух состояниях накопителя — о нормальной работе и об ошибке.
Замечу, что традиционные программы диагностики диска, например Scandisk, работают с секторами данных на поверхности диска и не отслеживают всех функций накопителя в целом. В некоторых современных накопителях на жестких дисках резервируются секторы, которые в будущем используются вместо дефектных. Как только “вступает в дело” один из резервных секторов, S.M.A.R.T. информирует об этом пользователя, в то время как программы диагностики диска не сообщают о каких-либо проблемах.
Каждый производитель накопителей на жестких дисках по-своему реализует параметры монитора S.M.A.R.T., причем большинство из них реализовали собственный набор параметров. В некоторых накопителях отслеживается высота “полета” головок над поверхностью диска. Если эта величина уменьшается до некоторого критического значения, то накопитель генерирует ошибку. В других накопителях выполняется мониторинг кодов коррекции ошибок, который показывает количество ошибок чтения и записи на диск. В большинстве дисков реализована регистрация следующих параметров:
Каждый параметр имеет пороговое значение, которое используется для определения того, появилась ли ошибка. Это значение устанавливается производителем накопителя и не может быть изменено.
Существует ряд простых требований, выполнение которых обеспечит корректное функционирование S.M.A.R.T.; для этого необходимы S.M.A.R.T.-совместимый накопитель на жестких дисках и система BIOS, поддерживающая данную технологию, или драйвер жесткого диска для используемой операционной системы. Если BIOS не поддерживает технологию S.M.A.R.T., воспользуйтесь служебными программами (утилитами), которые обеспечат нужную поддержку. К программам такого рода относятся Norton Utilities от Symantec, EZ Drive от StorageSoft и Data Advisor от Ontrack.
Существенное изменение контролируемых параметров инициирует предупреждения S.M.A.R.T., накопитель передает предупреждение с помощью соответствующей команды IDE/ATA или SCSI (в зависимости от типа имеющегося дисковода) драйверу жесткого диска, который находится в системной BIOS. Драйвер выводит это сообщение во время следующей загрузки и выполнения теста POST.
Если необходимы более полные и оперативные сведения, воспользуйтесь специальной утилитой, получающей данные S.M.A.R.T. от накопителя, например SMART Explorer от компании Adenix (www.adenix.net) или HDD Health от Panterasoft (www.panterasoft.com).
При получении предупреждающего сообщения, прежде всего, необходимо обратить внимание на его содержание и создать резервную копию всех данных, хранящихся на жестком диске. Для создания резервных копий используйте только новые носители. Не стоит записывать копируемые данные поверх ранее созданных качественных копий, так как сбой в работе может произойти до того, как будет завершен процесс резервирования.
Что делать после того, как будет создана резервная копия данных? Предупреждение S.M.A.R.T. может быть вызвано внешними причинами, и оно далеко не всегда указывает на возможные сбои в работе накопителя. Например, иногда предупреждающий сигнал инициируется при изменении климатических условий, в частности повышении или понижении температуры окружающей среды. К этому может привести также чрезмерная вибрация накопителя, вызванная какими-нибудь внешними причинами. Кроме того, одной из причин появления подобных сообщений являются электрические помехи, возникающие при работе электродвигателей или других устройств, включенных в одну сеть с компьютером.
В том случае, если предупреждение вызвано внутренними причинами, в сообщении может говориться о необходимость замены накопителя. Если устройство находится на гарантии, обратитесь к поставщику и выясните, готов ли он его заменить. Отсутствие дальнейших сообщений говорит о случайности возникшей проблемы; в этом случае к замене накопителя прибегать не придется. Если во время работы появляются новые сообщения, рекомендую всетаки заменить используемый накопитель. Если удастся подключить новый и существующий (сбойный) накопители в одной системе, попробуйте перенести содержимое одного накопителя на другой, что позволит избежать повторной инсталляции приложений и загрузки скопированных данных.