Runtime bad block total что это
Перейти к содержимому

Runtime bad block total что это

  • автор:

На моем SSD сейчас 226 плохих секторов. Это важно?

Добавьте следующие строки в конец вашего eclipse.ini:

Это позволяет использовать webkit вместо xulrunner.

1 ответ

Интеллектуальные данные нашего SSD говорят, что вы использовали SSD в течение 1331 часов, и ваш SSD понес 33308592070 * 512/1024 ^ 4 = 15,5 записей TiB. Это означает ca. 12 гигабайт записывает мощность на часах вашего SSD. Это характерно для типичного использования SSD для потребителей. Что вы используете для SSD?

Вы все еще находитесь ниже предела цикла записи вашего SSD, который основан на MLC, поэтому следует терпеть ca. 3000 циклов записи, что будет означать ок. 256 ГБ * 3000 = 768 ТБ. Поэтому я бы сказал, что вы в безопасности.

Но ваши данные SMART показывают, что теперь у вас уже 238 перераспределенных (сбой) секторов. Это число по-прежнему очень мало по сравнению с несколькими сотнями миллионов секторов вашего диска, но для меня удивительно, что после всего лишь 60-70 циклов записи ваш SSD имеет блокировку. У вас есть запасное место на вашем SSD? Для надежного управления износом накопителей на SSD требуется запасное пространство.

Вот график, показывающий SSD 840 PRO 256 ГБ при записи теста. Он имеет нулевое или очень близкое к нулю перераспределенные сектора после записи 300 ТБ. У вас более 200 после менее 20 ТБ.

Используется последняя прошивка накопителя. Я не хочу вас волновать, но я думаю, вам следует связаться с Samsung с выходом SMART и спросить о своем мнении. Я думаю, что ваш диск имеет какую-то проблему.

После ответа Samsung — кто в основном сказал, что все в порядке — я бы сказал, что до тех пор, пока вы не столкнетесь с потерей данных ( это до тех пор, пока злоумышленники обнаружены во время операции записи). Я думаю, вам тогда не следует беспокоиться.

Вы можете увидеть счет badblock в строке Runtime_bad_block (238, Raw value), которая является суммой Program_Fail_Cnt_Total (238, которая является неудачной операцией записи) Erase_Fail_Count_Total (0, которая является неудачной операции стирания) и неудачные операции чтения. Таким образом, неудачные операции чтения на вашем диске во время создания интеллектуального вывода были 238-238-0 = 0, поэтому у вас не было отказавшего чтения, у вас нет потери данных.

[d13 ] Если ваш диск начинает сталкиваться с неудачными чтениями в ближайшем будущем (это означает, что Runtime_bad_block не будет равняться Program_Fail_Cnt_Total + Program_Fail_Cnt_Total ), потенциальная потеря данных, я бы пересмотрел Samsung. До этого момента просто наслаждайтесь своим SSD.

hdd умирают?

Парковок многовато на ST2000DM, надо бы APM изменить и может шлейфы поменять, т.к. UDMA_CRC_Error_Count не 0.

APM на st2000dm отключил
А поменять шлейфы на более хорошие возможности не видно

а ещё — ТоталКоммандер более бережно копирует файлы чем другие программы 🙂

Runtime_Bad_Block это вроде смещение головки во время чтения данных. Системник ногой не лупишь часом? Про проверку шлейфов уже писали. Остальное ок.

Ну бывает, задеваю легонько, пару раз и посильнее было, но не на столько, чтоб прям столько ошибок появилось. Хотя у меня тут ж/д недалеко и иногда бывает ощутимая вибрация, не зная как жесткие к ней относятся и на сколько она вообще ощутима для них.

Способы проверить шлейфы есть?

Если честно никогда не заморачивался на счет шлейфов, их много валяется, поэтому просто менял и мониторил смарт дальше. На такой высокой скорости передачи данных даже не знаю чем можно проверить целостность без спец. оборудования.

Тоже не заморачивался по их поводу, поставил те, которые достались вместе с материнками. А эти ошибки никто не знает когда возникли вообще и при каких обстоятельствах

Русские Блоги

SMART мониторинг элементов исследования и механизм классификации работоспособности хранилища

В настоящий момент, когда технология механических жестких дисков является чрезвычайно развитой, обычным потребителям кажется, что повреждение жесткого диска все более и более отдалено.Ноутбук X200, который я использовал с тех пор, как купил его в 2009 году, не имел никаких проблем с этим жестким диском Hitachi. , Вроде нет смысла менять ноутбук.

Однако жестокая реальность такова, что для коммерческих приложений надежность жестких дисков потребительского класса по-прежнему вызывает беспокойство, особенно еслиBlackBlaze При этом используются жесткие диски потребительского уровня для создания системы хранения.

Верный UPYUN Другими словами, хотя наша основная система не использует устройства хранения потребительского класса, быстрый рост периферийных систем и большое количество жестких дисков начали оказывать огромное давление на количество оптимизированного персонала в отделе эксплуатации и обслуживания из-за обычного метода «повреждение-замена». В результате скопление дел и фрагментация времени сделали персонал разбросанным и перегруженным.

Так родилась тема этой статьи.При поддержке серии опросов и статистики, конечно же, благодаря всемогущему Google, мы наконец-то эффективно решили эту проблему.

S.M.A.R.T. Информация является чрезвычайно важным индикатором для UPYUN при мониторинге жестких дисков. Мы можем использовать ее для диагностики или даже прогнозирования состояния основного жесткого диска, чтобы удалить его из бизнес-системы до того, как жесткий диск выйдет из строя, чтобы не повлиять на онлайн-сервисы.

В то же время его также можно использовать для диагностики аномальной причины устройства хранения. Факторы, которые могут быть оценены, включают температуру, вибрацию, механический отказ и мгновенное воздействие. Это незаменимый метод низкоуровневого обнаружения для систем хранения, находящихся в эксплуатации и обслуживании.

Я извлек данные S.M.A.R.T. всего 3047 жестких дисков некоторых онлайн-машин для исследования и анализа и на основе этих необработанных данных суммировал некоторые элементы, которые могут эффективно определять состояние жестких дисков.

Согласно 61511 фрагментам данных после фильтрации недействительных данных, мы использовали некоторые элементы в качестве основы для оценки неисправности системы для удаления жесткого диска и прогнозирования необходимости замены жесткого диска.

Мы разделяем состояние жесткого диска на следующие уровни на основе ключевых данных мониторинга жесткого диска.

Уровень здоровья жесткого диска

Хороший "здоровый" уровень

Жесткие диски этого уровня очень здоровы без какого-либо риска. Обычно это недавно запущенные жесткие диски. Для жестких дисков, отмеченных как Good, проблем не будет, и не потребуется внимания и мониторинга.

Определение характеристик: все элементы оценки риска равны 0 или рост ключевых исходных данных ниже, чем стандарт «отчета».

Внимание Уровень «Отчет»

Жесткий диск, состояние здоровья которого указано в «Отчете» с предупреждением, имеет определенную степень ухудшения индикаторов мониторинга, но он все еще находится в безопасном диапазоне главного управления жестким диском. Главный управляющий чип может эффективно справиться с отклонением от нормы без каких-либо явных признаков ухудшения производительности. Он может поддерживать нормальную работу в течение длительного времени, но необходимо учитывать, что его работоспособность может быть повышена до уровня тревоги в любое время.

Характерное определение: Любой элемент риска соответствует стандарту «отчет».

Угрожающий класс

Жесткий диск, состояние здоровья которого имеет значение «Угроза« Предупреждение », уже имеет определенный риск снижения производительности, поскольку некоторые ситуации, которые не может контролировать основной управляющий чип, уже произошли, и его производительность, возможно, немного снизилась, а его состояние здоровья постепенно отклоняется от основного управляющего чипа. Система управления должна отправить аварийное уведомление обслуживающему персоналу и обслуживающему персоналу и рассмотреть возможность удаления жесткого диска из бизнес-системы для замены как можно скорее, чтобы предотвратить его переход на уровень снижения при одновременном выполнении онлайн-сервисов.

Характерное определение: любой предмет риска соответствует стандарту «предупреждения».

Действие при обработке: примите меры для замены жесткого диска, когда это позволит рабочая сила, и обычно есть достаточно времени для замены жесткого диска от предупредительного сигнала до периода отказа. Если он случайно войдет в рецессию, система автоматически изолирует его от бизнес-системы.

Снижение уровня «Снижение»

Жесткие диски, состояние здоровья которых имеет значение «Снижение», не следует использовать в сети. В принципе, жесткие диски, находящиеся на уровне предупреждения, следует заменять, поскольку жесткие диски с «ухудшением» имеют большой потенциал повлиять на бизнес-систему при использовании для онлайн-сервисов. Общая операция представляет собой угрозу, обычно проявляющуюся в снижении производительности бизнес-системы, ошибках чтения и записи данных, тайм-аутах и ​​т. Д. Однако жесткие диски, которые только что вышли на уровень «спада», обычно не вызывают ошибок системного уровня, и о них можно судить только с точки зрения снижения производительности. Случай.

Характеристика: любая статья риска соответствует стандарту «рецессия»

Действие обработки: система автоматически удалит его из бизнес-системы, но, если он не может быть временно заменен по разным причинам, он должен быть физически отключен от устройства как можно скорее, чтобы избежать состояния жесткого диска, близкого к «аварийному» уровню, и вызвать систему Произошло исключение (например, зависание процесса).

Класс бедствия

Жесткие диски со статусом «Disaster» обычно не отображаются ни в одной сетевой системе. После включения механизма классификации жестких дисков теоретически будут "аварийные" жесткие диски. Единственными условиями являются внезапное повреждение жесткого диска, вызванное сильным электрическим током, внезапным отключением питания или током, и нечитаемое из-за отказа микросхемы S.M.A.R.T. Жесткие диски этого уровня вообще не могут работать.

  1. Встречаются ряд «падающих» характеристик.
  2. Или информация S.M.A.R.T. не читается.
  3. Имеется много аварийных сигналов системного уровня или их просто невозможно идентифицировать.

Действие обработки: заменить!

Подробное описание ключевых элементов мониторинга S.M.A.R.T.

Raw_Read_Error_Rate Частота ошибок необработанного чтения

ID: 1, пункт тревоги:

  • Порог: чрезвычайно высокая скорость роста в единицу времени
  • Описание: частота ошибок при чтении необработанных данных с жесткого диска. Ненулевое значение указывает на проблему с поверхностью диска или головкой чтения / записи.
  • Воздействие: значительное увеличение этих данных обычно указывает на то, что жесткий диск старый и его следует рассмотреть для замены из онлайн-среды, но в краткосрочной перспективе серьезных проблем не возникнет, но это в определенной степени повлияет на производительность, а скорость роста стоимости очень высока. Более крупные корпуса также могут в большей степени повлиять на производительность жесткого диска.

Поскольку каждый производитель определяет это значение по-разному, нет сильной корреляции между увеличением значения и рабочим состоянием жесткого диска, поэтому оно не используется в качестве элемента для определения уровней предупреждения и снижения.

Seek_Error_Rate Частота ошибок поиска

  • Порог: чрезвычайно высокая скорость роста в единицу времени
  • Описание: Частота ошибок при позиционировании данных
  • Воздействие: при значительном увеличении объема данных производительность жесткого диска будет иметь определенное влияние, но он все еще может нормально работать без немедленной отрыжки, но существует определенный риск. Если данные и исходная частота ошибок чтения увеличиваются одновременно, жесткий диск может Когда механические характеристики ухудшаются, звук становится громче, увеличивается вибрация или даже возникает неприятный шум, следует как можно скорее заменить или списать.

Поскольку каждый производитель определяет это значение по-разному, нет сильной корреляции между увеличением значения и рабочим состоянием жесткого диска, поэтому оно не используется в качестве элемента для определения уровней предупреждения и снижения.

Reallocated_Sector_Ct Количество секторов перераспределения

  • Порог: «Предупреждение» не равно 0
  • Примечание. Когда жесткий диск обнаруживает ошибку чтения / записи / проверки, он помечает сектор как «Перераспределенный» и перемещает данные в зарезервированную область.
  • Воздействие: состояние жесткого диска ухудшилось до такой степени, что оно не только влияет на производительность, но даже вызывает риски для целостности данных. Его не нужно спасать, и его следует немедленно заменить или списать. В настоящее время он все еще может полагаться на усилия основной системы управления в течение определенного периода времени. Но риск вырос до неконтролируемого уровня.

Unexpect_Power_Loss_Ct / Power-off Retract Count / Emergency Retract Cycle Count Количество аномальных сбоев питания

ID: 174/192, тревога:

  • Порог: увеличение
  • Примечание. Если обнаружено увеличение значения, проверьте, нет ли в оборудовании сбоя питания или ненормального источника питания.
  • Воздействие: увеличение значения счетчика обычно указывает на аварийное отключение устройства. Если этот аварийный сигнал возникает на одном жестком диске, следует учитывать неисправность кабеля или материнской платы. Значение контроля этого значения в основном заключается в оценке сбоя источника питания устройства, а не аварийного отключения, поскольку Внешняя система обнаружения может быстрее обнаружить ненормальное отключение.

Wear_Leveling_Count Среднее количество стирания и записи частиц

Порог:
Уровень предупреждения ХУДШИЕ данные (не RAW) ниже 15;
Распад ХУДШИХ данных (не RAW) меньше или равен 1.

Примечание. Элементы, относящиеся к твердотельным накопителям, используются для оценки срока службы твердотельных накопителей. Из-за стандартов оценки различных производителей RAW VALUE не является стандартом.

Воздействие: когда жесткий диск переходит в уровень предупреждения, вам следует подумать о его замене, потому что значение этого элемента уменьшено до 0 и нет сильной корреляции с рабочим состоянием жесткого диска, но даже если нет отклонений от нормы во всех индикаторах, не рекомендуется чрезмерное обслуживание, когда он используется в сети.

Обычно считается, что когда значение равно нулю, расчетный срок службы жесткого диска достигнут.

Runtime_Bad_Block Количество плохих блоков во время выполнения

  • Порог: уровень отчета: больше 1
  • Примечание. Это значение представляет количество сбойных блоков, возникающих при работе жесткого диска, обычно значение равно нулю.
  • Воздействие: нет сильной корреляции между этим значением и рабочим состоянием жесткого диска. Это значение означает, что плохие блоки встречаются во время работы, но для устройств хранения NAND плохие блоки не так чувствительны, как механические жесткие диски, и мастер может хорошо справиться с этими проблемами. , Но это значение связано с надежностью и стабильностью жесткого диска и требует пристального внимания.

По статистике количество повышений стоимости всех онлайн-SSD очень невелико. Конкретное влияние на надежность и производительность необходимо наблюдать позже, поэтому сначала необходимо установить его как элемент мониторинга на уровне отчета.

End-to-End_Error Ошибка сквозной проверки

  • Порог: ненулевое значение
  • Описание: количество ошибок проверки передачи данных между хостом и жестким диском.
  • Воздействие: это значение встречается крайне редко, и ни один из более чем 3000 жестких дисков, которые я использовал для тестирования, не показал этого значения. Согласно данным, увеличение этого значения обычно связано с проблемами со средой передачи, такой как кабели или интерфейсы SATA. Попробуйте подключить или заменить линию передачи.

Так как случаев не обнаружено, этот элемент в настоящее время настроен на уровень отчета.

Reported_Uncorrect Неустранимая ошибка

ID: 187, уровень тревоги:

  • Примечание. Ненулевое значение этого элемента означает, что на жестком диске возникла серьезная проблема, и это означает, что мастер подтвердил, что начали появляться ошибки, которые нельзя исправить никакими средствами, включая аппаратный ECC.
  • Воздействие: такие жесткие диски следует немедленно заменять и не использовать.

COMMAND_TIMEOUT Тайм-аут команды

ID: 188, уровень тревоги:

Порог:
Уровень предупреждения: ненулевой
Уровень распада: выше 10
Уровень бедствия: выше 1000000

Примечание. Значение этого элемента не равно нулю и продолжает увеличиваться, указывая на то, что скорость реакции жесткого диска снизилась и производительность сильно пострадала.

Воздействие: его необходимо заменить немедленно, но, поскольку значение не вызовет серьезных ошибок при первом повышении, может быть сложно вызвать тревогу. Его независимое повышение практически не повлияет на производительность жесткого диска, но постепенно ухудшится до серьезного риска снижения производительности. .

Согласно опыту, обычно считается, что это значение связано с SMART187 и SMART183, и появление двух вышеупомянутых может (см. Частоту чтения и записи) привести к тому, что значение будет продолжать увеличиваться.

High_Fly_Writes Голова работает на ненормальной высоте

ID: 189, уровень тревоги:

  • Порог: больше 1 или больше
  • Примечание. Если значение не равно нулю, это указывает на то, что жесткий диск может быть поврежден или могут быть механические неисправности.
  • Воздействие: необходимо внимательно следить за тем, есть ли ухудшение.Постоянное увеличение этого значения может привести к снижению производительности оборудования, поскольку увеличение этого значения означает увеличение количества операций, которые были прерваны без завершения.

G-sense Error Rate Предупреждение датчика ускорения

ID: 191, уровень тревоги:

  • Порог: увеличение
  • Примечание. Встроенный датчик ускорения корпуса диска обнаруживает удар во время работы, который может вызвать повреждение жесткого диска.
  • Воздействие: это значение относительно редкое, но оно означает, что внешняя среда резко изменилась, например, сервер пострадал от землетрясения и т. Д. Когда все серверы в компьютерном зале обнаруживают повышение этого значения, обратитесь в компьютерный зал, чтобы узнать, сильно ли изменилась среда или произошло землетрясение. .

Temperature_Celsius Или Airflow_Temperature_Celsiu Температура / температура воздушного потока

ID: 194 или 190, уровень тревоги:

Порог:
Уровень отчета: 52
Уровень предупреждения: 62

Описание: Рабочая температура жесткого диска.

Current_Pending_Sector Текущее количество секторов для отображения

ID: 197, уровень тревоги:

Порог:
Уровень отчета: ненулевой
Уровень предупреждения: 3
Уровень распада: 10

Примечание. Данные этого параметра указывают количество «нестабильных» секторов, то есть количество секторов, «ожидающих отображения».

Следовательно, эта небольшая ошибка не будет иметь серьезных последствий, но значение этого пункта меняется быстро или в большой степени, следует учитывать, есть ли у жесткого диска проблемы со стабильностью.

Offline Uncorrectable / Uncorrectable Sector Count Количество секторов щита

ID: 198, уровень тревоги:

Порог:
Уровень отчета: 3

Объяснение: Этот элемент данных представляет собой количество секторов, которые были замаскированы мастером диска, подтверждающим сбой.

Воздействие: теоретически это значение слишком велико, чтобы вызвать риск передачи данных. Статистика показывает, что для большинства дисков эти данные равны нулю. Однако ненулевое значение не сильно связано с ухудшением производительности или отказом диска.Ценность проблемного диска обычно выше, поэтому он устанавливается на уровне отчета для дальнейшего изучения.

Runtime bad block total что это

Это нормально, или несовсем?

=== START OF INFORMATION SECTION ===
Device Model: ST3000DM001-9YN166
Serial Number: Z1F1RC3H
LU WWN Device Id: 5 000c50 04f08248f
Firmware Version: CC4H
User Capacity: 3 000 592 982 016 bytes [3,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Mon May 20 03:27:51 2013 PDT
SMART support is: Available — device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 584) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 099 006 Pre-fail Always — 86713136
3 Spin_Up_Time 0x0003 092 092 000 Pre-fail Always — 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always — 403
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always — 0
7 Seek_Error_Rate 0x000f 065 060 030 Pre-fail Always — 3380314
9 Power_On_Hours 0x0032 099 099 000 Old_age Always — 1036
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always — 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always — 276
183 Runtime_Bad_Block 0x0032 001 001 000 Old_age Always — 196
184 End-to-End_Error 0x0032 100 100 099 Old_age Always — 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always — 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always — 0
189 High_Fly_Writes 0x003a 099 099 000 Old_age Always — 1
190 Airflow_Temperature_Cel 0x0022 066 046 045 Old_age Always — 34 (Min/Max 26/34)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always — 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always — 107
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always — 1924
194 Temperature_Celsius 0x0022 034 054 000 Old_age Always — 34 (0 18 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always — 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline — 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always — 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline — 232924666397504
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline — 6442397722709
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline — 23389637857316

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 5 —

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *