Bude to asi trochu náročnější čtení, ale směle do toho.
Pro lenivce
souhrn hned na začátku- pokud vám tuhne nějaká aplikace nebo systém, podívejte se i na zdraví disku
- můj problém: proč se ze SMART dat ztratil záznam o vadných blocích?
Full verze:Včera mi začal tuhnout FF. Po kratším ohledání jsem zjistil, že mám zvýšené
I/O wait, takže jsem hledal problémy s diskem, a taky že jo.
SMART (viz
current-pending a
raw-read)
ATA SMART: Updated at Mon 15 Mar 2010 10:38:52 PM CET
overall assessment: Disk has a few bad sectors
===============================================================================
Attribute Current|Worst|Threshold Status Value Type Updates
===============================================================================
raw-read-error-rate 200|200| 51 good 179 Pre-fail Online
spin-up-time 157|156| 21 good 3.1 secs Pre-fail Online
start-stop-count 100|100| 0 n/a 557 Old-age Online
reallocated-sector-count 200|200|140 good 0 sectors Pre-fail Online
seek-error-rate 200|200| 0 n/a 0 Old-age Online
power-on-hours 96| 96| 0 n/a 125.8 days Old-age Online
spin-retry-count 100|100| 0 n/a 0 Old-age Online
calibration-retry-count 100|100| 0 n/a 0 Old-age Online
power-cycle-count 100|100| 0 n/a 555 Old-age Online
power-off-retract-count 200|200| 0 n/a 11 Old-age Online
load-cycle-count 200|200| 0 n/a 557 Old-age Online
temperature-celsius-2 102| 94| 0 n/a 41C / 106F Old-age Online
reallocated-event-count 200|200| 0 n/a 0 Old-age Online
current-pending-sector 200|200| 0 n/a 2 sectors Old-age Online
offline-uncorrectable 200|200| 0 n/a 0 sectors Old-age Offline
udma-crc-error-count 200|200| 0 n/a 0 Old-age Online
multi-zone-error-rate 200|200| 0 n/a 0 Old-age Offline
dmesg (oblíbený
DRDY ERR a
Unrecovered read error - auto reallocate failed)
ata4.01: BMDMA stat 0x64
ata4.01: cmd c8/00:20:8f:0d:b1/00:00:00:00:00/f8 tag 0 dma 16384 in
res 51/40:00:a4:0d:b1/00:00:00:00:00/f8 Emask 0x9 (media error)
ata4.01: status: { DRDY ERR }
ata4.01: error: { UNC }
ata4.00: configured for UDMA/133
ata4.01: configured for UDMA/133
ata4: EH complete
ata4.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata4.01: BMDMA stat 0x64
ata4.01: cmd c8/00:20:8f:0d:b1/00:00:00:00:00/f8 tag 0 dma 16384 in
res 51/40:00:a4:0d:b1/00:00:00:00:00/f8 Emask 0x9 (media error)
ata4.01: status: { DRDY ERR }
ata4.01: error: { UNC }
ata4.00: configured for UDMA/133
ata4.01: configured for UDMA/133
ata4: EH complete
ata4.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata4.01: BMDMA stat 0x64
ata4.01: cmd c8/00:20:8f:0d:b1/00:00:00:00:00/f8 tag 0 dma 16384 in
res 51/40:00:a4:0d:b1/00:00:00:00:00/f8 Emask 0x9 (media error)
ata4.01: status: { DRDY ERR }
ata4.01: error: { UNC }
ata4.00: configured for UDMA/133
ata4.01: configured for UDMA/133
Unhandled sense code
Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Descriptor sense data with sense descriptors (in hex):
72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
08 b1 0d a4
Add. Sense: Unrecovered read error - auto reallocate failed
end_request: I/O error, dev sdb, sector 145821092
ata4: EH complete
badblocks:
Pass completed, 159 bad blocks found.Problém byl v tom, že se jednalo o read error (ne write), a tak nedošlo k automatické realokaci vadného sektoru. FF tuhnul dál.
raw-read a
pending-sectors se postupně zvyšovaly (na stovky, respektive desítky).
Nevadí, našel jsem
úžasnou stránku, kde je problém popsán i s řešením, a zjistil, že je problém v
cache souborech FF, které se nedají přečíst.
Navrhnuté řešení spočívalo v tom, že se člověk pokusil o zápis do poškozeného souboru, a pokud by se to nepovedlo, vadný blok by byl automaticky realokován (kýžený
write error). Navrhované
dd do souboru nemělo žádný účinek, a tak jsem zkusil
shred poškozených
cache souborů. Ten zafungoval až moc zázračně.
V čem je problém? Vše funguje jak po čisté instalaci, jen po vadných blocích ani památky. V logách není nikde vidět, že by byly realokovány. Jak je to možné?
SMART teď (disk jako nový)
ATA SMART: Updated at Tue 16 Mar 2010 12:29:23 PM CET
overall assessment: Good
===============================================================================
Attribute Current|Worst|Threshold Status Value Type Updates
===============================================================================
raw-read-error-rate 200|200| 51 good 804 Pre-fail Online
spin-up-time 157|156| 21 good 3.1 secs Pre-fail Online
start-stop-count 100|100| 0 n/a 558 Old-age Online
reallocated-sector-count 200|200|140 good 0 sectors Pre-fail Online
seek-error-rate 100|253| 0 n/a 0 Old-age Online
power-on-hours 96| 96| 0 n/a 126.0 days Old-age Online
spin-retry-count 100|100| 0 n/a 0 Old-age Online
calibration-retry-count 100|100| 0 n/a 0 Old-age Online
power-cycle-count 100|100| 0 n/a 556 Old-age Online
power-off-retract-count 200|200| 0 n/a 11 Old-age Online
load-cycle-count 200|200| 0 n/a 558 Old-age Online
temperature-celsius-2 101| 94| 0 n/a 42C / 108F Old-age Online
reallocated-event-count 200|200| 0 n/a 0 Old-age Online
current-pending-sector 200|200| 0 n/a 0 sectors Old-age Online
offline-uncorrectable 200|200| 0 n/a 0 sectors Old-age Offline
udma-crc-error-count 200|200| 0 n/a 0 Old-age Online
multi-zone-error-rate 200|200| 0 n/a 0 Old-age Offline
Očekával bych záznam v
reallocated-sector-count, příp. v
reallocated-event-count. Ale nic.
Badblocks také hlásí čisto. Jak to? (Jinak disk je to WD, cca rok starý.)
Díky za příp. postřehy.