Fórum Ubuntu CZ/SK
Ostatní => Ubuntu Server => Téma založeno: marshall1727 01 Ledna 2013, 15:46:28
-
nazdar vespolek,
v serveru 10.04 mi po letech provozu umírá WD raptor a chystám se přesunout systém na jiný disk - stejný typ WD raptor, mám v serveru 4 kusy. dospěl jsem k tomu, že použiji dd nebo ddrescue. teda asi ten druhý, abych nemusel řešit možné chyby v čtení obsahu disku. chci tedy udělat zhruba něco takového:
> dd if=/dev/sda of=/media/backup/sda.img
> diff -rq /dev/sda /media/backup/sda.img
pokud nebudou souhlasit tak totéž s ddrescue
> dd if=/media/backup/sda.img of=/dev/sdd
Až sem jsem se dočetl téměř vše, ale nemohu se dopátrat jak následně změnit bootovací pořádek. Jesli to dobře chápu tak, v důsledku "dd" se na /dev/sdd vytvoří stejné partišny jaké byly na /dev/sda, (sda1 jako / a sda5 jako /swap) tedy vzniknou sdd1 a sdd5. sda1 a sda5 jsou ve fstabu připojeny přes UUID. bude možné ty nové sdd1 a sdd5 připojit pomocí /dev/sdd1 a /dev/sdd5? celé to je ještě tak, že ten /dev/sdd je připojen ve fstabu přes LABEL=.
díky.
m.
-
nějak to co chcete udělat nechápu
přijde mi to, že chcete dělat blokové operace nad celým diskem, ze kterého jsou připojené partišny - pokud ano, tak to tímto způsobem nedělejte...
pokud máte disk, který odchází a shodný nový nepoužitý disk (nejsou na něm žádná data, nikde nebyl připojen a nebude pak chybět), tak realizujte původní záměr přenosu obsahu celého disku jako blokového zařízení pomocí nějaké live distribuce (http://www.sysresccd.org/SystemRescueCd_Homepage (http://www.sysresccd.org/SystemRescueCd_Homepage))
-
ano, budu to dělat z liveCD. to co jsem dával do kódu, je jen popis toho přenosu. samozřejmě to zahrnuje i zazálohování systému, fyzické odpojení ostatních disků apod.
jak to ale bude po přenosu bitové kopie s bootováním z nového disku? musím znám UUID nového disku? nebo mohu použít klasické /dev/sdd1?
-
za použití livecd můžete jít rovnou starý_disk->nový_disk
tím se přenese i rozdělení disku, případný zavaděč, partišny včetně UUID - prostě to bude klon se vším všudy
předpokládám, že jediné, co nebude sedět, bude odkazování pomocí by-id
-
to je přesně co jsem potřeboval vědět. díky moc.
-
nicméně pokud odchází disk a již není možné jej bez chyb přečíst, tak bych uvažoval spíš nad čistou instalací, než si tam takto zanést chyby...
-
ty chyby hlásí SMART už pěkně dlouho a nic jiného se se systémem neděje. pokud jsem se pokul pochopit to, co mi SMART hlásí, tak většina jsou chyby jiné než problémy se čtením disku. vypadá to nějak takto:
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Raptor family
Device Model: WDC WD1500ADFD-00NLR5
Serial Number: WD-WMAP42073271
Firmware Version: 21.07QR5
User Capacity: 150,039,945,216 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 published, ANSI INCITS 397-2005
Local Time is: Tue Jan 1 17:36:35 2013 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.
General SMART Values:
Offline data collection status: (0x85) Offline data collection activity
was aborted by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 121) The previous self-test completed having
the read element of the test failed.
Total time to complete Offline
data collection: (4783) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 72) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x103f) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 188 039 051 Pre-fail Always In_the_past 58
3 Spin_Up_Time 0x0007 165 164 021 Pre-fail Always - 4791
4 Start_Stop_Count 0x0032 100 100 040 Old_age Always - 43
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000a 200 200 051 Old_age Always - 0
9 Power_On_Hours 0x0032 044 044 000 Old_age Always - 41248
10 Spin_Retry_Count 0x0012 100 253 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 253 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 43
194 Temperature_Celsius 0x0022 090 089 000 Old_age Always - 57
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 198 198 000 Old_age Always - 58
198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 198 051 Old_age Offline - 0
SMART Error Log Version: 1
ATA Error Count: 2780 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 2780 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 48 80 19 e2 Error: UNC 8 sectors at LBA = 0x02198048 = 35225672
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 47 80 19 42 00 14d+01:48:26.850 READ DMA
27 00 00 00 00 00 40 00 14d+01:48:26.850 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 00 14d+01:48:26.850 IDENTIFY DEVICE
ef 03 46 00 00 00 00 00 14d+01:48:26.850 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 40 00 14d+01:48:26.850 READ NATIVE MAX ADDRESS EXT
Error 2779 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 48 80 19 e2 Error: UNC 8 sectors at LBA = 0x02198048 = 35225672
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 47 80 19 42 00 14d+01:48:23.700 READ DMA
27 00 00 00 00 00 40 00 14d+01:48:23.700 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 00 14d+01:48:23.700 IDENTIFY DEVICE
ef 03 46 00 00 00 00 00 14d+01:48:23.700 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 40 00 14d+01:48:23.700 READ NATIVE MAX ADDRESS EXT
Error 2778 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 47 80 19 e2 Error: UNC 8 sectors at LBA = 0x02198047 = 35225671
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 47 80 19 42 00 14d+01:48:20.600 READ DMA
27 00 00 00 00 00 40 00 14d+01:48:20.600 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 00 14d+01:48:20.600 IDENTIFY DEVICE
ef 03 46 00 00 00 00 00 14d+01:48:20.600 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 40 00 14d+01:48:20.600 READ NATIVE MAX ADDRESS EXT
Error 2777 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 47 80 19 e2 Error: UNC 8 sectors at LBA = 0x02198047 = 35225671
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 47 80 19 42 00 14d+01:48:17.600 READ DMA
ca 00 08 97 32 04 40 00 14d+01:48:17.600 WRITE DMA
ca 00 10 87 32 04 40 00 14d+01:48:17.600 WRITE DMA
ca 00 08 7f 32 04 40 00 14d+01:48:17.600 WRITE DMA
ca 00 78 07 32 04 40 00 14d+01:48:17.600 WRITE DMA
Error 2776 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
When the command that caused the error occurred, the device was doing SMART Offline or Self-test.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 48 80 19 e2 Error: UNC 8 sectors at LBA = 0x02198048 = 35225672
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 08 47 80 19 42 00 14d+01:43:38.900 READ DMA
27 00 00 00 00 00 40 00 14d+01:43:38.900 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 00 00 14d+01:43:38.900 IDENTIFY DEVICE
ef 03 46 00 00 00 00 00 14d+01:43:38.900 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 40 00 14d+01:43:38.900 READ NATIVE MAX ADDRESS EXT
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 41244 35225671
# 2 Conveyance offline Completed: read failure 90% 20834 35224872
# 3 Extended offline Completed: read failure 90% 20830 35224872
# 4 Short offline Completed without error 00% 13453 -
# 5 Short offline Completed without error 00% 13354 -
# 6 Extended offline Completed: read failure 90% 13316 19630288
# 7 Short offline Completed without error 00% 13316 -
# 8 Short offline Completed without error 00% 13316 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
-
Dobrý večer,
díky za rady, výměna disku proběhla téměř bez problémů. Dovolím si pár poznámek pro někoho kdo by to chtěl dělat podobně jako já, které jsem nevyčetl z dokumentace.
- pokud podezříváte svůj disk, že má vadné sektory, tak počítejte s tím, že "dd" spadne pokud při čtení na chybu narazí.
- toto je schopen obejít "ddrescue"
- "ddrescue" není na livedvd naistalován a je potřeba ho stáhnout z netu. je v balíčku gddrescue. počítač tedy potřebuje připojení k netu, což jsem neměl původně v úmyslu. vyřešil to ale modem od t-mobile.
- "ddrescue" trval na 150GB velociraptoru asi 3 hodiny. on si nejdřív přečte větší bloky, které jsou v pořádku a pak se vrátí k těm vadným.
- měl jsem 6 vadných míst, celkem asi za 26k dat.
- po zkopírování jsem rovnou prohodil kábly, aby nový disk byl jako první.
- bootovaní bez problémů
- při dvou dnech víkendového provozu se žádné problémy s tím, že byly zkopíovány i "vadné" sektory neprojevily.
to je asi tak vše co mě napadá.
m.