Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: přesun systému na jiný disk, ddrescue a změna bootovacího disku  (Přečteno 4239 krát)

marshall1727

  • Aktivní člen
  • *
  • Příspěvků: 307
nazdar vespolek,

v serveru 10.04 mi po letech provozu umírá WD raptor a chystám se přesunout systém na jiný disk - stejný typ WD raptor, mám v serveru 4 kusy. dospěl jsem k tomu, že použiji dd nebo ddrescue. teda asi ten druhý, abych nemusel řešit možné chyby v čtení obsahu disku. chci tedy udělat zhruba něco takového:
Kód: [Vybrat]
> dd if=/dev/sda of=/media/backup/sda.img
> diff -rq /dev/sda /media/backup/sda.img
pokud nebudou souhlasit tak totéž s ddrescue
> dd if=/media/backup/sda.img of=/dev/sdd

Až sem jsem se dočetl téměř vše, ale nemohu se dopátrat jak následně změnit bootovací pořádek. Jesli to dobře chápu tak, v důsledku "dd" se na /dev/sdd vytvoří stejné partišny jaké byly na /dev/sda, (sda1 jako / a sda5 jako /swap) tedy vzniknou sdd1 a sdd5. sda1 a sda5 jsou ve fstabu připojeny přes UUID. bude možné ty nové sdd1 a sdd5 připojit pomocí /dev/sdd1 a /dev/sdd5? celé to je ještě tak, že ten /dev/sdd je připojen ve fstabu přes LABEL=.

díky.

m.
 
« Poslední změna: 01 Ledna 2013, 16:42:58 od marshall1727 »
--
koupil jsem si nový server a ladím ho. proto to zde spamuju. (2xXeon5110; IntelServerBoard S5000PSL; 2x2x1GbECC;4xRaptor150G)

jmp

  • Host
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #1 kdy: 01 Ledna 2013, 16:34:02 »
nějak to co chcete udělat nechápu

přijde mi to, že chcete dělat blokové operace nad celým diskem, ze kterého jsou připojené partišny - pokud ano, tak to tímto způsobem nedělejte...

pokud máte disk, který odchází a shodný nový nepoužitý disk (nejsou na něm žádná data, nikde nebyl připojen a nebude pak chybět), tak realizujte původní záměr přenosu obsahu celého disku jako blokového zařízení pomocí nějaké live distribuce (http://www.sysresccd.org/SystemRescueCd_Homepage)

marshall1727

  • Aktivní člen
  • *
  • Příspěvků: 307
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #2 kdy: 01 Ledna 2013, 16:40:08 »
ano, budu to dělat z liveCD. to co jsem dával do kódu, je jen popis toho přenosu. samozřejmě to zahrnuje i zazálohování systému, fyzické odpojení ostatních disků apod.

jak to ale bude po přenosu bitové kopie s bootováním z nového disku? musím znám UUID nového disku? nebo mohu použít klasické /dev/sdd1?
« Poslední změna: 01 Ledna 2013, 16:42:31 od marshall1727 »
--
koupil jsem si nový server a ladím ho. proto to zde spamuju. (2xXeon5110; IntelServerBoard S5000PSL; 2x2x1GbECC;4xRaptor150G)

jmp

  • Host
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #3 kdy: 01 Ledna 2013, 17:33:25 »
za použití livecd můžete jít rovnou starý_disk->nový_disk

tím se přenese i rozdělení disku, případný zavaděč, partišny včetně UUID - prostě to bude klon se vším všudy
předpokládám, že jediné, co nebude sedět, bude odkazování pomocí by-id

marshall1727

  • Aktivní člen
  • *
  • Příspěvků: 307
to je přesně co jsem potřeboval vědět. díky moc.
--
koupil jsem si nový server a ladím ho. proto to zde spamuju. (2xXeon5110; IntelServerBoard S5000PSL; 2x2x1GbECC;4xRaptor150G)

jmp

  • Host
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #5 kdy: 01 Ledna 2013, 17:44:00 »
nicméně pokud odchází disk a již není možné jej bez chyb přečíst, tak bych uvažoval spíš nad čistou instalací, než si tam takto zanést chyby...

marshall1727

  • Aktivní člen
  • *
  • Příspěvků: 307
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #6 kdy: 01 Ledna 2013, 17:57:43 »
ty chyby hlásí SMART už pěkně dlouho a nic jiného se se systémem neděje. pokud jsem se pokul pochopit to, co mi SMART hlásí, tak většina jsou chyby jiné než problémy se čtením disku. vypadá to nějak takto:


Kód: [Vybrat]
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Raptor family
Device Model:     WDC WD1500ADFD-00NLR5
Serial Number:    WD-WMAP42073271
Firmware Version: 21.07QR5
User Capacity:    150,039,945,216 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 published, ANSI INCITS 397-2005
Local Time is:    Tue Jan  1 17:36:35 2013 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x85) Offline data collection activity
was aborted by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
the read element of the test failed.
Total time to complete Offline
data collection: (4783) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: (   2) minutes.
Extended self-test routine
recommended polling time: (  72) minutes.
Conveyance self-test routine
recommended polling time: (   5) minutes.
SCT capabilities:        (0x103f) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   188   039   051    Pre-fail  Always   In_the_past 58
  3 Spin_Up_Time            0x0007   165   164   021    Pre-fail  Always       -       4791
  4 Start_Stop_Count        0x0032   100   100   040    Old_age   Always       -       43
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   200   200   051    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   044   044   000    Old_age   Always       -       41248
 10 Spin_Retry_Count        0x0012   100   253   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0012   100   253   051    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       43
194 Temperature_Celsius     0x0022   090   089   000    Old_age   Always       -       57
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   198   198   000    Old_age   Always       -       58
198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   198   051    Old_age   Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 2780 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 2780 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 48 80 19 e2  Error: UNC 8 sectors at LBA = 0x02198048 = 35225672

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 47 80 19 42 00  14d+01:48:26.850  READ DMA
  27 00 00 00 00 00 40 00  14d+01:48:26.850  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 00 00  14d+01:48:26.850  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 00  14d+01:48:26.850  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 40 00  14d+01:48:26.850  READ NATIVE MAX ADDRESS EXT

Error 2779 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 48 80 19 e2  Error: UNC 8 sectors at LBA = 0x02198048 = 35225672

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 47 80 19 42 00  14d+01:48:23.700  READ DMA
  27 00 00 00 00 00 40 00  14d+01:48:23.700  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 00 00  14d+01:48:23.700  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 00  14d+01:48:23.700  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 40 00  14d+01:48:23.700  READ NATIVE MAX ADDRESS EXT

Error 2778 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 47 80 19 e2  Error: UNC 8 sectors at LBA = 0x02198047 = 35225671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 47 80 19 42 00  14d+01:48:20.600  READ DMA
  27 00 00 00 00 00 40 00  14d+01:48:20.600  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 00 00  14d+01:48:20.600  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 00  14d+01:48:20.600  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 40 00  14d+01:48:20.600  READ NATIVE MAX ADDRESS EXT

Error 2777 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 47 80 19 e2  Error: UNC 8 sectors at LBA = 0x02198047 = 35225671

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 47 80 19 42 00  14d+01:48:17.600  READ DMA
  ca 00 08 97 32 04 40 00  14d+01:48:17.600  WRITE DMA
  ca 00 10 87 32 04 40 00  14d+01:48:17.600  WRITE DMA
  ca 00 08 7f 32 04 40 00  14d+01:48:17.600  WRITE DMA
  ca 00 78 07 32 04 40 00  14d+01:48:17.600  WRITE DMA

Error 2776 occurred at disk power-on lifetime: 40372 hours (1682 days + 4 hours)
  When the command that caused the error occurred, the device was doing SMART Offline or Self-test.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 48 80 19 e2  Error: UNC 8 sectors at LBA = 0x02198048 = 35225672

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 47 80 19 42 00  14d+01:43:38.900  READ DMA
  27 00 00 00 00 00 40 00  14d+01:43:38.900  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 00 00  14d+01:43:38.900  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 00  14d+01:43:38.900  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 40 00  14d+01:43:38.900  READ NATIVE MAX ADDRESS EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     41244         35225671
# 2  Conveyance offline  Completed: read failure       90%     20834         35224872
# 3  Extended offline    Completed: read failure       90%     20830         35224872
# 4  Short offline       Completed without error       00%     13453         -
# 5  Short offline       Completed without error       00%     13354         -
# 6  Extended offline    Completed: read failure       90%     13316         19630288
# 7  Short offline       Completed without error       00%     13316         -
# 8  Short offline       Completed without error       00%     13316         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
--
koupil jsem si nový server a ladím ho. proto to zde spamuju. (2xXeon5110; IntelServerBoard S5000PSL; 2x2x1GbECC;4xRaptor150G)

marshall1727

  • Aktivní člen
  • *
  • Příspěvků: 307
Re:přesun systému na jiný disk, ddrescue a změna bootovacího disku
« Odpověď #7 kdy: 13 Ledna 2013, 22:37:35 »
Dobrý večer,
díky za rady, výměna disku proběhla téměř bez problémů. Dovolím si pár poznámek pro někoho kdo by to chtěl dělat podobně jako já, které jsem nevyčetl z dokumentace.

- pokud podezříváte svůj disk, že má vadné sektory, tak počítejte s tím, že "dd" spadne pokud při čtení na chybu narazí.
- toto je schopen obejít "ddrescue"
- "ddrescue" není na livedvd naistalován a je potřeba ho stáhnout z netu. je v balíčku gddrescue. počítač tedy potřebuje připojení k netu, což jsem neměl původně v úmyslu. vyřešil to ale modem od t-mobile.
- "ddrescue" trval na 150GB velociraptoru asi 3 hodiny. on si nejdřív přečte větší bloky, které jsou v pořádku a pak se vrátí k těm vadným.
- měl jsem 6 vadných míst, celkem asi za 26k dat.
- po zkopírování jsem rovnou prohodil kábly, aby nový disk byl jako první.
- bootovaní bez problémů
- při dvou dnech víkendového provozu se žádné problémy s tím, že byly zkopíovány i "vadné" sektory neprojevily.

to je asi tak vše co mě napadá.

m.
--
koupil jsem si nový server a ladím ho. proto to zde spamuju. (2xXeon5110; IntelServerBoard S5000PSL; 2x2x1GbECC;4xRaptor150G)

 

Provoz zaštiťuje spolek OpenAlt.