Kif Tirkupra d-Dejta u Tibni mill-ġdid RAIDs tas-Softwer li fallew - Parti 8


Fl-artikoli preċedenti ta 'din is-serje RAID inti mort minn żero għal RAID eroj. Aħna rrevejna diversi konfigurazzjonijiet tas-RAID tas-softwer u spjegajna l-essenzjali ta 'kull wieħed, flimkien mar-raġunijiet għalfejn inti tkun imxaqleb lejn waħda jew l-oħra skont ix-xenarju speċifiku tiegħek.

F'din il-gwida ser niddiskutu kif terġa 'tinbena array RAID tas-softwer mingħajr telf ta' data meta fil-każ ta 'falliment tad-disk. Għall-qosor, aħna se nikkunsidraw biss setup RAID 1 - iżda l-kunċetti u l-kmandi japplikaw għall-każijiet kollha bl-istess mod.

Qabel ma tkompli, jekk jogħġbok kun żgur li waqqaft firxa RAID 1 wara l-istruzzjonijiet ipprovduti fil-Parti 3 ta 'din is-serje: Kif twaqqaf RAID 1 (Mirror) fil-Linux.

L-uniċi varjazzjonijiet fil-każ preżenti tagħna se jkunu:

1) verżjoni differenti ta' CentOS (v7) minn dik użata f'dak l-artikolu (v6.5), u
2) daqsijiet tad-disk differenti għal /dev/sdb u /dev/sdc (8 GB kull wieħed).

Barra minn hekk, jekk SELinux huwa attivat fil-mod ta 'infurzar, ser ikollok bżonn iżżid it-tikketti korrispondenti fid-direttorju fejn int ser timmonta l-apparat RAID. Inkella, tiltaqa' ma' dan il-messaġġ ta' twissija waqt li tipprova twaħħal:

Tista' tirranġa dan billi tħaddem:

# restorecon -R /mnt/raid1

Twaqqif ta' Monitoraġġ RAID

Hemm varjetà ta’ raġunijiet għalfejn apparat ta’ ħażna jista’ jfalli (l-SSDs naqqsu ħafna ċ-ċansijiet li dan iseħħ, madankollu), iżda irrispettivament mill-kawża tista’ tkun ċert li l-kwistjonijiet jistgħu jseħħu f’kull ħin u trid tkun ippreparat biex tissostitwixxi l-falla. parti u biex tiżgura d-disponibbiltà u l-integrità tad-dejta tiegħek.

Kelma ta' parir l-ewwel. Anke meta tista’ tispezzjona /proc/mdstat sabiex tiċċekkja l-istatus tar-RAIDs tiegħek, hemm metodu aħjar u li jiffranka l-ħin li jikkonsisti fit-tħaddim ta’ mdadm fil-modalità monitor + scan, li jibgħat twissijiet permezz ta’ email lil riċevitur predefinit.

Biex twaqqaf dan, żid il-linja li ġejja f'/etc/mdadm.conf:

MAILADDR [email <domain or localhost>

Fil-każ tiegħi:

MAILADDR [email 

Biex tħaddem mdadm fil-modalità monitor + scan, żid l-entrata crontab li ġejja bħala root:

@reboot /sbin/mdadm --monitor --scan --oneshot

B'mod awtomatiku, mdadm se jiċċekkja l-arrays RAID kull 60 sekonda u jibgħat twissija jekk isib xi kwistjoni. Tista' timmodifika din l-imġiba billi żżid l-għażla --delay mad-daħla tal-crontab hawn fuq flimkien mal-ammont ta' sekondi (per eżempju, --delay 1800 tfisser 30 minuta).

Fl-aħħarnett, kun żgur li għandek Mail User Agent (MUA) installat, bħal mutt jew mailx. Inkella, ma tirċievi l-ebda twissijiet.

F'minuta naraw kif tidher allert mibgħut minn mdadm.

Simulazzjoni u Sostituzzjoni ta' Apparat tal-Ħżin RAID fallut

Biex tissimula kwistjoni b'wieħed mill-apparati tal-ħażna fl-array RAID, se nużaw l-għażliet --manage u --set-faulty kif ġej:

# mdadm --manage --set-faulty /dev/md0 /dev/sdc1  

Dan se jirriżulta f'/dev/sdc1 jiġi mmarkat bħala difettuż, kif nistgħu naraw f'/proc/mdstat:

Aktar importanti minn hekk, ejja naraw jekk irċevejniex twissija bl-email bl-istess twissija:

F'dan il-każ, ser ikollok bżonn tneħħi l-apparat mill-firxa tar-RAID tas-softwer:

# mdadm /dev/md0 --remove /dev/sdc1

Imbagħad tista 'tneħħiha fiżikament mill-magna u tibdilha ma' spare part (/dev/sdd, fejn diviżorju tat-tip fd inħoloq qabel):

# mdadm --manage /dev/md0 --add /dev/sdd1

Fortunatament għalina, is-sistema awtomatikament tibda tibni mill-ġdid il-firxa bil-parti li għadna kif żidna. Nistgħu nittestjaw dan billi nimmarkaw /dev/sdb1 bħala difettuż, inneħħuh mill-array, u niżguraw li l-fajl tecmint.txt għadu aċċessibbli f'/mnt/raid1:

# mdadm --detail /dev/md0
# mount | grep raid1
# ls -l /mnt/raid1 | grep tecmint
# cat /mnt/raid1/tecmint.txt

L-immaġni ta 'hawn fuq turi biċ-ċar li wara li żżid /dev/sdd1 mal-firxa bħala sostitut għal /dev/sdc1, il-bini mill-ġdid tad-dejta sar awtomatikament mis-sistema mingħajr intervent min-naħa tagħna.

Għalkemm mhux strettament meħtieġ, hija idea kbira li jkollok apparat ta 'riżerva fil-idejn sabiex il-proċess ta' sostituzzjoni tal-apparat difettuż b'sewqan tajjeb jista 'jsir f'daqqa. Biex tagħmel dan, ejja nżidu mill-ġdid /dev/sdb1 u /dev/sdc1:

# mdadm --manage /dev/md0 --add /dev/sdb1
# mdadm --manage /dev/md0 --add /dev/sdc1

Jirkupra minn Telf ta' Redundancy

Kif spjegat qabel, mdadm awtomatikament jerġa 'jibni d-data meta disk wieħed ifalli. Imma x'jiġri jekk 2 diski fil-firxa jonqsu? Ejja nisimulaw xenarju bħal dan billi timmarka /dev/sdb1 u /dev/sdd1 bħala difettużi:

# umount /mnt/raid1
# mdadm --manage --set-faulty /dev/md0 /dev/sdb1
# mdadm --stop /dev/md0
# mdadm --manage --set-faulty /dev/md0 /dev/sdd1

Tentattivi biex tinħoloq mill-ġdid l-array bl-istess mod kif inħoloq f'dan iż-żmien (jew bl-użu tal-għażla --assume-clean) jistgħu jirriżultaw f'telf ta 'dejta, għalhekk għandha titħalla bħala l-aħħar għażla.

Ejja nippruvaw nirkupraw id-dejta minn /dev/sdb1, pereżempju, f'partizzjoni tad-diska simili (/dev/sde1 – innota li dan jeħtieġ li toħloq partizzjoni tat-tip fd f'/dev/sde qabel ma tipproċedi) billi tuża ddrescue:

# ddrescue -r 2 /dev/sdb1 /dev/sde1

Jekk jogħġbok innota li sa dan il-punt, aħna ma missitx /dev/sdb jew /dev/sdd, il-ħitan li kienu parti mill-firxa RAID.

Issa ejja nibnu mill-ġdid l-array billi tuża /dev/sde1 u /dev/sdf1:

# mdadm --create /dev/md0 --level=mirror --raid-devices=2 /dev/sd[e-f]1

Jekk jogħġbok innota li f'sitwazzjoni reali, tipikament tuża l-istess ismijiet tal-apparat bħall-array oriġinali, jiġifieri, /dev/sdb1 u /dev/sdc1 wara li d-diski falluti jkunu ġew sostitwiti b'oħrajn ġodda.

F'dan l-artikolu għażilt li nuża apparati żejda biex terġa 'toħloq l-array b'diski ġodda fjamanti u biex tevita konfużjoni mad-drajvs oriġinali falluti.

Meta mistoqsi jekk tkomplix tikteb array, ittajpja Y u agħfas Enter. Il-firxa għandha tinbeda u għandek tkun tista' tara l-progress tagħha bi:

# watch -n 1 cat /proc/mdstat

Meta jitlesta l-proċess, għandek tkun tista' taċċessa l-kontenut tar-RAID tiegħek:

Sommarju

F'dan l-artikolu rrevejna kif tirkupra minn fallimenti RAID u telf ta 'redundancy. Madankollu, trid tiftakar li din it-teknoloġija hija soluzzjoni ta 'ħażna u MHUX tissostitwixxi backups.

Il-prinċipji spjegati f'din il-gwida japplikaw għas-setups RAID kollha bl-istess mod, kif ukoll il-kunċetti li se nkopru fil-gwida li jmiss u l-aħħar ta 'din is-serje (ġestjoni RAID).

Jekk għandek xi mistoqsijiet dwar dan l-artikolu, tħossok liberu li tibgħatilna nota billi tuża l-formola tal-kummenti hawn taħt. Aħna ħerqana li nisimgħu mingħandek!