Cluster

A HupWiki-ből...

Több számítógépből álló, elosztott informatikai rendszer. Rendkívül változatos lehetőségek vannak, nagyosn sok mindent neveztek eddig már clusternak. A cluster létrehozásának elsõdleges célja lehet a rendelkezésreállás növelése vagy a teljesítmény növelése. Ezek nem feltétlen egymásnak ellentmondó irányok, azonban másfajta tervezést (gondolkodást) igényel a rendelkezésreállás maximalizálása, és másfajtát a teljesítmény maximalizálása.

Clusterek közös jellemzõi

Mindig értelmes az a kérdés, hogy a clusterben mi a közös (a közös, megosztott erõforrás). Ez valahol a cluster lényege, hogy van neki ilyen. Az is egy értelmes kérdés, hogy a cluster milyen szolgáltatást visz, az egész együtt.

HA cluster
High Availability cluster. Az elsõdleges cél a rendelkezésreállás növelése.
HPC
High Performance Computing. Ugyan léteznek nem clusternek tekintett HPC-k is, mint a klasszikus MPP, vagy klasszikus NUMA, azonban egyre inkább a nagy számitási igényt clusterrel elégitik ki. Általában a HPC gépek egy nem redundáns halmaza, ahol MPI vagy PVM middleware teljesít szolgálatot.
Grid
ez a definíció itt félkész, tekintve, hogy a szerzőnek csúnya véleménye van a grid-ről :-)
SUNcluster
Az a clustertechnológia, mit a Solaris -hoz fejlesztettek ki. Nagyon gyakran ha egy informatikus "A cluster" -ről beszél, akkor ezt gondolja azon.
VAXcluster
VMS cluster. Egy rendkívül funkciógazdag cluster megvalósítás, ami VMS specifikus, a VMS kiszorulásával jelentősége csökken.
RedHat cluster suite
a linux alatt az egyik leggazdagabb, elsősorban HA célra való cluster megvalósítás.

HA cluster építése, jellemzői

  • Az a HA megoldás, amit nem tesztelél le, az nem működik.
  • Két egységbõl nem lehet redundanciát készíteni.
  • A HA cluster többe kerül, mint ugyanazt a szolgátatást egy nem-HA rendszer adja elő.
  • Nem feltétlen szükséges mindent redundássá tenni, értelmes csak a gyakran meghibásodó részegységeket redundánsá tenni.
  • Nincsen dobozból kivett, működő HA megoldás. (Minden HA megoldás implementálásához kell egy szakember, aki ért hozzá.)
  • Nem tervezünk arra, hogy egyszerre 2 egység is meghibásodik, mert 2 egység kombinációbol túl sok van. Nem szokott sikerülni (nincs ilyen rendszer). Kivétel, a sok diszk, mert diszkeknél tervezünk egyszerre 2 meghibásodására (lásd RAID6).

Clusterek HA szintjei

  1. A leggyakoribb szerkezeti meghibásodásokat túléli a szolgáltatás
  2. Bármely egység meghibásodását túléli a szolgáltatás (no single point of failure)
  3. Menet koben szerelhetõ: Az egység meghibásodása után a szolgáltatás üzemelése közben kijavítható az egység (visszaállítható a redundancia).
  4. Menet közben bővíthető.

Gyakran vannak fél megoldások, pl. könnyebb olyan clustert készíteni, ami ugyan menet közben bővíthető, azonban nem él túl egy véletlen meghibásodást.

Cluster state transition
Az a módszer, időszak, cselekmény, amíg a cluster az egyik (teljes redundancia) állapotból szerkezet meghibásodás miatt egy másik (fél redundancia) áll át. Pl. amikor két gépből álló cluster esetén elesik az egyik gép, és amíg a másik gép újra teljes körűen viszi a szolgáltatást. Unix jellegű rendszereknál az automatikus átállással elérhető 45 másodperces cluster state transition már nagy kiválló eredmény. Ennél rövidebb átállási idő csak akkor képzelhető el, ha a kernel legaljától az alkalmazás legtetejéig minden clusterre van írva.
Shared storage
Gyakori megvalósítás, hogy több számítógép közösen látja ugyan azt a diszket. Erre speciális (és drága, bár egyre olcsóbb) megoldások vannak. Egy gép elesése esetén a túlélő gép ugyan arról a diszkről továbbítja a szolgáltatást. Ilyen diszkrendszerek lehetnek SCSI vagy FC vagy SAS felületen, mostanában olcsón, iSCSI felületen is megoldható. Nem árt, ha a dszikalrendszer maga is redundáns, a diszkek is, a vezérlők is, az elérési útvonalak is.
Quorum, voting
A HA clusternél a leglényegesebb kérdés az, hogy hogyan veszi(k) észre a túlélő gép(ek), hogy egy másik node kiesett (és nem a kábel szakadt el, nem a load szaladt meg kezelhetetlenül). Az egyik megoldás, hogy szavaznak, és ha egy cluster-résznél a szavazatok többsége még megvan, akkor az a cluster-rész élt túl. A többi köteles leállítani magát, esetleg a túlélt rész fizikailag kikapcsolja az elveszett részt (fencing). Az ésszerű többséghez legalább 3 szavazó kell. (2 szavazó esetén egyiknek sincs önmagában szavazattöbbsége.) A 3 szavazó lehet 2 gép és egy közösen látott diszk: az a gép él túl, ami látja a diszket. Ezt a megoldást és diszket nevezik Quorum Disk-nek.


Grid, computing cluster

Olyan elosztott informatikai rendszer, ahol több, egymással hálózati összeköttetésben álló számítógép valamilyen számítási feladat végrehajtásban osztozik, többé/kevésbé úgy viselkedve, mintha egyetlen nagy számítógép lenne.


Néhány népszerű implementációja: