Cluster
A HupWiki-ből...
Több számítógépből álló, elosztott informatikai rendszer. Rendkívül változatos lehetőségek vannak, nagyosn sok mindent neveztek eddig már clusternak. A cluster létrehozásának elsõdleges célja lehet a rendelkezésreállás növelése vagy a teljesítmény növelése. Ezek nem feltétlen egymásnak ellentmondó irányok, azonban másfajta tervezést (gondolkodást) igényel a rendelkezésreállás maximalizálása, és másfajtát a teljesítmény maximalizálása.
Clusterek közös jellemzõi
Mindig értelmes az a kérdés, hogy a clusterben mi a közös (a közös, megosztott erõforrás). Ez valahol a cluster lényege, hogy van neki ilyen. Az is egy értelmes kérdés, hogy a cluster milyen szolgáltatást visz, az egész együtt.
- HA cluster
- High Availability cluster. Az elsõdleges cél a rendelkezésreállás növelése.
- HPC
- High Performance Computing. Ugyan léteznek nem clusternek tekintett HPC-k is, mint a klasszikus MPP, vagy klasszikus NUMA, azonban egyre inkább a nagy számitási igényt clusterrel elégitik ki. Általában a HPC gépek egy nem redundáns halmaza, ahol MPI vagy PVM middleware teljesít szolgálatot.
- Grid
- ez a definíció itt félkész, tekintve, hogy a szerzőnek csúnya véleménye van a grid-ről :-)
- SUNcluster
- Az a clustertechnológia, mit a Solaris -hoz fejlesztettek ki. Nagyon gyakran ha egy informatikus "A cluster" -ről beszél, akkor ezt gondolja azon.
- VAXcluster
- VMS cluster. Egy rendkívül funkciógazdag cluster megvalósítás, ami VMS specifikus, a VMS kiszorulásával jelentősége csökken.
- RedHat cluster suite
- a linux alatt az egyik leggazdagabb, elsősorban HA célra való cluster megvalósítás.
HA cluster építése, jellemzői
- Az a HA megoldás, amit nem tesztelél le, az nem működik.
- Két egységbõl nem lehet redundanciát készíteni.
- A HA cluster többe kerül, mint ugyanazt a szolgátatást egy nem-HA rendszer adja elő.
- Nem feltétlen szükséges mindent redundássá tenni, értelmes csak a gyakran meghibásodó részegységeket redundánsá tenni.
- Nincsen dobozból kivett, működő HA megoldás. (Minden HA megoldás implementálásához kell egy szakember, aki ért hozzá.)
- Nem tervezünk arra, hogy egyszerre 2 egység is meghibásodik, mert 2 egység kombinációbol túl sok van. Nem szokott sikerülni (nincs ilyen rendszer). Kivétel, a sok diszk, mert diszkeknél tervezünk egyszerre 2 meghibásodására (lásd RAID6).
Clusterek HA szintjei
- A leggyakoribb szerkezeti meghibásodásokat túléli a szolgáltatás
- Bármely egység meghibásodását túléli a szolgáltatás (no single point of failure)
- Menet koben szerelhetõ: Az egység meghibásodása után a szolgáltatás üzemelése közben kijavítható az egység (visszaállítható a redundancia).
- Menet közben bővíthető.
Gyakran vannak fél megoldások, pl. könnyebb olyan clustert készíteni, ami ugyan menet közben bővíthető, azonban nem él túl egy véletlen meghibásodást.
- Cluster state transition
- Az a módszer, időszak, cselekmény, amíg a cluster az egyik (teljes redundancia) állapotból szerkezet meghibásodás miatt egy másik (fél redundancia) áll át. Pl. amikor két gépből álló cluster esetén elesik az egyik gép, és amíg a másik gép újra teljes körűen viszi a szolgáltatást. Unix jellegű rendszereknál az automatikus átállással elérhető 45 másodperces cluster state transition már nagy kiválló eredmény. Ennél rövidebb átállási idő csak akkor képzelhető el, ha a kernel legaljától az alkalmazás legtetejéig minden clusterre van írva.
- Shared storage
- Gyakori megvalósítás, hogy több számítógép közösen látja ugyan azt a diszket. Erre speciális (és drága, bár egyre olcsóbb) megoldások vannak. Egy gép elesése esetén a túlélő gép ugyan arról a diszkről továbbítja a szolgáltatást. Ilyen diszkrendszerek lehetnek SCSI vagy FC vagy SAS felületen, mostanában olcsón, iSCSI felületen is megoldható. Nem árt, ha a dszikalrendszer maga is redundáns, a diszkek is, a vezérlők is, az elérési útvonalak is.
- Quorum, voting
- A HA clusternél a leglényegesebb kérdés az, hogy hogyan veszi(k) észre a túlélő gép(ek), hogy egy másik node kiesett (és nem a kábel szakadt el, nem a load szaladt meg kezelhetetlenül). Az egyik megoldás, hogy szavaznak, és ha egy cluster-résznél a szavazatok többsége még megvan, akkor az a cluster-rész élt túl. A többi köteles leállítani magát, esetleg a túlélt rész fizikailag kikapcsolja az elveszett részt (fencing). Az ésszerű többséghez legalább 3 szavazó kell. (2 szavazó esetén egyiknek sincs önmagában szavazattöbbsége.) A 3 szavazó lehet 2 gép és egy közösen látott diszk: az a gép él túl, ami látja a diszket. Ezt a megoldást és diszket nevezik Quorum Disk-nek.
Grid, computing cluster
Olyan elosztott informatikai rendszer, ahol több, egymással hálózati összeköttetésben álló számítógép valamilyen számítási feladat végrehajtásban osztozik, többé/kevésbé úgy viselkedve, mintha egyetlen nagy számítógép lenne.
Néhány népszerű implementációja: