Inovujeme skoro všechen hardware, chceme být energeticky úspornější

Původní plán na pořízení výkonnějších strojů pro virtualizaci jsme přehodnotili a výrazně rozšířili. Znamená to velké energetické úspory, které nebudou vyžadovat navyšování členských poplatků.

Neúprosně se blíží konec roku a s ním taky konec starých cen energii. Od nového roku očekáváme podstatné navýšení a původní plán, snížit spotřebu o několik kilowattů by nejspíše znamenal, že bychom měsíčně byli v minusu zhruba 100 tisíc korun.

Museli jsme tedy docela podstatně přehodnotit svůj přístup a práskli jsme do toho mnohem víc, než bylo původně v plánu; jedinou rozumnou cestou, jak snížit spotřebu, je skrze slučování více menších mašin do mnohem větších, v adekvátně nižším počtu.

Ještě více virtuálů na server

V předchozím postu jsem zmiňoval server se dvěma 64jádrovými EPYC CPU a 1 TB RAM. Původně na něm mělo, stejně jako na node22, běžet 300 VPS a měl sloužit jako rezerva pro procesorově intenzívní zátěže – ukázalo se, že už jen jeden takový procesor bohatě stačí a nebude co přesouvat.

Další postup se tedy, v kontextu hokejky v grafu ceny elektrické energie, nabídl docela sám – node23 jsme nakonec osadili dvěma terabajty RAM a ještě jsme k němu přikoupili node24 o stejné konfiguraci.

Celkem tedy přidáváme dva stroje, přičemž se na každý z nich vejde pohodlně 600 VPS. Pokud si to spočítáme celé, dává dohromady kapacita node21 (1TB/64 core Naples, 300 VPS), node22 (1TB/64 core Rome, 300 VPS), a teď node23+node24 (2TB/128 core Rome, 600 VPS) možnost obsáhnout všechny produkční VPS v Praze. S malou rezervou navíc.

Pro představu o spotřebě: jeden stroj pro 80 VPS potřebuje asi 300 W, nová 1T/64c mašina pro 300 VPS bere zhruba 400 W (single socket Rome, node22) až 500 W (dual socket Naples, node21), data ze 600 VPS na node23/24 zatím nemáme, ale očekáváme něco pod 800 W. Jsou tam přeci jen HPC modely těch EPYCů.

Není to levná záležitost

Na tomhle místě je asi čas říct, že tohle všechno není úplně levná sranda, máme obrovské štěstí, že za poslední dva roky na second-hand trhu padly ceny na použitelnější úrovně, bez toho by to moc nevycházelo. I tak, na dovybavení node23 a na node24 dohromady padlo 1,5 milionu korun.

Z pohledu tvorby rozpočtu není úplně podstatně, že jsme si na to půjčili, na node22 jsme byli schopni našetřit a koupit ho za hotové právě z těch přebytků, co teď použijeme na splácení – koneckonců, model výpůjček od členů není nic nového a byli jsme na něj zvyklí velmi dlouho. Tu tradici přerušilo až právě to divné období v posledních předkrizových letech, kdy už by to dávno chtělo inovovat, ale nevycházelo to čísly ani z jedné strany – ušetřená cena energií neospravedlňovala tak vysokou investici, jakou v té době bylo potřeba udělat do zbrusu nových velkých EPYCů.

Kdybychom inovovali dříve a pořídili modernější servery dimenzované stále na 80 VPS, byli bychom jen na mírně nižší spotřebě. Tím bychom měli sice novější hardware, ale nezískali bychom větší agregaci. Teď bychom měli velký problém, protože bychom ještě stále spláceli hardware, kterému bychom neměli jak zaplatit jeho spotřebu. To by nakonec zřejmě vedlo k nutnosti zvýšit členský poplatek.

Odkládáním jsme tedy dosáhli dvojího efektu: nebudeme muset zvyšovat členský příspěvek, protože můžeme přejít na hardware, se kterým reálně ušetříme. Stálo nás to ovšem hodně práce. Opravdu dostatečná zátěž se totiž velmi špatně simuluje, aby se dal běh sdíleného jádra na tak velké konfiguraci odladit předem.

To nejsložitější máme za sebou

Chtěl bych se tedy omluvit za přidělávání práce i všem členům, teď nás ještě čeká pár týdnů docela častých restartů těch velkých mašin, jak je postupně ladíme na cílovou zátěž. Jsme už výrazně dál než na začátku, jsme si mnohem jistější a řekl bych, že to nejhorší už máme za sebou. Díky všem, kdo máte VPSky na node22, že jste do teď vydrželi a pomohli nám produkci vyladit.

Na závěr si nechávám tu úplně nejméně příjemnou věc, protože ta znamená spoustu práce pro všechny zúčastněné taktéž – potřebujeme do konce roku vypnout stroje s OpenVZ.

OpenVZ Legacy kernel je založený na RHEL 6, což znamená verzi 2.6.32. Ta není stavěná na tak velké stroje. Neexistuje tedy způsob, jak rozumně dostat ty VPS na větší stroje při zachování všech vlastností. Pro ty členy, kteří opravdu nebudou moci migrovat a zároveň nepoužívají vevnitř KVM, bychom mohli vytvořit jedno QEMU o velikosti jedné původní mašiny. Upřímně řečeno bychom se tomu ale raději vyhnuli.

Přejděte na vpsAdminOS

Velmi pěkně prosím všechny členy, kteří máte VPS ještě na OpenVZ, začněte co možná nejdřív podnikat všechny ty kroky, co jste plánovali a odkládali udělat, abyste migraci své VPS na vpsAdminOS mohli provést, protože čas se krátí a do nového roku už musíme vstoupit s tak minimální spotřebou, jak to jen půjde.

V obecném případě je to velmi jednoduchá záležitost. Pokud VPS na OpenVZ nepoužívá NAS a běží na stále ještě vývojáři podporované distribuci, lze ji přemigrovat bez problémů bez potřeby zásahu člena.

V případě s NASem je potřeba ještě přenastavit NAS mount ze spravovaného vpsAdminem na mountováni NFS zevnitř VPS klasickým způsobem pro danou distribuci.

Ve zbytku případů se bavíme o distribucích ve verzích, které už nepodporují ani jejich vývojáři – tady potom zhruba na konci listopadu už bude jasno, jestli bude potřeba řešit virtualizovaný OpenVZ Legacy node, nebo (doufejme) ne.

Poloviční spotřeba

Současná spotřeba je 11,5 kW a našim cílem je srazit spotřebu pod polovinu. Kromě výměny serverů nás čekají další zásahy jako úprava infrastruktury a vypnutí přebytečných podpůrných boxů. Určitě to zvládneme, kdybyste měli dotazy nebo nápady na vylepšení, ozvěte se na podporu.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *