8 квіт. 2013 р.

PUE - як і раніше корисно?

Необхідність підвищення ефективності використання енергії в центрах обробки даних очевидна для всіх. Уряди багатьох країн прагнуть допомогти операторам ЦОД при реалізації потенціалу підконтрольних об'єктів: чиновники пропонують всім бажаючим скористатися податковими відрахуваннями, грантами та іншими програмами стимулювання. Щоб розраховувати на допомогу ззовні, власникам дата-центрів необхідно наочно продемонструвати дієвість застосовуваних механізмів підвищення енергоефективності, а для цього потрібні універсальні і відносно прості засоби порівняльного аналізу стану одного і того ж об'єкта в розрізі певного періоду часу або ж універсальні метрики для порівняння одного ЦОД з іншими.

З 2007 року розроблений консорціумом The Green Grid коефіцієнт ефективності використання енергії (Power Usage Effectiveness; PUE) був одним з основних інструментів для вирішення даної задачі. Але ця метрика до душі далеко не всім операторам і власникам дата-центрів. Якщо згадати про всі альтернативи (нехай і менш популярні), вже використовувані стандарти та перспективні аналоги, які знаходяться на стадії розробки, то мимоволі задумаєшся: а чи дійсно саме коефіцієнт PUE є найкращою метрикою для оцінки енергоефективності дата-центру?

Проблеми при роботі з PUE

Зробити вибір на користь PUE легко, так як дана метрика найпоширеніша. Але є безліч сценаріїв, які ілюструють її недоліки. Можливо, найочевиднішим прикладом буде ситуація, коли компанія оновлює IT-обладнання у своєму дата-центрі на більш енергоефективні системи, забуваючи (або залишаючи до кращих часів) провести відповідну оптимізацію підсистем електроживлення та охолодження.

Припустимо, спочатку потужність встановленого в її ЦОД IT-обладнання становила 12 МВт, а загальна потужність об'єкта дорівнювала 20 МВт. Нагадаємо, що PUE відповідає відношенню загальному енергоспоживанню об'єкта до рівня енергоспоживання IT-обладнання (чим значення ближче до одиниці, тим краще). Тобто PUE в даному випадку дорівнював 1.67. Потім ми встановили більш енергоефективні сервери, і потужність IT-обладнання впала до 11 МВт, при цьому загальна потужність об'єкта скоротилася на все той же 1 МВт. На виході спостерігаємо зростання до PUE 1.72 (19/11), а не зниження. Незнайомому з реальною ситуацією на об'єкті сторонньому спостерігачеві така динаміка зміни коефіцієнта буде говорити про те, що об'єкт став менш ефективним. І це аж ніяк не єдиний сценарій докладного плану.

У деяких модульних схемах ЦОД, де використовуються серверні стійки, застосовуються великі стоечні вентилятори замість масиву малоефективних маленьких вентиляторів, які вбудовуються безпосередньо в сервери. Серверні вентилятори відносять до IT-обладнання, а от стоечні - вже до інфраструктури. У більшості випадків енергоспоживання таких охолоджувачів може досягати істотного рівня, що обертається зростанням PUE в дата-центрах, де використовуються стоечні вентилятори.

Аналогічна ситуація і з електроживленням. Найчастіше IT-обладнання передбачає використання окремого блоку живлення для кожного сервера, але в багатьох схемах (наприклад, у разі IBM iDataPlex) використовується загальний стієчний блок живлення. Сама по собі схема вкрай зручна і ефективна, і в майбутньому вона буде активно впроваджуватися, але в даному випадку енерговитрати на забезпечення працездатності IT-обладнання знову переходять у категорію інфраструктури. У подібній ситуації коефіцієнт PUE знову буде розраховуватися не зовсім коректно.

Маркетингові маніпуляції з PUE

Крім "підводних каменів" метрики у неї є ще один очевидний мінус. Багато великих компаній маніпулюють PUE у своїх цілях, щоб пропіарити власні дата-центри. PUE з інструменту для оцінки ступеня підвищення енергоефективності ЦОД перетворився на механізм маркетингу. Компанії відчувають тиск з боку ринку і прагнуть всіма способами мінімізувати свої показники PUE і, можливо, йдуть на шахрайство.

Наприклад, деякі оператори дата-центрів виключають освітлення із загального енергоспоживання об'єкта - зрештою, світло потрібне тільки людям, а обладнання з його допомогою працювати ефективніше не стане. Інші оператори вимірюються PUE під час зимових місяців, коли енергоспоживання систем охолодження знаходиться на мінімумі.

Але чи можна стверджувати, що це всього лише маніпуляції системою? Якщо так, то в який саме час слід здійснювати вимірювання? Чи можна сказати, що вимірювання, що проводяться при максимальному тепловому навантаженні точніше, ніж ті, які здійснювалися при мінімальній навантаженні? Можливо, вимірювання слід проводити круглий рік, щоб у результаті отримати усереднений рівень. Але погодні умови поточного року можуть сильно відрізнятися від того, що нас чекає в наступному. Аномально висока тривалість зими в Росії - яскраве тому підтвердження. Крім того, дата-центри в більш прохолодних регіонах будуть мати незаперечну перевагу перед тими, які експлуатуються в жаркому кліматі.

Ще один приклад маніпуляцій метрикою. У контейнерні ЦОД часто вбудовуються кондиціонери CRAH (Computer Room Air Handling) і CRAC (Computer Room Air Conditioning). Таким чином, істотна частина механічної інфраструктури фігурує в розрахунках розглянутого коефіцієнта, як IT-обладнання. У підсумку контейнерні ЦОД здаються більш ефективними, ніж вони є насправді.

Словом, лазівок вистачає. Керівництво тієї чи іншої компанії може знати реальний PUE, але клієнти або інші компанії, які хочуть порівняти ЦОД конкурента зі своїм, будуть залишатися в невіданні.

Тим не менш, незважаючи на всі проблеми, PUE залишається основною метрикою для вимірювання рівня енергоефективності дата-центрів. Більшість компаній, які хочуть привернути увагу зацікавлених сторін до просунутої начинці своїх ЦОД, в якості основного аргументу будуть приводити саме коефіцієнт PUE, а не який-небудь аналог з групи конкуруючих показників. Решта метрики були створені з помітним запізненням, їм не вистачає піару, при цьому гідним альтернативам PUE вкрай складно виділитися із загальної маси. Іншими словами, нинішня популярність PUE означає, що ця метрика навряд чи буде зміщена альтернативним показником протягом найближчого часу.

У будь-якого підходу є недоліки

Давайте згадаємо, як ми оцінюємо інтелект людини. На розум практично відразу ж приходить коефіцієнт інтелекту (Intelligence Quotient; IQ). Це основна метрика для даної мети, але у IQ є серйозна проблема: це всього лише число - оцінка дається лише за кінцевим результатом без урахування якісної своєрідності розумової діяльності. Іншими словами, тест показує, наскільки розумний (або дурний) людина, але нічого не говорить про те, в якій області знань той розумний, і що саме за цією оцінкою ховається.

Проілюструємо це на прикладі. Уявіть собі, що потрібно оцінити рівень інтелекту двох на осіб із використанням системи IQ: блискучого музиканта і талановитого математика. Що слід зробити досліднику? Ставити запитання про музику? Перевіряти музичні навички? Ставити запитання про математику? Запросити випробовуваних вирішити кілька завдань? Незалежно від того, як дослідник проведе свій тест, результати будуть різними в більшості випадків. Але тест також може показати, що рівень інтелекту у музиканта і математика однаковий. Як, скажімо, у людини з епохи Відродження, який був однаково добре розвинений в обох областях. Але чи відображає це вміння випробовуваних?

У разі PUE спостерігається аналогічна ситуація: це всього лише число - коефіцієнт, творці якого, спробували домогтися того, щоб PUE відбивав різні фактори, такі як ефективність інфраструктури охолодження і підвищення ефективності IT-інфраструктури. Проблема в тому, що ці два фактори можуть компенсувати один одного (як було описано в прикладах вище), що, в кінцевому рахунку, нівелює поліпшення рівня PUE. Але давайте не будемо критикувати лише тільки коефіцієнт ефективності використання енергії. Подібне можна сказати і про більшість конкуруючих показників.

Потрібно відзначити, що деякі дослідники намагаються вирішити проблему підвищення коефіцієнта PUE при поліпшенні енергоефективності IT-обладнання шляхом розширення переліку оцінюваних характеристик, що призводило до ще більшої плутанини. Можна створити різні способи включення цих характеристик у єдиний коефіцієнт, але проблема нікуди не дінеться: удосконалення в одній області без відповідних доопрацювань в інших можуть обернутися не пониженням, а зростанням PUE, або (у кращому випадку) дуже посередніми позитивними результатами в цілому. Спроба використовувати одну цифру для оцінки ефективності всього дата-центру, це те ж саме, що застосування IQ, щоб оцінити інтелект: коефіцієнт може мати широке застосування, але йому не вистачає точності.

Простого і очевидного рішення немає

Безсумнівним плюсом коефіцієнта PUE та аналогічних йому метрики є їх простота: коли вам доводиться використовувати лише одну цифру, що характеризує весь дата-центрі, ви можете швидко зробити порівняння: центр обробки даних А більш ефективний, ніж центр обробки даних Б (принаймні, згідно загальноприйнятої метриці). Ця простота, як уже згадувалося, перетворюється на зручний механізм маркетингу. Наприклад, власники ЦОД з PUE нижче 1.10 можуть швидко і ефективно залучити до свого проекту увагу засобів масової інформації, що призведе до підвищення рівня зацікавленості дата-центром і самою компанією серед потенційних клієнтів.

А тепер уявіть собі, що замість однієї цифри компанії доведеться створити безліч таблиць і пояснити представникам ЗМІ значення всіх граф і елементів. Так, так вона зможе гранично точно охарактеризувати рівень ефективності підконтрольного об'єкта. А ось журналіст дуже швидко почне позіхати від нудьги і відправиться шукати більш яскравий матеріал, тому що лише деякі читачі будуть мати достатньо терпіння, щоб засвоїти всю цю інформацію.

Зараз експерти консорціуму The Green Grid працюють над поліпшенням та уточненням PUE. Інші організації розробили аналогічні показники, щоб обійти проблеми PUE, але всі ці метрики стають жертвами складнощів, що виникають у результаті спроб звести величезний комплекс характеристик (енергоефективності) дата-центру до однієї цифри. Таким чином, кожна альтернативна метрика може стати мішенню для шахрайства і зловживань з боку несумлінних компаній, яким потрібен маркетинговий козир.

Потрібно чітко зрозуміти ще одну річ. Не можна перетворювати зниження PUE на самоціль. Головне при роботі з оптимізації ЦОД - домогтися скорочення сукупних витрат на електроенергію при збереженні і по можливості примноженні обчислювальної потужності. Існує величезна кількість механізмів, що дозволяє досягти цієї мети. Наприклад, досягти прямого зниження енергоспоживання IT-обладнання можна за допомогою віртуалізації, істотно підвищує коефіцієнт використання серверів, типове значення якого сьогодні знаходиться на неприпустимо низькому рівні.

 

Немає коментарів:

Дописати коментар