이 문서의 번역:

사례연구 : 샌디에이고 슈퍼컴퓨터 센터 1부



SDSC 데이터센터의 새로운 냉각 설계는 에너지 절약과 비용의 절감, 그리고 중요데이터를 보호한다.

빅데이터의 유지

항공연구원들이 초음속 항공기를 설계하고 테스트 할 때 유체역학 분석에 대한 도움은 어디에서 받을 까? 어떻게 의약품이 개인 맞춤형화 되고 환자의 게놈을 분석해 질병 예방을 할 수 있을 까? 무엇이 의학연구원이 뇌지도를 사용하는 데 있어 도움을 줄 것이며, 이의 기능을 분석해 파킨슨 병이나 간질 같은 뇌질환을 이겨낼 수 있게 해 줄까? 지구 온도 변화를 이해하기 위해 어떻게 온실가스와 해류를 동시에 분석할 수 있을 까? 지질연구원들은 언젠가는 지진을 예측 할 수 있을 까? 또는 언젠가는 별들의 상호작용을 이해하고, 새로운 은하계를 발견할 수 있을 까? 그리고 시간이 흐르면 우주진화에 대해 연구 할 수 있을 까?

샌디에이고 슈퍼컴퓨터 센터(San Diego Supercomputer Center, SDSC)에서는 클러스터 기반 슈퍼컴퓨터를 통해 이런 수 많은 과제들을 하나씩 풀어가고 있다.

SDSC는 캘리포니아 대학의 부속연구기관이다. 많은 사람들이 슈퍼컴퓨터를 떠올릴 때 하나의 거대한 컴퓨터를 생각하는데, 실제로 SDSC 데이터 센터에 가보면 몇 개의 슈퍼컴퓨터 시스템이 서로 상호 작용하고 있으며, 연구원들은 언제든지 각각을 이용해 다양한 과제를 수행할 수 있다.
SDSC는 진보된 계산과학과 데이터 집약 그리고 고성능 컴퓨터를 통해 과학의 국제적 협력 및 기술발견을 가능하게 한다.
SDSC는 데이터 집약, 자원의 제공 및 서비스, 그리고 전문지식에서 국가연구기관의 선도주자가 되려고 한다. 슈퍼컴퓨터 센터는 고성능 하드웨어 기술, 통합 소프트웨어 기술, 그리고 여러 학문 분야가 관련된 깊이 있는 전문지식을 제공함으로써, 과학적 성과를 더 많은 사람들과 공유하고자 한다.
SDSC는 고성능 컴퓨팅, 그리드 컴퓨팅, 컴퓨터 생물학, 지질정보학, 컴퓨터 물리학, 컴퓨터 화학, 데이터 운영, 과학적 시각화, 그리고 컴퓨터 네트워킹 분야의 연구를 추구한다.



빅데이터로부터의 유용한 데이터 수집

IBM에 따르면 “매일 250경 바이트의 데이터가 생산되며, 오늘날 전 세계에 있는 데이터의 90%는 최근 2년간 만들어진 데이터이다. 몇 가지 예를 들자면, 이 데이터들은 날씨 정보를 수집하는 센서, SNS 포스트, 디지털 사진 및 비디오, 구매기록, 그리고 휴대전화의 GPS 신호에서 수집된 것들이다. 이런 데이터를 빅데이터라고 부른다.”

이런 방대한 양의 데이터로부터 정보를 구분하고 가치 있는 정보를 수집하는 것은 몇 가지 이유에서 볼 때 큰 도전이 아닐 수 없다.

 오늘날 생성되는 대부분의 빅데이터는 내제된 가치를 가지고 있지 않다. 그럼에도 불구하고 전 세계 데이터베이스에 걸쳐 기록되고 수집된다. 왜냐하면, 그 속에는 무엇인가 더 큰 것이 있기 때문이다. 하지만 이런 방대한 데이터는 연구원들이 수집하려고 하는 데이터의 가치를 흐리게 만들 수 있다.  빅데이터는 매우 빠르게 늘어나고 있고, 이 속도는 지속적으로 증가할 것이다.  마지막으로 빅데이터는 매우 다양한 소스로부터 형성되며, 매우 다양한 형태로 저장 된다.

이런 것들이 바로 오늘날 원구원들이 마주한 도전인 것이다. 연구과제에서 발생하는 방대한 양의 데이터 분류와 중요하지 않거나, 잘못된 데이터를 걸러내는 것은 거대한 연산력을 요구 한다. 일반적인 PC 아키텍쳐는 이런 빅데이터를 처리할 수 없다. 매우 다른 컴퓨터 시스템이 필요하다.

컴퓨터 처리능력의 측정

처리능력은 FLOPS(초당 부동 소수점 연산)로 측정된다. - 비전문가들의 말을 빌리자면, FLOPS는 얼마나 빨리 컴퓨터가 십진법의 숫자를 계산을 하는지를 나타낸다. -
컴퓨터 시스템이 1순환당 실행할 수 있는 방정식의 수는 시스템의 하드웨어 아키텍처와 아래의 방정식을 사용해 계산한 것에 따른다.



빅데이터를 명확하게 하기 위해서, 그리고 복잡한 문제 해결에 적용하기 위해서, SDSC 슈퍼컴퓨터들은 일반 PC와는 철저하게 다른 아키텍처를 사용한다. 일반 PC CPU가 두 개 또는 네 개의 코어 프로세서로 구성되는 반면, 고성능 컴퓨터는 훨씬 더 큰 처리 능력과 메모리가 필요하다.

SDSC의 최신 슈퍼컴퓨터 코멧은 총 47,776개의 인텔 하스웰 코어와 247 테라바이트 메모르를 탑재하고 있다. 코멧은 최대 1초당 2페타플롭스¹ 또는 2쿼드릴리온² 부동소수점(Floating Point)³을 연산할 수 있다.

그런데…



코멧과 같은 컴퓨팅 아키텍처가 시스템을 운영하기 위해서는 1메가와트의 전력이 필요하다. 이런 엄청난 양의 전력소비는 SDSC 데이터 센터내에 엄청난 열을 발생시킨다. 모드 컴퓨터들이 가동 될 때는 발열이 일어나지만, SDSC에 있는 슈퍼컴퓨터는 보통 컴퓨터와는 비교가 안 될 정도의 발열을 일으킨다.



코멧 및 다른 슈퍼컴퓨터 시스템들의 지나친 발열을 막고, SDSC데이터센터를 시원하게 유지하는 것은 매우 복잡하며, 불가능에 가까운 과제라고 토도르 밀코브 SDSC 책임 프로젝트 엔지니어가 말한다.

도전

SDSC 슈퍼컴퓨터는 전세계 다양한 연구기관에서 분석을 위해 사용되었다. 모든 시스템이 주어진 시간 동안 최대치의 능력으로 운영되는 것은 아니다. 슈퍼컴퓨터 센터에 설치된 시스템 또한 연구과제에 따라 규칙적으로 바뀐다. 이런 지속적으로 변화하는 요소들은 슈퍼컴퓨터 시스템으로부터 허투루 사용된 상당한 양의 열을 시시때때로 변동하기위해 발생시킨다. 그렇기 때문에 데이터센터의 냉각시스템은 이런 거듭되는 온도변화에 빠르게 적용해야 한다. 많은 데이터센터들은 표준 열기 통로와 냉기 통로 설계를 사용한다. 이 설계는 교차 열의 한 줄로 배열된 서버 랙(Rack)을 포함하는데, 냉기 통로 흡입구가 한 쪽과 마주보게 그리고 열기 통로 배출구가 다른 쪽과 마주보게 한다.

 랙(Rack) 앞쪽으로 구성된 열(row)은 냉기 통로라고 불리며, 일반적으로 냉기 통로는 에어컨디셔너 출력관과 마주한다.

 열기 분출 열(row)은 열기 통로라고 불리며, 일반적으로 열기 통로는 에어컨디셔너 리턴관과 마주한다.

방지시스템은 열기 통로와 냉기 통로가 섞이지 않고 독립될 수 있도록 해준다. 초창기 방지 시스템은 단순히 열기 통로와 냉기통로를 비닐 플라스틱 시팅 또는 플랙시글라스 커버로 나누는 물리적 장벽으로 시작하였다. 하지만 현재 방지시스템은 강제환기장치와 차가운 공기와 더운 공기가 섞이지 않도록 방지하는 가변적인 팬 드라이브(VFDs)를 갖춘 혼합 방지 상업용 옵션을 갖추고 있다.

그러나, SDSC는 올림바닥⁴의 밑부분 전체는 공급 강제환기장치를 사용하였고, 천장 위쪽은 리턴 강제환기장치를 사용하였다.



냉기 통로는 아래 층의 공간에서부터 공기흐름의 양을 조절할 수 있는 구멍 크기를 갖춘 다공관 바닥 타일로 되어 있다. \\ 
열기 통로는 뜨거운 공기가 위쪽 천장의 공간으로 흘러 들어 갈 수 있도록 해주는 천장 〖그라트〗^5를 사용한다. 



냉각시스템 연구

냉각시스템의 설계로 SDSC 슈퍼컴퓨터에서 발생하는 방대한 양의 열을 조절 할 수 있었다. 센터에서는 어떤 것이 가장 효율적 방법인지를 결정하기위해 세가지 냉각시스템 프로토타입과 연구를 진행하였다.

각 프로토타입 시스템은 시스템 운영 평가를 기본으로 한 다섯 개 공기조절장치를 컨트롤 하는 밴더고유의 기술을 사용해 설계되었다.

그 중 한 가지는 베터리 수명을 증가 시킬 수 있도록 매 3분마다 열기와 냉기 통로의 온도를 측정하는 무선 온도 센서를 사용하였다.
“우리는 냉각 시스템의 프로토타입과 연구단계를 설계하면서 많은 것들을 배웠다.”고 밀코브는 말했다. “첫 번째로 우리는 어떻게 공기가 데이터센터로 흘러가는지에 관한 많은 양의 데이터를 수집하는 것부터 시작하였다. 그리고 우리는 3분 간격으로 온도의 변화를 읽어 내는 것은 데이터 센터의 적정온도 범위를 유지하기에는 너무 길다는 것을 알았다.”
“측정 시간간격이 길었기 때문에, 우리는 온도 설정 값을 데이터센터로 가져오는 데 우리가 필요로 했던 것 보다 더 많은 전력을 소비해야 했다. 만약 우리가 측정 시간간격을 짧게 하고, 냉각 시스템을 더 빠르게 교체할 수 있었다면 온도 설정 값에 지나치게 멀어 지기 전에 제어가 가능 했을 것이다.”





페타플롭스¹ : 1초당 1,000조번의 수학 연산처리를 뜻하는 말로써 줄여서 페타플롭(PetaFlop) 또는 피플롭(PFLOP)이라고도 한다.SI(The International System of Units:국제단위계)에서 10의 15제곱을 나타내는 접두어 페타(Peta)와 초당 수행 가능한 부동소수점(浮動小數點)의 연산횟수를 가리키는 컴퓨터 성능 단위 플롭스(Flops)를 합성한 신조어이다. 1페타플롭스 프로세서를 장착한 컴퓨터는 펜티엄133Mz 프로세서보다 1억배 빠른 연산처리속도를 갖는다.

쿼드릴리온² : 1000조, 1015

부동소수점(Floating Point)³ : 컴퓨터에서 실수를 표시하는 방법으로, 소수점의 위치를 고정시키지 않으며 가수와 지수를 사용하여 실수를 표현한다. 가수는 유효숫자를 나타내며 지수는 소수점의 위치를 나타낸다.

올림바닥⁴ raised floor : 컴퓨터실 바닥 위에 또다시 바닥을 설치한 바닥. 컴퓨터실의 특징으로서 바닥과 바닥의 공간에 전원용 케이블이나CPU와 각 입출력 장치 간의 케이블 등을 넣어서 표면에 나오지 않게 한 것. 사무실의 바닥 강도는 300~330kg/㎥이 보통이지만 기계실은 700~ 1,000kg/㎥을 요하므로 올림 바닥 등에 의해서 하중 분산이 되어 유효하다. 올림 바닥에는 다시 레이스웨이(raceway)나 프리 액세스(free access) 등의 방법이 있다.

그라트5: 각종 노의 연소실 하부에 장비된 고체 연료를 밑받쳐 주게 되는 격자 모양의 메탈 피팅스(metal fittings)이다. 단순히 막대 모양의 것을 늘어놓은 것도 있다. 내열강, 내열주철, 백주철 등으로 만들어진다.


글 : OPTO 22 Case Study _ San Diego Supercomputer Center
번역 : 박대희 선임연구원
편집 : 박대희 선임연구원

이 문서의 번역:
사례연구/샌디에이고_슈퍼컴퓨터_센터_1부.txt · 마지막으로 수정됨: 2016/07/12 17:05 저자 wikiadmin
CC Attribution-Share Alike 3.0 Unported
Powered by PHP Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Valid HTML5