HPC(고성능 컴퓨팅)는 기존 컴퓨터와 서버보다 훨씬 높은 마력을 제공하는 방식으로 컴퓨팅 성능을 통합하는 방식을 말합니다. HPC 또는 슈퍼 컴퓨팅은 일상적인 컴퓨팅과 같지만 더 강력합니다. 여러 대의 컴퓨터와 스토리지를 응집력 있는 패브릭으로 사용하여 매우 빠른 속도로 방대한 양의 데이터를 처리하는 방법입니다. HPC를 사용하면 사이언스, 엔지니어링 및 비즈니스에 있어 가장 큰 문제들을 탐색하고 이에 대한 답을 찾을 수 있습니다.
오늘날 HPC는 복잡한 성능 중심 문제를 해결하는 데 사용되며 기업들은 점점 더 HPC 워크로드를 클라우드로 전환하고 있습니다. 클라우드의 HPC는 필요한 프로토타입 수 감소, 테스트 가속화, 출시 소요 시간 단축 등의 이유로 제품 개발 및 연구의 경제성을 변화시키고 있습니다.
DNA 시퀀싱 같은 일부 워크로드는 단일 컴퓨터에서 처리하기에 규모가 너무 방대합니다. HPC 또는 슈퍼 컴퓨팅 환경은 단기간에 대량의 컴퓨팅을 수행하기 위해 하나의 클러스터(연결 그룹)에서 개별 노드들(컴퓨터)을 작동시킴으로써 이렇게 규모가 크고 복잡한 문제를 해결합니다. 이러한 클러스터의 생성 및 제거는 비용을 줄이기 위해 클라우드에서 자동화되는 경우가 많습니다.
HPC는 다양한 종류의 워크로드에서 실행이 가능하지만, 가장 일반적인 두 가지 사용 사례로 처치 곤란 병렬 워크로드와 긴밀하게 결합된 워크로드를 들 수 있습니다.
동시에 실행 가능한 작고 단순하며 독립적인 작업으로 구분된 컴퓨태이셔널 문제들을 의미합니다. 이 작업들은 서로 커뮤니케이션을 거의 또는 전혀 하지 않는 경우가 많습니다. 예를 들어, 회사는 노드 클러스터에서 개별 프로세서 코어에 1억 개의 신용 카드 레코드를 제출할 수 있습니다. 하나의 신용 카드 레코드를 처리하는 것은 규모가 작은 작업이기 때문에 1억 개의 레코드가 클러스터에 분산되어 있으면 이러한 작은 작업을 동시에(병렬로) 놀라운 속도로 수행할 수 있습니다. 일반적인 사용 사례로는 위험 시뮬레이션, 분자 모델링, 컨텍스트 검색 및 물류 시뮬레이션이 있습니다.
일반적으로 대규모 공유 워크로드를 가져와서 작은 작업으로 분할하되, 작업들 간에는 지속적인 소통이 이루어지는 경우입니다. 즉, 클러스터의 서로 다른 노드들은 처리를 수행할 때 서로 소통합니다. 일반적인 사용 사례로는 전산 유체 역학, 일기 예보 모델링, 재료 시뮬레이션, 자동차 충돌 에뮬레이션, 지리 공간 시뮬레이션 및 교통 관리가 있습니다.
HPC는 수십 년 동안 학술 연구 및 산업 혁신에서 중요한 부분을 차지했습니다. HPC는 엔지니어, 데이터 사이언티스트, 설계자 및 기타 연구자들이 기존 컴퓨팅보다 훨씬 적은 시간과 비용으로 크고 복잡한 문제를 해결할 수 있도록 도와줍니다.
HPC의 주요 장점은 다음과 같습니다.:
거의 모든 산업 분야의 Fortune 1000대 기업이 HPC를 사용하고 있으며, 그 인기가 날로 높아지고 있습니다. Hyperion Research에 따르면 2022년, 전 세계 HPC 시장의 규모는 440억 달러에 달할 것으로 예상됩니다.
다음은 HPC를 사용하는 일부 산업과 HPC를 통해 수행을 지원할 수 있는 워크로드의 유형입니다.
HPC는 온프레미스, 클라우드 또는 이 둘을 합친 하이브리드 모델에서 수행이 가능합니다.
온프레미스 HPC 배포 모델의 경우, 기업이나 연구 기관이 서버, 스토리지 솔루션 및 향후 관리 및 업그레이드가 가능한 기타 인프라로 이루어진 HPC 클러스터를 구축합니다. 클라우드 HPC 배포 모델에서는 클라우드 서비스 제공업체가 인프라를 운영 및 관리하고 조직은 Pay-as-you-go 모델에서 인프라를 사용합니다.
일부 조직, 특히 온프레미스 인프라에 투자했지만 클라우드의 속도, 유연성 및 비용 절감 이점을 활용하려는 조직은 하이브리드 배포 모델을 사용합니다. 클라우드를 사용하면 일부 HPC 워크로드를 지속적으로 실행하고, 온프레미스에서 대기열 시간이 문제가 될 때마다 임시로 클라우드 서비스로 전환을 할 수 있습니다.
온프레미스 HPC 환경을 보유한 조직은 운영에 대한 상당한 제어 권한을 확보하지만, 다음과 같은 몇 가지 문제를 해결해야합니다.
온프레미스 환경의 비용 및 기타 문제로 인해 클라우드 기반 HPC 배포의 인기가 점차 높아지고 있는 부분도 있지만, Market Research Future는 2017년부터 2023년까지 전 세계 시장 성장률이 21%에 이를 것으로 예상하고 있습니다. 클라우드에서 HPC 워크로드를 실행하는 기업은 사용량에 대해서만 비용을 지불하고 필요에 따라 신속하게 워크로드를 확장/감축할 수 있습니다.
정상급 클라우드 제공업체들은 고객을 확보하고 유지하기 위해 HPC 워크로드용으로 특별 설계된 최첨단 기술을 유지하고 있기 때문에 온프레미스 장비가 노후화되어도 성능이 저하될 위험이 없습니다. 클라우드 제공업체는 가장 빠른 최신 CPU 및 GPU를 비롯해 저지연 플래시 스토리지, 초고속 RDMA 네트워크 및 엔터프라이즈급 보안을 제공합니다. 이 서비스는 대기 시간이 거의 없이 매일, 하루 종일 사용할 수 있습니다.
모든 클라우드 제공업체의 제품이 똑같지는 않습니다. HPC용으로 설계되지 않아서 워크로드 요구가 높은 피크 기간 동안에는 최적의 성능을 제공할 수 없는 클라우드도 있습니다. 클라우드 제공업체를 선택할 때 고려해야 할 4가지 특성은 다음과 같습니다.
일반적으로 더 강력한 제어와 성능을 제공하는 베어메탈 클라우드 서비스를 선택하는 것이 가장 좋습니다. RDMA 클러스터 네트워킹과 베어메탈 HPC를 하나로 결합하면 온프레미스에서 유사한 하드웨어를 사용할 때와 동일한 결과를 얻을 수 있습니다.
여러 산업 분야의 기업과 기관들이 HPC에 눈을 돌리면서 성장을 주도하고 있으며, 이러한 추세는 향후 수 년 동안 이어질 것으로 예상됩니다. 전 세계 HPC 시장의 규모는 2017년 310억 달러에서 2023년 500억 달러로 확장될 것으로 예상됩니다. 클라우드 성능이 지속적으로 개선되고 더욱 안정적이고 강력해짐에 따라 데이터 센터 인프라 및 관련 비용에 수 백만 달러를 투자할 필요가 없는 클라우드 기반 HPC 배포에서 가장 큰 성장이 있을 것으로 보입니다.
머지 않아 대규모 컴퓨터 클러스터를 사용해 빅 데이터를 분석하고 시뮬레이션 및 기타 HPC 워크로드를 실행하는 등 빅 데이터와 HPC가 하나로 통합될 것으로 전망됩니다. 대세인 이 두 가지 기술이 통합됨에 따라 각각에 대한 컴퓨팅 성능과 용량이 증가하여 훨씬 획기적인 연구와 혁신으로 이어질 것으로 보입니다.
i Earl Joseph, Steve Conway, Bob Sorensen, Alex Norton Hyperion 연구 업데이트: ISC19. https://hyperionresearch.com/wp-content/uploads/2019/06/Hyperion-Research-ISC19-Breakfast-Briefing-Presentation-June-2019.pdf