Key Characteristics of Distributed Systems

30 January 2020 - 4 mins read time
Tags: System Design

Key Characteristics of Distributed Systems

분산 시스템의 주요 특징으로는 확장 성, 신뢰성, 유용성, 효율성 및 관리성이 있습니다. 간단히 살펴 보겠습니다.

확장성

확장성은 시스템, 프로세스 또는 네트워크의 수요 증가 및 관리 기능 증가하는 작업량을 지원하기 위해 지속적으로 진화할 수 있는 모든 분산 시스템은 확장 가능한 것으로 간주된다.

시스템은 데이터 볼륨 증가 또는 작업량 증가와 같은 여러 가지 이유로 인해 확장되어야 할 수 있다. 확장 가능한 시스템은 성능 손실 없이 이러한 확장을 달성하기를 원한다.

일반적으로 시스템의 성능은 확장 가능하도록 설계(또는 청구)되었지만 관리 비용이나 환경 비용 때문에 시스템 크기에 따라 저하된다. 예를 들어, 기계가 서로 멀리 떨어져 있기 때문에 네트워크 속도가 느려질 수 있다. 보다 일반적으로 일부 작업은 고유의 원자성 때문에 또는 시스템 설계에 어떤 결함이 있기 때문에 분산되지 않을 수 있다. 어떤 시점에서, 그러한 업무는 분배에 의해 얻어진 속도 증가를 제한할 것이다. 확장 가능한 아키텍처는 이러한 상황을 피하고 모든 참여 노드의 부하 균형을 균등하게 맞추려고 시도한다.

수평 vs 수직 스케일링 : 수평적 확장이란 자원 풀에 서버를 더 추가하여 확장하는 것을 의미하며, 수직적 확장이란 기존 서버에 더 많은 전력(CPU, RAM, 스토리지 등)을 추가하여 확장하는 것을 의미한다.

수평적 스케일링을 사용하면 기존 풀에 시스템을 추가하여 동적으로 확장하기가 더 쉽다. 수직적 스케일링은 대개 단일 서버의 용량으로 제한되며 그 용량을 초과하는 확장에는 다운타임이 수반되는 경우가 많다.

수평적 확장의 좋은 예는 Cassandra와 MongoDB이다. 왜냐하면 둘 다 증가하는 요구를 충족시키기 위해 더 많은 기계를 추가함으로써 수평적으로 확장하는 쉬운 방법을 제공하기 때문이다. 마찬가지로, 수직 스케일링의 좋은 예는 MySQL이다. MySQL은 더 작은 기계에서 더 큰 기계로 전환함으로써 수직 스케일링을 쉽게 할 수 있기 때문이다. 그러나 이 프로세스는 다운타임을 수반하는 경우가 많다.

architecture

신뢰성

정의에 따르면 신뢰성은 특정 기간 내에 시스템이 고장날 확률이다. 간단히 말해서, 분산 시스템은 소프트웨어 또는 하드웨어 구성 요소 중 하나 또는 여러 개에 장애가 발생하더라도 서비스를 계속 제공한다면 신뢰할 수 있는 것으로 간주된다. 신뢰성은 모든 분산 시스템의 주요 특징 중 하나를 나타낸다. 그러한 시스템에서는 고장 난 기계는 항상 다른 정상적인 기계로 교체되어 요청된 작업의 완료를 보장할 수 있기 때문이다.

큰 전자 상거래 상점(아마존과 같은)을 예로 들어보자. 주요 요구사항 중 하나는 해당 거래를 실행하는 기계의 고장으로 인해 어떠한 사용자 거래도 취소되어서는 안 된다는 것이다. 예를 들어, 사용자가 쇼핑 카트에 물건을 추가한 경우, 시스템은 물건을 잃지 않을 것으로 예상된다. 신뢰할 수 있는 분산 시스템은 소프트웨어 구성 요소와 데이터의 중복성을 통해 이를 달성한다. 사용자의 쇼핑 카트를 운반하는 서버가 고장 나면 쇼핑 카트의 정확한 복제본이 있는 다른 서버가 이를 교체해야 한다.

물론, 중복성은 비용이 들고, 모든 실패 지점을 제거함으로써 서비스에 대한 그러한 복원력을 달성하기 위해서는 신뢰할 수 있는 시스템이 그 대가를 지불해야 한다.

가용성

정의에 따르면 가용성은 시스템이 특정 기간 동안 필요한 기능을 수행하기 위해 작동 상태를 유지하는 시간이다. 시스템, 서비스 또는 기계가 정상 조건에서 작동 상태를 유지하는 시간의 비율을 나타내는 간단한 측정이다. 한 달에 몇 시간씩 다운타임 없이 비행할 수 있는 항공기는 가용성이 높다고 할 수 있다. 가용성은 유지관리성, 수리 시간, 예비 가용성 및 기타 물류 고려 사항을 고려한다. 항공기가 정비를 위해 정지해 있는 경우, 그 기간 동안 항공기를 이용할 수 없는 것으로 간주한다.
신뢰성이란 발생할 수 있는 가능한 실제 상황의 전체 범위를 고려할 때 시간의 경과에 따른 가용성이다. 어떤 날씨라도 안전하게 통과시킬 수 있는 항공기는 가능한 조건에 대한 취약성이 있는 항공기보다 더 신뢰할 수 있다.

신뢰도 VS 가용성
시스템이 신뢰할 수 있으면 이용할 수 있다. 그러나 이용할 수 있다면 반드시 신뢰할 수 있는 것은 아니다. 즉, 높은 신뢰성은 높은 가용성에 기여하지만, 수리 시간을 최소화하고 필요할 때 항상 예비품을 사용할 수 있도록 보장함으로써 신뢰할 수 없는 제품으로도 고가용성을 달성할 수 있다. 출시 후 처음 2년간 99.99%의 가용성을 가진 온라인 소매점을 예로 들어보자. 그러나 이 시스템은 정보보안 테스트 없이 출범했다. 고객들은 이 시스템에 만족하고 있지만, 그들은 그것이 발생할 수 있는 위험에 취약하기 때문에 그다지 신뢰할 수 없다는 것을 알지 못한다. 3년째에, 이 시스템은 일련의 정보보안 사고를 경험하게 되고, 이로 인해 갑자기 장기간에 걸쳐 가용성이 극도로 낮아진다. 이것은 고객에게 평판과 재정적 손실을 초래한다.

효율성

분산 시스템의 효율성을 측정하는 방법을 이해하려면 분산 방식으로 실행되고 그에 따라 항목 집합을 전달하는 작업이 있다고 가정해 봅시다. 그 효율성에 대한 두 가지 표준 척도는 첫 번째 항목을 얻는 지연을 나타내는 응답 시간(또는 지연 시간)과 주어진 시간 단위로 전달되는 항목 수(예: 1초)를 나타내는 처리량(또는 대역폭)이다. 이 두 가지 조치는 다음과 같은 단가에 해당한다.

메시지 크기에 관계없이 시스템 노드가 전역적으로 보낸 메시지 수입니다.
데이터 교환 볼륨을 나타내는 메시지 크기.
분산된 데이터 구조(예: 분산된 인덱스에서 특정 키를 검색)가 지원하는 작업의 복잡성은 이러한 비용 단위 중 하나의 기능으로 특징지을 수 있다. 일반적으로 ‘메시지 수’라는 관점에서 분산된 구조를 분석하는 것은 지나치게 단순하다. 네트워크 토폴로지, 네트워크 부하 및 그 다양성, 데이터 처리 및 라우팅에 관련된 소프트웨어와 하드웨어 구성요소의 가능한 이질성 등을 포함한 많은 측면의 영향을 무시한다. 그러나, 이러한 모든 성능 요소를 정확히 고려하는 정확한 비용 모델을 개발하는 것은 상당히 어렵다. 따라서 우리는 시스템 동작에 대한 대략적이지만 견실한 추정치를 가지고 살아가야 한다.

서비스 가능성 또는 관리 가능성

분산형 시스템을 설계하면서 또 다른 중요한 고려사항은 운영과 유지관리가 얼마나 쉬운가 하는 것이다. 사용 편의성 또는 관리성은 시스템을 수리하거나 유지할 수 있는 단순성과 속도다. 고장난 시스템을 수리하는 시간이 증가하면 가용성이 감소한다. 관리성을 위해 고려해야 할 사항은 문제가 발생했을 때 쉽게 진단하고 이해할 수 있는 것, 업데이트나 수정을 할 수 있는 것, 그리고 시스템이 얼마나 단순하게 작동하는지(즉, 고장이나 예외 없이 일상적으로 작동하는지)이다.

고장을 조기에 발견하면 시스템 다운타임을 줄이거나 방지할 수 있다. 예를 들어, 일부 엔터프라이즈 시스템은 시스템이 시스템 고장을 경험할 때 자동으로 서비스 센터를 호출할 수 있다.