객체지향의 사실과 오해 3장

3장 타입과 추상화

추상화를 통한 복잡성 극복

헤리 백의 지하철 노선도는 불필요한 지형 정보를 제거하고 역 사이의 연결성을 강조함으로써 승객들의 목적에 맞게 현실을 추상화하고 단순화했다. 이 추상화가 유용했던 이유는 승객들이 지하철을 바라보는 모델과 일치했기 때문이다. 즉, 역의 위치가 중요한 것이 아니라 역과 역 사이의 연결 관계가 중요했던 것이다.

:bulb: 진정한 의미에서 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 놀라운 본질을 드러나게 하는 과정이라고 할 수 있다.

추상화는 어떤 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해 특정 절차나 물체를 의도적으로 생략하거나 감춤으로써 복잡도를 극복하는 방법이다.
복잡성을 다루기 위해 추상화는 두 차원에서 이뤄진다.

  • 첫번째 차원은 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순하게 만드는 것이다.
  • 두번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거함으로써 단순하게 만드는 것이다.

객체지향과 추상화

모두 트럼프일 뿐

앨리스와 하트 여왕이 처음 마주치는 장면에서 수많은 객체들이 등장한다. 정원사, 클로버 병사, 신하들, 공주와 왕자, 왕과 왕비들 모두 객체다.

등장하는 객체는 제각기 독특한 모습을 하고 있으며, 독특한 행동 양식을 지니고 있다. 하지만, ‘기껏해야 트럼프에 불과해’라는 앨리스의 마지막 대사에서 알 수 있는 것처럼 모든 객체를 계급, 나이, 성격 등의 차이점을 무시한 채 트럼프라는 하나의 개념으로 단순화(추상화)해서 바라보고 있다.

그룹으로 나누어 단순화하기

앨리스는 인물들을 하나씩 살펴보면서 자신이 알고 있는 ‘트럼프’의 의미에 적합한 인물은 ‘트럼프’ 그룹에 포함하고 ‘트럼프’라는 의미에 적합하지 않은 인물은 ‘트럼프’ 그룹에서 제외했다. 결과적으로 앨리스는 정원에 있는 인물들을 트럼프의 그룹과 토끼 그룹으로 나눴다. 두 개의 렌즈를 통해 정원을 바라보는 것은 정원에 내재된 복잡성을 효과적으로 감소시킨다.

개념

다양한 차이점을 무시하고 공통점만을 취해 단순화하는 것은 추상화의 일종이다. 이처럼 공통점을 기반으로 객체를 묶기 위한 그릇을 개념(concept)이라고 한다. 개념이란 일반적으로 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 뜻한다.

개념을 이용하면 객체를 여러 그룹으로 분류(classification)할 수 있다. 결과적으로 개념은 공통점을 기반으로 객체를 분류할 수 있는 일종의 체라고 할 수 있다. 각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 개념 그룹의 일원이 될 때, 객체를 그 개념의 인스턴스(instance)라고 한다.

객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다.
개념이 객체에 적용됐을 때 객체를 개념의 인스턴스라고 한다.

개념의 세 가지 관점

어떤 객체에 어떤 개념이 적용됐다고 할 때는 그 개념이 부가하는 의미를 만족시킴으로써 다른 객체와 함께 해당 개념의 일원이 됐다는 것을 의미한다.

  1. 심볼(symbol)
    • 개념을 가리키는 이름이나 명칭
    • ex) ‘트럼프’
  2. 내연(intension)
    • 개념의 완전한 정의를 나타낸다.
    • 개념을 객체에게 적용할 수 있는지 여부를 판단하기 위한 조건
    • ex) 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리에 달려 있는 등장인물
  3. 외연(extension)
    • 개념에 속하는 모든 객체의 집합(set)
    • ex) 정원사, 병사, 신하, 왕자와 공주, 하객으로 참석한 왕과 왕비들, 하트 잭, 하트왕과 하트 여왕

객체를 분류하기 위한 틀

외연의 관점에서 어떤 객체에 어떤 개념을 적용할 수 있다는 것은 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다. 객체에 어떤 개념을 적용할 것인지를 결정하는 것은 결국 객체들을 개념에 따라 분류하는 것과 동일하다. 따라서 분류란 특정한 객체를 특정한 개념의 객체 집합에 포함시키거나 포함시키지 않는 작업을 의미한다.

분류란 객체에 특정한 개념을 적용하는 작업이다.
객체에 특정한 개념을 적용하기로 결심했을 때 우리는 그 객체를 특정한 집합의 멤버로 분류하고 있는 것이다.

어떤 객체를 어떤 개념으로 분류할지가 객체지향의 품질을 결정한다. 객체를 적절한 개념에 따라 분류한 애플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다. 적절한 분류 체계는 애플리케이션을 다루는 개발자의 머리속에 객체를 쉽게 찾고 조작할 수 있는 정신적인 지도를 제공한다는 것이다.

분류는 추상화를 위한 도구다

개념을 통해 객체를 분류하는 과정은 추상화의 두 가지 차원을 모두 사용한다.

  1. 첫번째 차원: 구체적인 사물 간의 공통점을 취하고 차이점은 버리는 일반화를 통해 단순화하는 것이다.

    • 정원사, 병사, 신하, 왕자와 공주, 왕과 왕비들, 하트 잭, 하트 왕과 하트 여왕을 트럼프라는 개념으로 묶은 것은 개별 객체간의 차이점은 무시하고 공통점을 취한 결과다.
  2. 두번째 차원: 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거해 단순화하는 것이다.

    • 트럼프에 속하는 객체들의 공통점 중 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리에 달려 있다는 것 외의 사항들은 무시하고 있다.

타입

타입은 개념이다

타입의 정의는 개념의 정의와 완전히 동일하다. 타입은 공통점을 기반으로 객체들을 묶기 위한 틀이다. 개념과 마찬가지로 심볼, 내연, 외연을 이용해 서술할 수 있으며 타입에 속하는 객체 역시 타입의 인스턴스라고 한다.

타입은 개념과 동일하다.
따라서 타입이란 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 의미한다.
어떤 객체에 타입을 적용할 수 있을 때 그 객체를 타입의 인스턴스라고 한다.
타입의 인스턴스는 타입을 구성하고 외연인 객체 집합의 일원이 된다.

데이터 타입

컴퓨터가 어떤 작업을 수행하기 위해서는 작업에 필요한 데이터를 메모리 안으로 불러들여야 한다. 메모리 안의 데이터를 다룰 수 있는 단 하나의 타입만이 존재하며, ‘타입이 없다(Untyped)’를 의미한다. 타입이 없는 체계 안에서 모든 데이터는 일련의 비트열(bit string)로 구성된다. 어떤 메모리 조각에 들어 있는 값의 의미는 그 값을 가져다 자신의 용도에 맞게 사용하는 외부의 해석가에 의해 결정된다. 여기서 해석가는 애플리케이션이라고 부르는 프로그램을 포함한다.

메모리 안의 모든 데이터가 비트열로 보임으로써 야기되는 혼란을 방지하기 위해서 데이터를 목적에 따라 분류하기 시작했고 타입 시스템(type system)이 자라나기 시작했다. 타입 시스템은 데이터가 잘못 사용되는 것을 방지하기 위해 제약사항을 부과했다.

  • 타입은 데이터가 어떻게 사용되느냐에 관한 것이다.
    • 데이터가 어떤 타입에 속하는지를 결정하는 것은 데이터에 적용할 수 있는 작업이다.
      • 연산자(operator): 데이터를 이용해 수행할 수 있는 작업
    • 어떤 데이터에 어떤 연산자를 적용할 수 있느냐가 그 데이터의 타입을 결정한다.
  • 타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다.
    • 개발자는 데이터 타입의 표현 방식을 몰라도 데이터를 사용하는 데 지장이 없다.
      • 단순히 데이터 타입에 적용할 수 있는 연산자만 알고 있으면 된다.

데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다.
데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.

객체와 타입

객체를 타입에 따라 분류하고 그 타입에 이름을 붙이는 것은 프로그램에서 사용할 새로운 데이터 타입을 선언하는 것과 같다. 하지만, 객체는 데이터가 아니다. 객체에서 중요한 것은 객체의 행동이다. 상태는 행동의 결과로 초래된 부수효과를 쉽게 표현하기 위해 도입한 추상적인 개념일 뿐이다.

객체를 창조할 때 가장 중요하게 고려해야 하는 것은 객체가 협력을 위해 어떤 책임을 지녀야 하는지(어떤 행동을 해야하는지)를 결정하는 것이다.

  • 어떤 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다.
    • 어떤 객체들이 동일한 행동을 수행할 수 있다면 그 객체들은 동일한 타입으로 분류될 수 있다.
  • 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다.
    • 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.

행동이 우선이다

위 두가지 조언을 통해, 객체의 내부 표현 방식이 다르더라도 어떤 객체들이 동일하게 행동한다면 그 객체들은 동일한 타입에 속한다. 즉, 동일한 책임을 수행하는 일련의 객체는 동일한 타입에 속한다고 말할 수 있다. 이는 객체를 타입으로 분류할 때 사용해야 하는 기준을 명확하게 제시한다. 즉, 객체의 타입을 결정하는 것은 객체의 행동뿐이다. 객체가 어떤 데이터를 보유하고 있는지는 아무런 영향도 미치지 않는다.

동일한 책임이란 동일한 메시지 수신을 의미한다. 따라서 동일한 타입에 속한 객체는 내부의 데이터 표현 방식이 다르더라도 동일한 메시지를 수신하고 이를 처리할 수 있다. 다만 동일한 메시지를 처리하는 방식은 서로 다를 수 밖에 없다. 동일한 요청에 대해 서로 다른 방식으로 응답할 수 있는 능력을 다형성라고 한다. 다형적인 객체들은 동일한 타입(또는 타입 계층)에 속하게 된다.

데이터의 내부 표현 방식과 무관하게 행동만이 고려 대상이라는 사실은 외부에 데이터를 감춰야 한다는 것을 의미한다. 따라서 훌륭한 객체지향 설계는 외부에 행동만을 제공하고 데이터는 행동 뒤로 감춰야 한다. 이 원칙을 캡슐화라고 한다. 공용 인터페이스 뒤로 데이터를 캡슐화하는 것은 객체를 행동에 따라 분류하기 위해 지켜야 하는 기본적인 원칙이다.

책임 주도 설계(Responsibility-Driven Design)

데이터를 먼저 생각하는 데이터 주도 설계(Data-Driven Design) 방법의 단점을 개선하기 위해 고안되었다. 행동에 따라 객체를 분류하기 위해서는 아래와 같은 순서로 진행해야 한다.

  1. 객체가 외부에 제공해야 하는 책임을 먼저 결정한다.
  2. 그 책임을 수행하는 데 적합한 데이터를 결정한다.
  3. 데이터를 책임을 수행하는 데 필요한 외부 인터페이스 뒤로 캡슐화한다.

:bulb:객체를 결정하는 것은 행동이다. 데이터는 단지 행동을 따를 뿐이다.

타입의 계층

트럼프 계층

앞서 정원사, 병사, 신하, 왕자와 공주 등 등장인물들을 트럼프로 정의했다. 하지만, 등장인물들의 외양은 트럼프와 유사하지만 행동 자체는 완벽하게 동일하지 않다. 트럼프 타입의 정의(내연)을 “납작 업드릴 수 있고 뒤집어질 수 있으며 걸을 때마다 몸이 종이처럼 좌우로 펄럭이는 존재”라고 정의했다. 하지만 트럼프 카드는 걸어다닐 수는 없다. 따라서 등장인물들은 트럼프 타입보다는 트럼프 인간이라는 타입으로 분류하는 것이 옳다.

트럼프 인간은 트럼프가 할 수 있는 모든 것을 할 수 있지만 트럼프보다 더 특화된 행동을 할 수 있다. 즉, 트럼프 인간은 트럼프의 일종이지만 일반적인 트럼프 카드보다 좀 더 특화된 행동을 하는 트럼프인 것이다.

외연이라는 관점에서 트럼프 인간은 동시에 트럼프이기도 하다. 이것은 트럼프 인간 타입에 속한 객체는 트럼프 타입의 객체에도 함께 속해야 한다는 것을 의미한다. 즉, 트럼프 인간 타입의 외연은 트럼프 타입의 외연의 부분 집합으로 표현할 수 있다.

이 두 개념 사이의 관계를 일반화/특수화(generalization/specialization) 관계라고 한다.

일반화/특수화 관계

일반화와 특수화는 동시에 일어난다.

더 일반적이라는 말은 더 포괄적이라는 의미를 내포한다. 반대로 특수하다는 것은 일반적인 개념보다 범위가 더 좁다는 것을 의미한다. 그래서 집합의 관점에서 보면, 특수한 개념을 표현하는 집합은 좀 더 일반적인 개념을 표현하는 집합의 부분 집합이 된다.

두 타입 간에 일반화/특수화 관계가 성립하려면 한 타입이 다른 타입보다 더 특수하게 행동해야 하고 반대로 한 타입은 다른 타입보다 더 일반적으로 행동해야 한다. 즉, 객체의 일반화/특수화 관계에 있어서도 중요한 것은 객체 내부에 보관한 데이터가 아니라 객체가 외부에 제공하는 행동이다.

행동의 관점에서 더 일반적인 타입은 특수한 타입이 가진 모든 행동들 중에서 일부 행동만을 가지는 타입을 가리킨다. 반대로 특수한 타입이란 일반적인 타입이 가진 모든 타입을 포함하지만 거기에 더해 자신만의 행동을 추가하는 타입을 가리킨다. 그래서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가진다.

여기서 타입의 내연을 의미하는 행동의 가짓수와 외연을 의미하는 집합의 크기가 서로 반대라는 사실을 주의해야 한다.

슈퍼타입과 서브타입

좀 더 일반적인 타입을 슈퍼타입(Supertype)이라고 하고 좀 더 특수한 타입을 서브타입(Subtype)이라고 한다.

어떤 타입이 다른 타입의 서브타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다. 일반적으로 서브타입은 슈퍼타입의 행위와 호환되기 때문에 서브타입은 슈퍼타입을 대체할 수 있어야 한다.

일반화/특수화 관계를 표기하는 방법은 일반적인 타입인 슈퍼타입을 상단에, 특수한 타입인 서브타입을 하단에 위치시키고 속이 빈 삼각형으로 연결해서 표현한다. 이때, 서브타입에서는 슈퍼타입과 중복된 행위를 생략할 수 있다. 슈퍼타입의 행동은 서브타입에게 자동으로 상속된다. 일반화/특수화 관계 표기법

일반화는 추상화를 위한 도구다

일반화/특수화 계층은 객체지향 패러다임에서 추상화의 두번째 차원을 적절하게 활용하는 대표적인 예다.

앨리스 예시로 등장인물들을 차이점은 배제하고 공통점만을 강조함으로써 공통의 타입인 트럼프 인간으로 추상화했다. 하지만 가끔씩은 트럼프 인간이 아니라 좀 더 단순화된 트럼프로 보는 것이 상황을 좀 더 단순하게 만드는 경우가 있다. 앨리스는 그 시점에 중요한 사항인 트럼프의 특성에만 집중하고 불필요한 트럼프 인간의 특성을 제거해서 상황을 단순하게 만들었다. 즉, 좀 더 단순한 관점에서 바라보기 위해 불필요한 특성을 배제하고 좀 더 포괄적인 의미를 지닌 트럼프로 일반화했다.

정적 모델

타입의 목적

타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하기 어렵기 때문이다.

타입은 시간에 따라 동적으로 변하는 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다. 즉, 상태에 복잡성을 부과하는 시간이라는 요소를 제거함으로써 시간에 독립적인 정적인 모습으로 앨리스를 생각할 수 있게 해준다.

그래서 결국 타입은 추상화다

타입은 추상화다. 타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 결국 타입은 시간에 따른 객체의 상태 변경이라는 복잡성을 단순화할 수 있는 효과적인 방법이다.

동적 모델과 정적 모델

특점 시점에 객체가 가지고 있는 구체적인 상태를 스냅샷(snapshot)이라고 한다. UML에서는 객체 다이어그램(object diagram)이라고도 불린다. 스냅샷처럼 실제로 객체가 살아 움직이는 동안 상태가 어떻게 변하고 어떻게 행동하는지를 포착하는 것을 동적 모델(dynamic model)이라고 한다.

객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것을 타입 모델(type diagram)이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델(static model)이라고 한다.

객체지향 애플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 객체를 추상화한 타입 관점인 정적 모델을 적절히 혼용해야 한다.

객체지향 프로그래밍 언어를 이용해 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다. 하지만, 실제로 애플리케이션을 실행해 객체의 상태를 변경을 추적하고 디버깅하는 동안에는 객체의 동적 모델을 탐험하고 있는 것이다.

클래스

객체지향 프로그래밍 언어에서 정적인 모델은 클래스를 이용해 구현된다. 즉, 타입을 구현하는 가장 보편적인 방법은 클래스를 이용하는 것이다.

클래스와 타입은 동일한 것이 아니다. 타입은 객체를 분류하기 위해 사용하는 개념이다. 반면 클래스는 단지 타입을 구현할 수 있는 여러 구현 매커니즘 중 하나일 뿐이다. 즉, 객체를 분류하기 위해 타입을 결정한 후 프로그래밍 언어를 이용해 타입을 구현할 수 있는 방법 중 하나가 클래스다. 클래스와 타입을 구분하는 것은 설계를 유연하게 유지하기 위한 바탕이 된다.