아날로그 데이터, 디지털 데이터 그리고 이진 데이터
아날로그 데이터와 그것들을 코드화하거나 저장하거나 처리하거나 전송하는 체계들은 연속적으로 변한다. 예를 들면, LP 레코드판은 기록된 소리에 해당하는 연속적인 기계적 데이터를 저장하기 때문에 아날로그적이다. 반면에, 디지털 데이터와 관련 체계들은 상이한 상태들, 예를 들면 온/오프 또는 고전압/저전압 사이에서 이산적으로 변한다. 예를 들면, CD는 소리를 일련의 피트(pit, 우묵한 곳)와 랜드(land, 피트들 사이의 영역)로 변환시킴으로서 저장하기 때문에 디지털적이다. CD는 정보를 그저 기록하기보다는 코드화한다.
우주에 대한 우리의 이해는 낱알 같은 이산적인 디지털적 관념들―자연수, 동전의 앞면과 뒷면, 한 주의 날들, 축구팀이 기록한 골 등―뿐 아니라, 다양한 매끈하고 연속적인 아날로그적 관념들―고통 또는 쾌락의 세기, 실수, 연속 함수, 미분 방정식, 파동, 역장, 시간 연속체―에도 확고하게 기반을 두고 있다. 컴퓨터는 일반적으로 디지털, 즉 이산적 정보 체계로 간주된지만, 두 가지 이유 때문에 이것은 전적으로 올바르지는 않다. 튜링 자신이 진술했듯이,
디지털 컴퓨터는 [...] '이산적 상태 기계'에 속하는 것으로 분류될 수 있는데, 이 기계들은 상당히 명확한 한 상태에서 다른 한 상태로 갑자기 도약하거나 찰깍하며 움직임으로써 이동하는 기계이다. 이런 상태들은 혼동될 가능성이 무시될 수 있을 정도로 충분히 다르다. 엄밀히 말하자면 그런 기계는 전혀 존재하지 않는다. 실제로 모든 것은 연속적으로 움직인다. 그런데 유리하게도 이산적 상태 기계로 간주될 수 있는 다양한 종류의 기계들이 존재한다.
그리고 아날로그 컴퓨터들이 존재한다. 이것들은 해시계 지침판 위의 지시침에 의해 형성되는 그림자, 모래시계에서 모래 또는 물시계에서 물의 거의 규칙적인 흐름, 그리고 수학적으로 일정한 진자의 흔들림 같은 연속적으로 변하는 물리적 현상들의 상호작용을 통해서 계산을 수행한다. 분명히, 어떤 정보 체계를 아날로그 체계로 만드는 것은 특정한 물질을 사용하거나 특정한 물리적 현상에 의존하는 것이 아니라, 그것의 조작들이 고체 물질이 활용되든 액체 물질이 활용되든 기체 물질이 활용되든 간에 그것의 연속적인 물리적 변환들을 측정함으로써 직접 결정된다는 사실이다. 연속적으로 변하는 전압를 이용하는 아날로그 컴퓨터들이 존재하고, 튜링 기계(개인 컴퓨터들의 논리적으로 이상화된 모형)는 디지털 컴퓨터이지만 전기적이지 않을 수도 있다. 자체의 물리적 본성을 고려하면, 아날로그 컴퓨터는 실시간(즉, 현실 세계의 시간에 해당하는 시간)으로 작동하고, 그래서 사건이 발생할 때 사건 시각과 계산 시각 사이의 1:1 대응 관계로 그 사건을 추적하고 제어하는 데 사용될 수 있다. 그렇지만, 자체의 본성 때문에 아날로그 컴퓨터는 범용 기계가 될 수 없으며, 필연적으로 전문화된 장치로서 활용될 수 있을 뿐이다. 그것의 이점은 아날로그 데이터가 매우 강인하다는 것이다. LP 레코드판은 긁히더라도 거듭해서 들을 수 있다.
디지털 데이터는 이진 데이터로 불리기도 하는데, 그것은 일반적으로 비트(bit, binary digit)라고 불리는 단 두 개의 기호로 이루어진 조합들, 즉 모스 부호에서 점과 대시들에 비견되는 0과 1들의 문자열로 코드화되기 때문이다. 예를 들면, 이진 표기법에서 숫자 3은 11로 표현된다. 이진수에서 어느 위치의 값은 오른쪽에서 왼쪽으로 한 자리씩 이동함에 따라 2의 거듭제곱만큼 증가하기 때문에(즉, ....16, 8, 4, 2, 1) 11은 (1 × 2) + (1 × 1)을 의미하고, 그래서 십진수 체계에서 3이 된다. 마찬가지로, 6을 이진수 체계로 계산한다면, (1 × 4) + (1 × 2) + (0 × 1)과 같고, 그래서 110이 될 수 밖에 없다는 것을 알 수 있다.
비트는 정보의 최소 단위로서 신호의 존재 또는 부재, 0 또는 1에 지나지 않는다. 일련의 8비트는 1바이트(byte, byeight)를 구성하며, 바이트를 조합함으로써 256(2^8)개 문자들의 표를 생성할 수 있다. 데이터의 각 문자는 8비트의 어떤 유형으로 저장될 수 있다. 가장 널리 사용되는 이진 코드는 ASCII(American Standard Code for Information Interchange) 코드로 알려져 있는데, 이 코드는 8비트 중에서 7비트에만 의존하여 128(2^7)개 문자들로 구성되어 있다. 컴퓨터가 'GOD'라는 낱말을 이진 코드로 표현하는 방식은 이렇다. 010001110100111101000100.
이진 체계에 따라 바이트의 양들은 다음과 같이 계산된다.
● 1 킬로바이트(KB, Kilobyte) = 2^{10} = 1,024 바이트
● 1 메가바이트(MB, Megabyte) = 2^{20} = 1,048,576 바이트
● 1 기가바이트(GB, Gigabyte) = 2^{30} = 1,073,741,824 바이트
● 1 테라바이트(TB, Terabyte) = 2^{40} = 1,099,511,627,776 바이트
이런 이유 때문에, 예를 들면, 컴퓨터 RAM의 정확한 크기는 결코 어림수가 아니다.
데이트 코드화의 이진 체계는 최소한 세 가지 이점이 있다. 첫째, 비트는 의미론적으로도(참/거짓을 의미함), 논리수학적으로도(1/0를 나타냄) 그리고 물리적으로도(트랜지스터 = 온/오프; 스위치 = 열림/닫힘; 전기 회로 = 고전압/저전압; 디스크 또는 테이프 = 자화/탈자화; CD = 피트의 존재/부재 등) 동등하게 잘 표현될 수 있고, 그래서 의미론, 수리논리학 그리고 회로와 정보 이론의 물리학 및 공학이 수렴할 수 있는 공통 기반을 제공한다.
이것은 비트를 물리적으로 인식하고, 그런 인식에 의거하여 논리적으로 작동하며, 우리가 유의미하다고 알아채는 방식들로 데이터를 조작할 수 있는 기계를 제작할 수 있다는 것(두 번째 이점)을 의미한다. 이것은 중요한 사실이다. 모든 사람이 컴퓨터에 귀속시킬 준비가 되어 있는 지능의 유일한 단서는 틀림없이 이진 데이터를 판별할 수 있는 컴퓨터 장치와 회로들의 역량에 관한 것이다. 컴퓨터가 도대체 무언가를 지각한다고 말할 수 있다면, 그 이유는 자체 회로들의 작동 프로그램을 구성하는 고전압과 저전압 사이의 차이이다. 기묘한 것은 아무튼 이것이 생물학적 체계에도 마찬가지로 참일 것이라는 점이다.
마지막으로, 디지털 테이터는 일반적으로 두 가지 상태를 나타낼 뿐이기 때문에 그런 이산적 변이는 컴퓨터가, 흔히불만족스럽게 또는 부정확하게 수행할 수 있는 아날로그 기계와는 달리, 처리할 필요가 있는 것에 대해 거의 혼동하지 않을 것이라는 점을 의미한다. 무엇보다도, 디지털 기계는 어떤 데이터가 불완전한지 여부를 인식할 수 있고, 그래서 그것이 다루고 있는 비트의 양에 관해 문자 그대로 기묘한 것이 존재한다면 수학적 계산을 통해서 상실되어버린 데이터를 복구할 수 있다.
―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 25-29.
댓글 없음:
댓글 쓰기