posts list

2016년 10월 8일 토요일

정보에 대한 정의

정보에 대한 정의
정보는 데이터들의 결합과 분석으로 만들어진다. 정보는 어떤 사물이나 사태에 대한 정황을 반영하고 있다. 미국의 수학자이자 공학자인 클로드 섀넌(Claude Shannon)은 '커뮤니케이션의 수학적 이론(A Mathematical Theory of Communication)'에서 "정보란 잡음(noise)이 배제된 메시지 신호(signal)"로 보았다. 그는 신호의 입력이 출력되어 나오는 과정에서 잡음을 최소화하여 원래 투입한 신호가 그대로 전송되는 과정과 그에 필요한 조건을 연구하였다. 입력 신호가 잡음 없이 전달되기 위해서는 중간 전송 과정에 피드백이 필요하다. 정보에 대한 기술적 정의에서는 잡음 없는 전송 시스템을 설계하는 것이 가장 중요한 부분을 구성한다.
‘정보는 다름을 만드는 모든 차이’라 주장한 그레고리 뱃슨(Gregory Bateson, 1904~1980)
ⓒ 커뮤니케이션북스
한편 그레고리 뱃슨(Gregory Bateson)은 "다름을 만드는 모든 차이가 정보다"라고 정의했다. 이것은 정보를 잡음 없이 전달하는 섀넌의 정보공학적 전달 형식과는 달리 내용과 관련된 의미론적 규정이다. 차이를 만드는 것은 모두 정보다. 다른 사람과 차이를 드러내 보이니까 내 얼굴이나 목소리도 정보다. 이런 문화적인 차이와 사회적인 의미를 담고 있는 것이 뱃슨의 정보에 대한 정의다. 섀넌의 정보가 기술적인 정의라면 뱃슨의 이런 정의는 의미론적인 정의다.

루치아노 플로리디(Luciano Floridi)는 정보를 (1) 어떤 대상에 대한 정보(Information about something) (2) 대상으로서 정보(Information as something) (3) 대상을 위한 정보(Information for something) (4) 대상 안에 있는 정보(Information in something)로 분류하였다. 대상에 대한 정보는 기차 시간표처럼 어떤 대상에 관한 정보다. 무엇으로서의 정보는 DNA나 지문처럼 그 대상의 특성과 속성을 보여 주는 정보다. 속성 정보는 대상의 바깥이 아니라 안쪽을 펼쳐 보이는 정보로서 그 대상이 무엇인가에 관한 정보다. 그다음으로 무엇을 위한 정보, 곧 목적성 정보를 꼽을 수 있다. 컴퓨터 프로그램의 특정한 알고리즘은 이루고자 하는 목적에 도달하기 위한 최적의 지시를 담고 있다. '3시에 밥을 먹어라', '60점 이하의 점수를 받은 학생들만 골라내라' 등은 무엇을 위한 정보다. 마지막으로 대상 안에 들어 있는 정보가 있다. 무엇 안에 있는 정보는 어떠한 형태나 패턴을 말한다.
[네이버 지식백과] 정보 (디지털 데이터, 정보, 지식, 2013.02.25., 커뮤니케이션북스)

2016년 10월 5일 수요일

양자역학보다 더 깊은-실재에 대한 데이비드 도이치의 새 이론


양자역학보다 더 깊은-실재에 대한 데이비드 도이치의 새 이론
Deeper Than Quantum Mechanics-David Deutsch's New Theory of Reality


세상에 알려지지 않은 20세기 과학의 영웅들 가운데 한 사람은 1940년대, 50년대 그리고 60년대 동안 유명한 벨 연구소에서 연구했던 수학자이자 전자공학자인 클로드 섀넌(Claude Shannon)이다. 섀넌의 가장 위대한 업적은 1948년에 발표된 이래로 우리 세계에 심대한 영향을 끼친 정보 이론이다.

이 이론은 모든 디지털 통신의 기초이다. 그래서 이동 전화, 디지털 텔레비전과 라디오, 컴퓨터와 인터넷 모두 섀넌의 정보 이론에 의존한다. 그런 이유 때문에 섀넌이 21세기 기술에 역사상 그 누구보다도 더 큰 영향을 끼쳤다고 주장할 수 있다.

그런데 그의 정보 이론에는 최근에 물리학자와 수학자들을 괴롭혀온 문제점이 존재한다. 이것은 그 이론이 고전 정보, 즉 통상적인 디지털 코드를 구성하는 0과 1들로 표현되는 그런 정보에만 적용된다는 것이다.

그런데 물리학자들은 양자 정보 및 암호학과 양자 계산에 대한 그것의 잠재력에 점점 더 관심을 갖게 되었다. 양자 정보는 동시에 1과 0일 수가 있다. 다른 기묘한 특성들 가운데 이 특성 덕분에 양자 컴퓨터가 매우 강력할 수 있고 양자 암호학이 완벽하게 안전할 수 있다.

그런데 섀넌의 착상들은 양자 영역에서 붕괴되고, 그래서 다양한 연구 집단들은 섀넌이 고전 정보에 부여한 것과 동일한 이론적 기반을 양자 정보에 부여할 대안적 형식을 추구해왔다.

이제 영국 옥스퍼드 대학교의 데이비드 도이치와 키아라 말레토(Chiara Marletto) 덕분에 그 목표에 한 걸음 더 다가섰을 것이다. 이 사람들은 고전 정보와 양자 정보 둘 다에 대한 토대로서 작용하는 단일한 이론을 사용하여 그것들을 연결하는 방식을 고안해냈다.

그들의 새로운 관념은 구성자 이론(Constructor thoery)으로 불리며, 그 이론은 양자역학, 또는 사실상 여타의 물리학 법칙들보다 더 단순하고 더 깊다. 실제로 도이치는 구성자 이론이 물리학의 모든 법칙들이 출현하게 되는 일종의 실재에 대한 기반을 형성한다고 주장한다.

구성자 이론은 도이치가 한 동안 개발해온 우주에 관한 본원적으로 상이한 사유 방식이다. 그는 현재 물리학자들이 초기 조건과 운동 법칙들의 견지에서 세계를 설명하는 작업에 열중하고 있다고 지적한다. 이 작업은 일어나는 것과 일어나지 않는 것을 구별짓게 된다.

구성자 이론은 이런 접근 방식을 뒤집는다. 도이치의 새로운 근본 원리는 물리학의 모든 법칙들은 가능한 물리적 변형들과 불가능한 물리적 변형들의 견지에서 전적으로 표현될 수 있다는 것이다.

다시 말해서, 물리학의 법칙들은 가능한 것과 불가능한 것을 말해주는 것이 아니라, 가능한 것과 불가능한 것의 결과이다. 그래서 가능한 물리적 변형들과 불가능한 물리적 변형들에 관해 추리하는 것은 물리학의 법칙들을 낳는다.

그런 이유 때문에 구성자 이론이 선행하는 그 어떤 이론보다도 더 깊다. 사실상 도이치는 그 이론을 물리학의 법칙이 아니라 물리학의 법칙들이 따라야 하는 하나의 원리, 또는 원리들의 집합으로 간주한다.

그가 끌어들이는 비유는 에너지 보존 같은 보존 법칙들이다. 이것은 양자역학이나 상대성 같은 물리학의 법칙이 아니라 여타의 법칙들이 따라야 하는 원리이다. 에너지가 화학에너지에서 전기에너지로, 운동에너지로, 위치에너지 등으로 변환될 때 그것의 거동은 모든 종류의 상이한 물리 법칙들에 의해 좌우된다. 그런데 그것들은 모두 에너지는 보존된다는 원리를 따라야 한다.

"그러므로 보존 법칙은, 선험적인 수학적 진리가 아니지만, 운동의 양상들에 대해 운동 법칙들보다 더 깊은 설명을 제공한다"고 도이치와 말레토는 말한다.

구성자 이론은 유사한 역할을 수행한다. "그것은 하나의 원리, 즉 물리적 대상들의 거동을 직접적으로 표현하고 설명하기보다는 다른 법칙들에 대한 제약 조건을 표현하고 설명하는 물리학의 법칙이"라고 그들은 말한다. 그것은 물리학의 모든 법칙들을 지배하는 유일한 법칙이다(음... 톨킨이 서술했었을 것처럼).

이런 측면에서 정보는 에너지와 유사하다. 정보는 빛, 화학, 전자공학, 연기 신호 등을 사용하여 코드화될 수 있으며, 이 모든 것들은 상이한 물리 법칙들을 따른다. 그렇지만 정보 자체는 아무튼 이 모든 것들과 분리되어 있다. 정보는 기체(基體)에 독립적인 것이다. 그런데, 작용하는 법칙들과 무관하게, 정보 자체는 보존된다.

정보의 거동을 좌우하는 법칙 또는 원리들은 지금까지 알려져 있지 않다. "이 논문에서 우리는 이런 법칙들이 무엇인지 추측한다"고 도이치와 말레토가 말한다.

이 사람들이 집중하는 중요한 핵심은 정보는 물리적 환경에서만 존재한다―정보는 결코 추상적이지 않다―는 것이다. 그런데 그것은 과거에 많은 수학자와 물리학자들이 정보에 접근한 방식과 두드러진 대조를 이룬다.

"근본적인 층위에서 정보를 물리학 또는 최소한 양자역학에 편입시키려고 한 이전의 시도들은 정보를 선험적인 수학적 또는 논리적 개념으로 간주했다"고 도이치와 말레토가 말한다. "우리의 접근 방식은 정반대이다."

그들의 방법은 구성자 이론에 기반을 둔 아홉 개 원리들의 집합을 규정하고 그것들을 정보에 대해서 가능하다고 알고 있는 것과 불가능하다고 알고 있는 것에 적용하는 것이다. 이 원리들은 계산, 측정 그리고 고전 정보에 관한 개념들을 표현한다.

그 다음에 도이치와 말레토는 정보와 관련된 어떤 작업들이 불가능한 초정보(superinformation)라고 불리는 새로운 개념을 규정한다. 계속해서 그들은 양자 정보의 독특한 특징들이 이런 작업들의 불가능성에서 비롯된다는 것을 증명한다. "그때 양자 정보는 초정보의 일례인 듯 보인다"고 그들이 말한다.

이 접근 방식은 많은 문제들을 해결한다. 특히 정보는 항상 규정하기 어려웠다. 통상적인 정보 이론에서는 정보와 구별 가능성이 각각 서로의 견지에서 규정되는데, 이것은 일종의 닭과 알 문제를 초래한다.

그런데 구성자 이론에서는 정보의 본성이 물리학의 법칙들에 의해서만 결정된다. 그것은 그 문제를 산뜻하게 벗어난다.

또한 구성자 이론은 최초로 동일한 이론적 지붕 아래 양자 정보와 고전 정보를 연결한다. 그것은 양자 계산, 암호학 그리고 통신과 관련된 신흥 기술에 대해 중요한 함의를 지닐 수 있는 중대한 진전이다.

구성자 이론은 물리학의 법칙들을 도출하는 방식이 아니라는 것을 강조하는 것이 중요하다. 예를 들면, 도이치와 말레토는 어떤 더 깊은 이론에서 양자역학을 도출하려고 시도하고 있지 않다.

그 대신에 원리들은 에너지 보존과 거의 마찬가지로 기능한다. 에너지의 보존은 수학적 진리가 아니라 그것을 따르는 물리학의 법칙들보다 더 깊다고 도이치와 말레토가 말한다. 그들에게 이것은 아직 발견되지 않은 그 어떤 법칙들도 이 보존 규칙을 따를 것이라고 예상해야 한다는 것을 의미한다.

구성자 이론에서 비롯되는 원리들도 마찬가지 방식으로 작용한다. 알려진 물리 법칙들은 이 원리들을 따르고 아직 발견되지 않은 미지의 법칙들도 따라야 한다.

구성자 이론과 관련하여 미해결된 큰 문제는 그것이 얼마나 유용한 것으로 판명될지라는 의문이다. 도이치는 실재의 근본적인 특성들에 매혹되어 있고, 그래서 그에게는 더 깊은 설명이 계속 추구하기에 충분한 이유이다.

다른 사람들은 더 많은 것―예를 들면, 구성자 이론이 참인지 아닌지를 결정할 수 있는 시험 가능한 가설들―을 요구할 것이다. 더 많은 물리학자들이 도이치의 새로운 사유 방식을 발견함에 따라 이런 종류의 예측들은 확실히 출현할 것이다.

그리고 특히 도이치는 물리학의 기초에 관한 선도적인 사상가들 가운데 한 사람이며 가장 창의적이고 독특한 사상가들 가운데 한 사람으로도 널리 인정받고 있기 때문에 물리학자들은 확실히 이 관념을 계속 탐구하고 싶을 것이다.

1980년대에 도이치는 양자 계산을 뒷받침하는 관념들을 제창했다. 그 당시에는 계산에 양자역학을 사용한다는 착상은 물리학의 후미였다. 오늘날 그것은 새로운 물리학뿐 아니라 새로운 기술에 대한 추동력 가운데 하나이다.

나중에 그는 양자역학에 대한 다세계 해석과 다중우주의 주요한 옹호자들 가운데 한 사람이 되었다. 그것 역시 우주론의 소수자 견해에서 주류 관념으로 변형되었다.

다시 말해서, 도이치는 인상적인 이력을 겪었다.

오직 바보만이 구성자 이론 역시 우주에 대한 미래의 이해에 심대한 영향을 미칠 물리학의 주류 관념이 될 수 있을 것이라는 가능성에 반하는 추측을 할 것이다. 2001년에 사망한 섀넌은 확실히 깊은 인상을 받았을 것이다.

※ 자세한 내용은 이 논문["정보에 관한 구성자 이론(Constructor Theory of Information)"]을 참조하라.

데이비드 도이치: 오늘의 인용-육화된 무형적 존재자로서의 정보


"
물리학 안에서 정보를 정의하는 것과 관련된 악명 높은 문제가 존재하는데, 즉 한편으로 정보는 순전히 추상적이고, 그래서 앨런 튜링 등에 의해 개발된 본래의 계산 이론은 컴퓨터와 그것이 조작한 정보를 수학적 객체처럼 순전히 추상적으로 간주했다. 오늘날까지 많은 수학자들은 정보가 물리적이라는 것과 추상적 컴퓨터 같은 것은 존재하지 않는다는 것을 알지 못한다. 물리적 객체만이 계산할 수 있다.

다른 한편으로 물리학자들은, 통계역학 이론을 특징짓고, 그래서 열역학(열역학 제1법칙)을 특징짓는 것처럼 물리학 안에서 정보 이론이 행하는 작업을 행하기 위해서는 정보가 물리적 양이 되어야 한다는 점을 항상 알고 있었다. 그런데, 정보는 그것이 담겨 있는 물리적 객체에 독립적이다.

나는 지금 여러분에게 말하고 있다. 정보는 내 머리 속 어떤 종류의 전기화학적 신호들로 시작한 다음에 내 신경에서 다른 신호들로 변환되고, 그 다음에 음파로, 그리고 이어서 마이크로폰의 진동, 기계적 진동으로 변환된 다음에 전기 등으로 변환되며, 궁극적으로는 인터넷에 들어갈 것이다. 이것은 상이한 물리 법칙들을 따르는 본원적으로 상이한 물리적 객체들에서 예화되었다. 그런데 이 과정을 서술하기 위해서는 과정 전체에 걸쳐서 변하지 않은 채로 있는 것을 언급해야 하는데, 그것은 오직 에너지나 운동량 같은 명백히 물리적인 것이 아니라 정보이다.
"

존재론으로서의 정보윤리


 플로리디는 정보윤리(Information Ethics)라는 이 름하에 정보개념에 입각한 새로운 존재론과 윤리학의 가능성을 타진하고 있다\\먼저 그의 제안은 우리가 흔히 생각하는 정보윤리의 개념과는 구분되어 야 한다. 흔히 말하는 좁은 의미의 ‘정보윤리’는 일종의 미시윤리 (micioethics)로서 정보통신기술의 사용에서 파생되는 다양한 쟁점들을 다루 는 실천 응용윤리 분야를 일컫는 말이다. 가령 명예훼손이나 표절과 같은 인터넷 사용윤리, 지적재산권, 정보격차(digital divide), 해킹, 사생활 침해, 정보의 공공성과 검열, 표현의 자유와 같은 쟁점들이 일반적인 정보윤리의 전형적인 문제들에 해당한다. 이에 비해서 플로리디가 말하는 정보윤리는 특정영역에 한정된 응용윤리의 하나가 아니라, 영역 독립적으로 적용 가능 한 일반적인 기초 이론으로서의 거시윤리(macroethics)에 해당한다. 그가 말 하는 정보윤리는 인간을 포함하여 세상에 존재하는 존재자들의 정보적 성 질이나 구조를 근본적인 범주로 설정하는 존재론적 관점과 맞물려 있으며,  그러한 존재론적 관점에 입각하여 일반적인 윤리 이론을 구성하고자 하는 시도이다

어떤 대상(존재물)이나 과정은 우리가 그것을 바라보는 관점이나 적용하 는 개념적 추상화(Level of Abstraction; LoA)의 수준에 따라 다양한 방식으 로 서술되고 규정될 수 있다. 우리는 대상을 물리적이거나 화학적 관점에서 이해할 수도 있고, 생명의 관점에서도 이해할 수 있다. 정보적 관점도 이것 들과 경쟁하는 개념적 프레임이다. 여기서 정보는 단순한 의미의 단위가 아 니라 일종의 존재물(entity)이다. 따라서 정보윤리의 정보는 의미론적 내용의 분석에 초점을 맞춘 인식론적 접근의 대상이라기보다, 사물의 근본적 본성 의 분석과 관련된 존재론적 범주의 핵심 개념이다. 정보적 관점에서 대상은 데이터의 묶음(cluster)으로 이해되며, 그것이 갖 는 데이터 구조, 정보적인 특성이나 상태, 상호작용 등을 통해 규정될 수 있다. 모든 대상은 그것이 갖는 데이터 구조에 의해 그 본성이나 정체성이 결정되는 하나의 정보시스템이다. 정보시스템은 그러한 본성을 기초로, 그 것에 가해지는 다양한 자극에 반응하여 행동하면서 다른 정보적 대상들과 상호작용한다. 정보적인 상호작용에 노출된 모든 정보체계는 행위자(agent) 나 피동자(patient)로 분류될 수 있으며, 그것들을 둘러싼 환경적인 과정이나 변화 또한 정보적으로 기술될 수 있다. 거시윤리로서의 정보윤리는 일종의 생태적 관점에 입각해 있다. 이를 잘 보여주는 것이 정보권(infosphere)이라는 플로리디의 독특한 개념이다. 생물 이 살 수 있는 지구의 공간을 가리키는 개념이 생물권(biosphere)이라면, 정 보권은 정보적 존재자들이 거주하는 정보적 공간이나 환경을 일컫는 표현 이다. 우리는 흔히 인터넷과 같은 정보공간을 정보권으로 생각하기 쉬우며, 그것이 우리의 바깥에 존재한다고 생각한다. 그러나 플로리디가 말하는 정보권은 모든 정보시스템들이 그 안에서 서로 상호작용하며 존재하게 되는 일종의 생태 환경이다.
  플로리디에 따르면, 우리 인간도 정보적 구조로 분 석될 수 있는 정보적 존재자이며, 다른 정보적 존재들과 마찬가지로 정보권 내에 거주하는 다양한 존재자들 중의 하나일 뿐이다. 어떤 의미에서, 존재 하는 모든 대상은 모종의 정보시스템으로 환원되어 분석 가능하다. 그럼 점 에서, 거시윤리로서의 정보윤리는 존재하는 모든 것에 관한 이론이다. 정보 윤리는 대상을 서로 분리된 독립적인 어떤 것이 아니라 정보권이라 불리는 생태적 환경에 속하는 한 구성원으로 다루며, 정보권의 일원으로서 정보시 스템들이 만들어내는 변화, 행동, 상호작용을 정보적으로 분석한다. 플로리디는 우리가 이러한 정보적 관점을 취할 때, 그로부터 다양한 윤 리적 함축을 이끌어 낼 수 있다고 생각한다. 윤리학으로서의 정보윤리는 존 재 중심적(ontocentric)이고 피동자 지향적인(patient-orinted) 생태적 거시윤리 로 규정된다. 먼저, 존재 중심적 윤리는 생명 중심적 윤리와의 비교를 통해 서 잘 이해될 수 있다. 생명 중심적 윤리는 인간 중심적 윤리와 달리 다른 생명체나 생태체계에도 일종의 도덕적 지위를 부여하며, 이는 생명이 그 자 체로서 갖는 내재적 가치와 고통(suffering)의 부정적 가치에 근거한다. 이에 따르면 모든 형태의 생명은 상황에 따라 기각 가능(overridable)하지만 최소 한의 존중을 받을 자격을 가지고 있다. 이러한 사실은 행위자가 어떤 윤리 적 판단이나 결정을 하면서 고려해야만 하는 중요한 제약 조건으로 작용한 다. 그런 점에서 이는 피동자 지향적인 윤리이다. 생명 중심의 윤리에서 ‘생명’의 개념을 정보로서의 ‘존재’로 대치하게 되 면 존재 중심의 윤리인 정보윤리로 나아가게 된다. 존재 중심적 윤리에 따 르면, 생명보다 더 기본적인 것이 존재(being)이며, 고통보다 더 근본적인 것이 엔트로피이다. 정보 혹은 존재는 그 자체로 내재적인 가치를 가지며, 그런 점에서 존재할 권리를 포함하여 그것의 실존 및 본질을 향상시키고 풍부하게 할 번성의 권리를 갖는다. 이에 반하는 것이 존재의 궁핍화 (impoverishment)를 의미하는 엔트로피로서, 이는 정보 질서나 구조의 붕괴 를 통한 정보적 대상의 파괴나 타락을 야기한다. 도덕적 행위자의 행동은 정보권의 성장에 대한 기여, 즉 엔트로피 수준의 증가 여부나 그 정도에 따 라서 평가될 수 있다.

정보윤리에 따르면, 도덕적 고려의 대상이 되어야 할 도덕적 존재의 범 위는 정보권을 구성하는 일원으로서의 정보체계로 이해가능한 모든 존재를 포괄하도록 확장된다. 그리고 존재의 표현인 모든 정보적 대상은 내재적 가 치를 가지며, 기각 가능하지만 최소한의 동등한 존중을 받을 자격을 가진 도덕적 피동자(patient)들이다. 여기에는 전통적인 의미의 도덕적 피동자인 인격체나 동물뿐 아니라, 식물, 자연적 대상, 기술이나 인공물, 추상적인 지 적 대상들도 포함된다. 그야말로 존재하는 모든 것들이 도덕적 피동자로 포 함되는 것이다. 정보윤리의 입장이 고전적인 의미의 생태근본주의와 구분되 는 지점이 바로 기술이나 인공물을 도덕적 피동자로 포함한다는 것이다. 정 보윤리는 가능한 한 비인간중심적이고 중립적인 대상적 관점을 취함으로써, 도덕적 고려의 대상이 충족해야 할 최소 자격 요건을 최대로 낮춘 윤리적 관점이다. 그런 점에서 정보윤리는 존재론적으로 가장 공평하며 보편적인 이론이라 말할 수 있다. 정보윤리의 관점에서 보면, 생명윤리는 생명이나 살아있는 것에 경도되어 있으며, 생태근본주의는 기술이나 인공물에 대해 편향된 태도를 가지고 있다. 플로리디에 따르면, 도덕적 피동자의 범위를 살아있는 것이나 자연적인 것에 국한시키는 것은 우리의 관심이나 윤리적 감수성을 반영하는 임의적인 선택에 불과하다. 정보윤리의 입장에서는 도덕적 행위자를 보는 시각도 달라진다. 간략히 말해서, 도덕적이라 평가될 수 있는 행동을 수행할 수 있는 모든 자율적 존 재는 도덕적 행위자로 간주된다. 여기에는 인간뿐 아니라 동물, 인공적인 행위자도 포함된다. 동물은 도덕적 판단이나 의도에 입각하여 행동하는 존 재가 아니므로 지금까지 도덕적 행위자의 범주에 포함될 수 없었다. 자율자 동차와 같은 인공적 행위자도 마찬가지이다. 무엇보다 스스로 도덕적 책임 (responsibility)을 질 수 있는 존재여야만 도덕적인 행위자로 간주될 수 있는 데, 그러기 위해서는 이성적 판단 능력 혹은 의도나 의식과 같은 심성 상태 가 필요하고, 동물이나 로봇은 그럴 수 있는 존재들이 아니기 때문이다. 플로리디는 도덕적 행위자의 개념을 책임의 개념으로 환원시키는 이런 태도는 결국 인간 중심주의적 도덕으로 귀착될 수밖에 없다고 비판하면서, 규범적 담론이나 도덕적 평가에는 행위에 대한 책임 이상의 것이 결부되어 있음을 주장한다. 어떤 도덕 행위자는 비록 책임을 질 수 없다하더라도 도덕적인 행동을 하는 것이 가능하다. 가령 인명을 구한 수색구조견을 그러한 사례로 생각해 볼 수 있다. 비록 그것이 전통적인 의미로 자신의 행동에 도 덕적인 책임을 질 수 있는 존재는 아니지만, 우리는 얼마든지 그 개를 도덕 적 귀결을 갖는 행위의 원천으로 확인하고 그것에 대해서 도덕적 평가를 내릴 수 있다. 여기서 플로리디는 책임 개념과 대비하여 책무성 (accountability)의 개념을 도입하고, 수색구조견도 그것이 야기하는 선과 악 에 대해서 책무성을 귀속시킬 수 있는 도덕적 행위자임을 주장한다.

기존의 윤리학은 특정 행위에 대한 처벌과 보상이라는 책임 개념에 입각 한 윤리학이다. 책임을 질 수 있는 존재만이 도덕적 행위자이며, 책임을 질 수 없는 존재는 비도덕적(amoral) 행위자라는 이분법이 그로부터 도출된다. 이러한 구도에서는, 나쁜 일이 발생하거나 예상될 경우에, 그에 대해 책임 을 질 수 있는 주체가 누구인지를 확인하는 것이 우선적인 문제가 된다. 하 지만 세상에서 선과 악을 유발하는 도덕적 원천은 개인이나 집단으로서의 인간과 같은 전통적인 주체가 아닐 수 있다. 앞서도 잠시 논의했듯이, 우리 는 이미 국지적 수준에서 일어나는 행위자 사이의 상호작용들이 체계적인 상호작용을 거쳐서 전체나 지구 수준에서 엄청난 해악으로 귀결되는 수많 은 사례들을 대면하고 있다. 전통적인 관점에서 생각하면, 그 책임의 주체 가 누구인지도 분명하지 않을 뿐 아니라 특정 개인이나 집단에게 귀속시킬 수 있는 책임의 크기도 미미할 수밖에 없다. 드러난 해악은 명백하지만 그 누구에게도 분명한 책임을 물을 수 없는 상황인 것이다. 지금은 세상의 많 은 일들이 전통적인 의미로는 책임을 동반하지 않는 도덕 행위자들의 선택 과 행동을 통해서 결정되는 세계이다. 여기서 우리는 비록 져야할 ‘책임’은 없다 하더라도 도덕적 행위 능력과 그에 따르는 책무성에 입각하여 규범적 인 행동을 장려하는 것을 충분히 상상할 수 있어야만 한다. 그런 점에서, 플로리디는 이제 처벌과 보상에 입각한 윤리학으로부터, (행위가 아닌) 도 덕 행위자 중심의 책무성과 책망(censure)에 입각한 윤리학으로의 전환을 제 안한다.

그렇다면, 그러한 윤리학에서 우리 인간이 져야할 책임이나 태도는 어떠 한 것인가? 플로리디는 먼저 존재하는 모든 것은 신성하고 인류에게 주어 진 선물로서 우리가 보살필 필요가 있는 것들임을 역설한다. 그런 의미에서 우리는 전체 정보권에 대해 에코포이에틱(ecopoietic)한 책임을 지니며, 정보 윤리는 정보권에 속하는 모든 것을 창조적으로 관리할 책무(creative stewardship)의 윤리가 된다. 에코포이에시스(ecopoiesis)는 생태지향적인 관점 에 입각하여 도덕적인 방식으로 환경을 구성하는 과정이다. 여기서 인간의 역할은 호모포이에티쿠스(homo poieticus)로 규정된다. 호모 포이에티쿠스로 서의 인간은 정보권에 속하는 실재(reality)를 보호하고 번성하도록 관리하는 데미우르고스의 역할을 떠맡게 되며, 자연자원의 사용자나 착취자로서의 호 모 파베르(homo faber), 부의 생산자, 유통자, 소비자로서의 호모 이코노미쿠 스(homo oeconomicus), 윤리적 배려나 책임감을 결여한 체 놀이에 집중하는 호모 루덴스(home ludens)와 구분된다. 과학기술이 발전할수록 실재에 개입 하고 그것을 변형시킬 수 있는 인간의 존재론적 힘(ontic power)은 꾸준히 증가한다. 그럴수록, 도덕적 행위자로서의 호모 포이에티구스는 자신 뿐 아 니라 전체 정보권에 대해 더 많은 의무와 책임을 져야 한다. 이를 위해 우 리는 개별적인 행동의 덕성에서 지구적인 가치의 중요성을 더 강조하는 방 향으로 이행해야 하며, 사용자나 소비자가 아니라 창조자, 관리자, 감독자로 서의 책임을 인식할 필요가 있다는 것이 플로리디의 주장이다.


 - 자율기술과 플로리디의 정보 윤리, 신상규

하이퍼역사 시대와 자율기술의 출현


 하이퍼역사 시대와 자율기술의 출현 이탈리아 출신의 옥스퍼드 철학자 플로리디(Luciano Floridi)는 디지털에 의해 추동되는 오늘날의 정보혁명은 정보기술의 관점에서 역사시대의 출현 에 비견되는 하이퍼역사(hyperhistory) 시대로 우리를 이끌고 있다고 주장한 다.7) 문자 체계, 즉 쓰기나 기록의 발명과 함께 시작된 역사시대는 그 자체 가 이전의 선사시대와 구분되는 일종의 정보시대(age of information)라고 말 할 수 있다. 역사시대는 데이터의 기록과 저장, 계승에 의해 규정된다. 인쇄 술의 발명과 대중매체의 출현은 정보의 전승이나 유통 방식을 획기적으로 바꾸어 놓은 역사시대의 중대한 분수령이다. 그런데 플로리디는 최근의 디 지털 정보통신기술(ICT)의 발전이 기존 정보기술에 정보나 데이터의 가공 ㆍ처리(processing) 능력을 더함으로써 하이퍼역사라는 새로운 시대가 열리 고 있다고 주장한다. 하이퍼역사시대와 역사시대를 구분 짓는 중요한 기준은 우리의 삶이 정 보기술에 의존하는 정도이다. 역사시대의 정보기술도 우리 삶의 중요한 한 요소로서 개인이나 사회의 안녕과 밀접한 관련이 있다. 하지만, 하이퍼역사 시대는 한 단계 더 나아가 개인이나 사회의 발전 혹은 유지가 ICT에 거의 전적으로 의존한다고 말할 수 있는 시대이다. 정보는 근원적인 자원인 동시 에, 엄청난 양의 빅데이터와 그에 대한 처리, 그리고 ICT의 자율적인 정보 처리가 개인이나 사회, 인류의 복지, 유지, 발전, 번영을 위한 본질적인 조 건으로 작용하는 시대가 바로 하이퍼 역사시대인 것이다

- 하이퍼역사시대와 역사시대를 구분 짓는 중요한 기준은 우리의 삶이 정 보기술에 의존하는 정도이다

- 하이퍼 역사시대의 또 다른 특징 중의 하나는 정보(데이터)의 양이다.

- 데이터의 양이 전부인 것은 아니다. 데이터의 양보다 더욱 중요한 것은 오히려 디지털 정보의 가소성에 의해 가능해진 자율적 기술 체계(system) 혹은 지능적인 인공 행위자의 등장이다. 플로리디가 말하는 ‘3차 기술 (third-order technology)’의 개념을 통해 이를 설명해 보자.10) 기술이란 기본 적으로 그 사용자와, 사용자로 하여금 그 기술의 사용을 유도하거나 촉발시 키는 촉진자(prompter), 그리고 이 둘 사이를 매개하는 사이성 (in-betweenness)으로 분석될 수 있다.

디지털 ICT의 출현이전에 우리에게 익숙한 대부분의 기술은 1차 기술이 나 2차 기술에 해당한다. 1차 기술은 인간 사용자와 자연의 촉진자 사이를 매개하는 기술이다. 가령 도끼는 인간 사용자와 나무 사이를 매개하는 기술 이며, 바퀴는 인간과 흙 사이를 매개하는 기술이다. 이에 비해 2차 기술은 촉진자가 자연이 아니라 다른 기술로 대체된다. 즉 인간 사용자를 촉진자인 다른 기술과 연결하거나 매개하는 기술이 바로 2차 기술인 것이다. 가령 드 라이버를 생각해보자. 우리는 드라이버를 사용하여 나사못(기술)을 조인다. 물론 이때 나사못의 촉진자는 이를 이용하여 결합되는 나무판자들일 것이 며, 그런 의미에서 인간과 나무판자를 매개하는 1차 기술로 간주될 수 있 다. 이러한 도식 속에서 2차 기술은 다양한 1차 기술들과의 상호의존성을 함축한다.11) 플로리디에 따르면, 2차 기술의 핵심적인 사례가 다른 기술들에 에너지를 제공하는 엔진이다. 엔진은 근대를 상징하는 대표적인 기술로 서 산업혁명과 그 뒤를 잇는 기계문명의 동력으로 작용했다

지금 우리가 살고 있는 시대는 근대적인 기계문명에서 하이퍼 역사의 정 보(기계)문명으로 넘어가는 과도기이다. 하이퍼 역사 시대의 중심 기술은 엔진으로 대표되는 2차 기술이 아니라, 정보엔진으로서의 컴퓨터가 그 한 가운데에 자리하고 있는 3차 기술이다. 3차 기술은 사용자와 촉진자 모두가 기술로 이루어지며, 사이 기술로서의 3차 기술의 역할은 기술들 사이를 매 개하는 것이다. 인간은 이제 더 이상 기술의 사이성 고리 안에 존재하지 않 거나 그 고리의 바깥 경계에 걸쳐진 상태로 존재하면서, 그러한 기술의 수 혜자나 소비자로 남게 된다

근대적인 기계들은 그 작동을 위해서 여전히 인간을 필요 로 했다. 하지만, 3차 기술에 의존하는 하이퍼 역사 시대의 기계들은 원리 적으로 그것들만의 네트워크를 통해 인간 독립적으로 작동가능하다. ICT의 발전이 정보 데이터를 자동으로 처리하고 스스로 판단, 선택, 행동하는 자 율 기계를 가능하게 만들었다.

- 자율기술과 플로리디의 정보 윤리, 신상규

루치아노 플로리디: 오늘의 에세이-지능 기계들로부터 두려워할 것은 아무것도 없다


지능 기계들로부터 두려워할 것은 아무것도 없다
Humans have nothing to fear from intelligent machines


스페이스 엑스와 테슬라 모터스의 창업자인 일론 머스크(Elon Musk)는 인공 지능이 "핵폭탄보다 잠재적으로 더 위험한" 것이라고 믿는다. 인류에 대한 "가장 큰 실존적인 위협"은 언젠가 인류를 지배할 터미네이트형 슈퍼 기계 지능이라고 그는 생각한다. 운이 좋게도, 머스크씨는 잘못 생각하고 있다.

많은 기계들이 놀라운 일들을 흔히 인간들보다 더 잘 할 수 있다. 예를 들면, 1997년 체스 경기에서 IBM의 딥 블루 컴퓨터는 그랜드 마스터 가스 카스파로프(Garry Kasparov)를 이겼다. 2011년에 다른 한 IBM 기계 왓슨은 TV 퀴즈 쇼 <제퍼디(Jeopardy>에서 두 명의 인간 참가자들을 꺾고 우승했는데, 그들 가운데 한 사람은 그때까지 74번 연속으로 우승했었다. 무제한으로 있는 듯 보인다.

그렇지만 딥 블루와 왓슨은 "튜링 기계(Turing machine)", 즉 계산기가 할 수 있는 것의 한계를 설정하는, 앨런 튜링에 의해 고안된 수학적 모형의 판본들이다. 튜링 기계는 아무 오성도, 아무 의식도, 아무 직관도 갖추고 있지 않는데, 요약하면, 우리가 심적 삶으로 인식할 것은 아무것도 갖고 있지 않다. 그것은 생쥐의 지능조차도 결여하고 있다.

인공 지능의 도래를 신봉하는 사람들의 의견은 다르다. 스티븐 호킹(Stephen Hawking)은 "완전한 인공 지능의 개발은 인류의 종말을 초래할 수 있을 것"이라고 주장했다. 그는 옳지만, 묵시록의 네 기사가 출현하는 경우에도 마찬가지이다.

아메리카 발명가이자 미래학자인 레이 커즈와일(Ray Kurzweil)은 2045년 경에 계산 기술의 발달이 인공 지능이 그것을 파악하고 통제할 수 있는 인간들의 능력을 능가하는 지점에 이를 것이라고 예측했다. 커즈와일 류의 시나리오들은 무어의 법칙(Moore's law)에서 외삽된 것들인데, 그 법칙에 따르면 컴퓨터의 트랜지스터 수가 매 2년마다 두 배가 되고, 그래서 항상 더 저렴한 비용으로 더욱 더 큰 계산 능력을 얻게 된다.

그런데 그 법칙의 당사자인 고던 무어는, 집적 회로에 밀어넣을 수 있는 트랜지스터 수에 물리적 한계가 있기 때문에 그의 일반화는 적절하지 않게 될 것이라는 점을 스스로 인식했다.

어쨌든 무어의 법칙은 지능이 아니라 계산 능력의 척도이다. 나의 진공 청소기 로봇 룸바는 빠르고 저렴하게 그리고 점점 더 잘 바닥 청소를 할 것이지만, 혼자 힘으로 내 신용 카드로 휴일을 결코 예약하지는 못할 것이다.

1950년에 튜링은 다음과 같은 시험을 제안했다. 다른 방에 있는 두 명의 대화자들에게 글로 쓰여진 질문들을 묻는 인간 판정관을 생각하자. 한 대화자는 인간이고, 나머지 다른 한 대화자는 기계이다. 70%의 시간 동안 판정관이 기계의 출력과 인간의 출력을 구별할 수 없다면, 그 기계는 그 시험을 통과한 것으로 말할 수 있다.

튜링은 2000년 경에 컴퓨터들이 그 시험을 통과할 것이라고 생각했다. 그는 틀렸다. 구글의 전직 최고 경영자 에릭 슈미트(Eric Schmidt)는 2018년 경에 튜링 시험이 통과될 것이라고 믿었다. 우리는 알게 될 것이다. 여태까지 아무 진전도 없었다. 컴퓨터 프로그램들은 여전히 1960년대에 개발된 수법들을 사용하여 판정관들을 속이려고 한다.

예를 들면, 매년 개최되는 튜링 시험 경연 대회의 2015년 뢰브너 상(Loebner Prize)에서 한 판정관이 이렇게 물었다. "그것이 너무 작았기 때문에 그 차는 주차 공간에 맞을 수 없었다. 무엇이 너무 작았는가?" 올해의 감투상을 수상한 소프트웨어는 이렇게 대답했다. "알다시피, 나는 걸어다니는 백과사전이 아니다."

그러므로 초지능 기계들에 관한 불안들은 과학적으로 정당화되지 않은 것이다. 나무 꼭대기에 오르는 것이 달을 향한 단계가 아닌 것과 꼭 마찬가지로, 현존하는 "스마트" 기술들은 전면적인 인공 지능을 향한 단계가 아니다. 이런 응용물들은 확실히 우리보다 더 똑똑하고, 우리의 능력을 능가하며, 우리 대신에 점점 더 많은 과업들을 수행할 수 있다. 그렇지만 이것은 그것들이 세계를 지적으로 다루기 때문이 아니라, 우리가 세계를 그것들에게 점점 더 친화적인 것으로 만들고 있기 때문이다.

산업 로봇을 살펴보자. 우리는 그것들을 차량을 제조하도록 세계에 풀어놓지 않는다. 우리는 그것들의 성공을 보장하도록 그것들 주변에 인공적 환경을 구축한다. 조만간 이른바 사물 인터넷에서 서로 소통할 수십 억 개의 스마트 인공물들의 경우에도 마찬가지이다.

그 어떤 인공 지능 판본의 고질라도 우리를 노예화하지 못할 것이고, 그래서 우리는 과학 소설에 관하여 더 이상 걱정하지 말고 인공 지능이 제기하는 실제 난제들에 집중하기 시작해야 한다. 최종 분석에서 스마트 기계들이 아니라 인간들이 문제이며, 예견할 수 있는 미래 시기에도 여전히 그럴 것이다.

우리의 우선 순위는 우리 기술들의 설계와 사용에 있어서 고통스럽고 값비싼 실수를 저지르지 않는 것이어야 한다. 우리가 인간 종과 지구 둘 다를 손상시킬 정도로 기술들을 오용할 심각한 위험이 존재한다.

예전에 윈스턴 처칠(Winston Churchill)이 이렇게 말했다. "우리가 건축물을 만들지만, 그 다음엔 건축물이 우리를 만든다." "정보권(infosphere)"의 스마트 기술들에게도 마찬가지로 적용된다.

루치아노 플로리디: 정보-엔트로피와 무작위성


엔트로피와 무작위성
Entropy and randomness

섀넌의 의미에서 정보는 엔트로피로도 알려져 있다. 이 혼란스러운 표식은 20세기의 가장 뛰어난 과학자들 가운데 한 사람인 존 폰 노이만(John von Neumann, 1903-1957)에서 기인된 듯 보이는데, 그는 섀넌에게 다음과 같이 그것을 추천했다.

두 가지 이유에서 그것을 엔트로피라고 불러야 합니다. 첫째, 그 함수는 이미 동일한 이름으로 열역학에서 사용되고 있습니다. 둘째 그리고 더 중요하게도, 대부분의 사람들이 엔트로피가 정말 무엇인지 알지 못하고, 그래서 어떤 논증에서 엔트로피라는 낱말을 사용한다면 매번 승리할 것입니다.

불행하게도 두 가지 점 모두에서 폰 노이만이 옳은 것으로 판명되었다. 무소음 통신 채널이라는 이상적인 경우를 가정할 때 엔트로피는 세 가지 등가적인 양들의 척도이다.

(a) 정보 제공자에 의해 산출되는 기호당 평균 정보량, 또는

(b) 정보 제공자의 출력을 검사하기 전에 정보 수신자가 갖고 있는 상응하는 데이터 부족(섀넌 불확정성)의 평균량, 또는

(c) 동일한 원천의 상응하는 정보적 잠재성, 즉 정보적 엔트로피(informational entropy).

어떤 특수한 알파벳을 선택함으로써 자동적으로 정보 제공자가 정보 전달자에 의해 다양한 정도로 충족(해소)될 수 있는 정보 수신자의 데이터 부족(불확정성)을 만들어내기 때문에 엔트로피는 동등하게 (a) 또는 (b)를 가리킬 수 있다. 스무 고개 게임을 떠올리자. 단일한 공평한 동전을 사용하면, 나는 즉시 일 비트의 데이터 부족 상태에 처하게 되는데, 나는 동전이 앞면인지 뒷면인지 알지 못하고, 그래서 알아내기 위해 하나의 질문이 필요하다. 두 개의 공평한 동전을 사용하면 최소한 두 개의 질문이 필요하기 때문에 내 데이터 부족은 두 배가 되지만, 까마귀를 사용하면 내 데이터 부족은 영이 된다. 나의 빈 유리잔(위의 (b))은 그것을 채울 수 있는 여러분의 역량에 대한 정확한 척도(위의 (a))이다. 물론, 확률 분포를 특정할 수 있을 경우에만 정보를 엔트로피에 의해 수량화된 것으로 말하는 것이 의미가 있다.

(c)에 대해서 MTC는 정보를 질량이나 에너지 같은 하나의 물리적 양으로 간주하고, MTC에 의한 정보 분석과 엔트로피 개념에 대한 통계 역학의 형식적 표현 사이의 유사성은 이미 섀넌에 의해 논의되었다. 엔트로피에 관한 정보적 개념과 열역학적 개념은 확률과 무작위성이라는 개념들을 통해 서로 관련된다. '무작위성'이 '무질서(disorder)'보다 더 나은데, 전자는 구문론적 개념인 반면에 후자는 강한 의미론적 가치를 지니고 있기 때문이다. 다시 말해서, 십 대일 때 내가 양친에게 설명하려고 노력하곤 했던 것처럼, 무질서라는 개념은 쉽게 해석들과 관련된다. 엔트로피는 에너지 또는 정보를 품고 있는 과정과 체계들에 있어서 '뒤섞임'의 정도에 대한 척도이다. 또한 그것은 가역성의 표식으로 간주될 수 있는데, 엔트로피의 변화가 전혀 없다면 그 과정은 가역적이다. 고도로 구조화된, 완전히 조직된 메시지는 더 낮은 정도의 엔트로피 또는 무작위성, 섀넌의 의미에서 더 낮은 정보를 포함하고, 그래서 그것은 영에 접근할 수 있는(까마귀를 떠올리자) 더 낮은 데이터 부족을 초래한다. 이와는 대조적으로, 알파벳 기호들의 잠재적 무작위성이 더 높을수록, 장치에 의해 더욱 더 많은 비트의 정보가 산출될 수 있다. 엔트로피는 균일한 분포를 갖는 극단적인 경우에 최대값을 나타내는데, 말하자면, 얼음 한 덩이가 들어 있는 한 잔의 물이 얼음이 녹아버린 한 잔의 물보다 더 낮은 엔트로피를 포함하고, 편향된 동전이 공평한 동전보다 더 낮은 엔트로피를 갖는다. 열역학에서, 엔트로피가 더 클수록 가용 에너지는 더욱 더 작아진다. 이것은, 높은 엔트로피가 높은 에너지 부족에 대응하지만, MTC에서 엔트로피는 다음과 같다는 것을 의미한다. 엔트로피의 높은 값은 더 큰 양의 데이터 부족에 대응한다. 결국 폰 노이만이 옳았을 것이다.

정보에 관한 정량적 개념들에 대한 탐색은 끝났다. MTC는 잘 구성된 데이터의 통신과 처리에 대한 수학적 접근 방식의 토대를 제공한다. 데이터가 유의미할 때, 그것들은 의미론적 내용을 구성한다. 의미론적 내용이 참이기도 할 때, 그것은 의미론적 정보로서의 자격을 갖게 된다. 이것이 이 책에서 논의되는 모든 개념들의 여왕이며 다음 장에서 그것에 전념한다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 45-7.

루치아노 플로리디: 정보-통신의 수학적 이론에 함축된 몇 가지 개념적 의미들


통신의 수학적 이론에 함축된 몇 가지 개념적 의미들
Some conceptual implications of the mathematical theory of communication

통신의 수학적 이론(MTC)의 경우에 정보는 일단의 가능한 기호들에서 한 기호를 선택하는 것일 뿐이고, 그래서 MTC가 정보를 어떻게 수량화하는지 파악하는 단순한 방법은 정보원이 무엇을 소통하고 있는지 결정하는 데 필요한 예/아니오 질문들의 수를 고려하는 것이다. 공평한 동전의 결과를 결정하는 데에는 질문 하나면 충분하고, 그해서 일 비트의 정보를 산출한다고 한다. 두 개의 공평한 동전으로 이루어진 체계는 네 개의 질서정연한 출력―<h, h>, <h, t>, <t, h>, <t, t>―을 산출한다는 것을 이해했고, 그래서 최소한 두 가지 질문이 필요한데, 각 출력은 이 비트의 정보를 포함한다. 기타 등등. 이 분석은 두 가지 요점을 분명히 한다.

첫째, MTC는 정보라는 낱말의 일상적 의미에서 정보에 관한 이론이 아니다. MTC에서 정보는 전적으로 기술적인 의미를 갖는다. MTC에 따르면 애초에, 해당하는 질문이 '배터리가 방전되었는가?'이든 '저와 결혼해 주시겠습니까?'이든 간에, 확률이 같은 두 개의 '예' 대답은 동일한 정보량을 포함한다. 이 책이든 브리태니커 대사전 전체이든 간에, 어떤 장치가 동일한 확률로 우리에게 전송할 수 있다는 것을 안다면, 이것 아니면 저것을 수신함으로써 우리는 매우 상이한 양의 데이터를 수신할 것이지만, 정보에 관한 MTC의 의미에서는 사실상 일 비트의 정보를 수신할 뿐이다. 1944년 6월 1일에 BBC 방송은 베르네르(Verlaine)의 <가을의 노래>라는 시의 한 행―'Les sanglots longs des violons de Autumne'―을 방송했다. 이것은 일 비트 미만의 정보를 포함하는 암호화된 메시지였는데, D-데이 침공이 임박했는지 여부에 관한 질문에 대해 '예'라고 대답할 확률이 점점 더 커졌다. 그 다음에 BBC는 두 번째 행 'Blessent mon coeur d'une longueur monotone'을 방송했다. 또 하나의 거의 무의미한 철자들의 열이지만, 거의 일 비트에 해당하는 다른 한 정보인데, 그것은 침공이 즉시 일어날 것인지 여부에 관한 질문에 대한 대망의 '예'이기 때문이었다. 독일 정보 기관은 그 암호에 관해 알고 있었고, 그 메시지들을 가로챘으며, 베를린에 통보까지 했지만, 최고 사령부는 노르망디에 진주하고 있었던 제7 군단에 경보를 발하지 못했다. 히틀러는 정보에 관한 섀넌의 의미에서 모든 정보를 갖고 있었지만, 그런 작은 비트의 두 데이터의 결정적 중요성을 이해하지 못했다(또는 믿지 못했다). 우리 자신들의 경우에, 정보에 관한 MTC의 의미에서, 정보의 최대량은 각 문자가 균일하게 분포되어 있는 텍스트, 즉 완전히 무작위적인 배열에 의해 산출된다는 결론에 놀라지 말아야 한다. MTC에 따르면, 무작위적으로 타자기 자판을 누르고 있는 고전적 원숭이가 사실상 수많은 정보를 산출하고 있다.

둘째, MTC는 (무의미하다는 의미에서가 아니라 아직 유의미하지 않다는 의미에서) 의미를 고려하지 않는 정보 이론이기 때문에, 그리고 [정보 - 의미 = 데이터]이기 때문에 '정보 이론'보다 '데이터 통신의 수학적 이론'이 확률론의 이 갈래에 대한 훨씬 더 적절한 서술이다. 이것은 그저 표식의 문제가 아니다. 의미론적 내용으로서의 정보는 데이터 + 질문들로도 서술될 수 있다.'지구는 단 하나의 위성이 있다' 같은 한 조각의 정보를 가정하자. 그것을 [지구는 단 하나의 위성이 있는가? + 예] 같은 [질문 + 이진 대답]으로 변환시킴으로써 그것의 거의 모든 의미론적 내용을 양분시키기 쉽다. '예'―많아야 일 비트의 정보이다―를 제거하면 참 또는 거짓의 표식들이 제거된 의미론적 내용만 남게 된다. 의미론적 내용은 올바른 대답에 의해 아직 포화되지 않은 정보이다. 데이터 '예'는 질문에 포함된 정보를 여는 열쇠로서 작동한다. MTC는 정보를 데이터 열쇠, 즉 정보 수신자의 불포화 정보를 포화시키는 데 필요한 어떤 신호 또는 메시지 또는 기억 공간 속의 세부 내용의 양으로 취급함으로써 정보의 코드화와 전송을 연구한다. 위버가 올바르게 진술했듯이,

정보라는 낱말은 여러분이 정작 말하는 것과 관련되어 있다기보다는 여러분이 말할 수 있는 것과 관련되어 있다. 통신의 수학적 이론은 정보 자체가 아니라 정보의 운반자들, 기호와 신호들을 다룬다. 즉, 정보는 여러분이 어떤 메시지를 선택할 때 갖게 되는 자유도에 대한 척도이다.

MTC는 잘 구성된 신호 열들로 코드화된 미해석 기호들로 이루어진 메시지들을 다룬다. 이것들은 의미론적 정보를 구성하지만 아직은 의미론적 정보가 아닌 데이터일 뿐이다. 그래서 MTC는 일반적으로 구문론적 층위에서의 정보에 관한 연구로 서술된다. 그리고 컴퓨터는 구문론적 장치이기 때문에 MTC가 정보통신 기술(ICT)에서 대단히 성공적으로 적용될 수 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 43-5.

루치아노 플로리디: 정보-중복성과 소음


중복성과 소음
Redundancy and noise

실생활에서 좋은 코드화는 적당히 중복적이다. 중복성은 어떤 메시지의 물리적 표현과 필요한 비트량만 사용하는 동일한 메시지에 대한 수학적 표현 사이의 차이를 가리킨다. 사진의 디지털 크기를 줄이는 데 사용하는 절차 같은 압축(compression) 절차들은 데이터 중복성을 줄임으로써 작동하지만, 중복성이 항상 나쁘지는 않은데, 그것이 모호성(equivocation, 송신되었지만 결코 수신되지 않은 데이터)과 소음에 대항하는 데 도움을 줄 수 있기 때문이다. 메시지 + 소음은 원래 메시지 자체보다 더 많은 데이터를 포함하지만, 통신 과정의 목표는 데이터 증가가 아니라 충실도(fidelity), 즉 원래 메시지를 송신자에서 수신자로 정확히 전달하는 것이다. 어느 정도의 중복성이 환경과 통신의 물리적 과정에 의해 편입되는 불가피한 소음과 모호성을 상쇄한다면, 전송 과정이 끝나는 무렵에 메시지를 올바르게 재구성할 확률이 더 높다. 소음은 메시지를 선택함에 있어서 정보 수신자의 선택의 자유를 확대시키지만, 그것은 바람직하지 못한 자유이고 얼마간의 중복성이 그것을 제한하는 데 도움을 줄 수 있다. 그런 이유 때문에 존의 자동차 사용 지침서는 동일한 정보를 (약간 중복되게) 전달하는 언어적 설명과 그림들을 동시에 포함하고 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 42-3. 

루치아노 플로리디: 정보-통신의 수학적 이론



통신의 수학적 이론(MTC)

정보의 어떤 특징들은 직관적으로 수량화할 수 있다. 광대역 연결망은 초당 최대의 정보량을 전송할 수 있을 뿐이다. 컴퓨터는 유한한 양의 정보만을 포함할 수 있는 하드 디스크를 장착한다. 더 일반적으로, 우리는 물리적 신호처럼 특정한 양으로 코드화되고전송되며저장되는 정보에 익숙하다. 또한 우리는 정보가 비스킷과 동전처럼 가법적이라고 예상하는데, 내가 정보 a + 정보 b를 제시하면 나는 정보 a + b를 제시한 것이다. 그리고 우리는 정보가 결코 이 아니라고 이해한다. 확률 및 이자율과 마찬가지로 정보는 영 미만이 될 수 없는데, 이것은 내 은행 계좌나 옥스퍼드의 온도와 다르다. 존이 이웃에게 질문을 했을 때 최악의 시나리오는 그가 아무 대답도 받지 못하거나 틀린 대답을 받는 것일 것인데, 그것은 새로운 정보를 전혀 전달하지 못할 것이다.

이것들과 정보의 다른 양적 특성들은 다양한 성공적인 수학적 접근 방식에 의해 탐구된다. 지금까지 통신의 수학적 이론(MTC)이 가장 중요하고 영향력이 있으며 널리 알려진 접근 방식이다. 확률론의 이 갈래에 대한 이름은 클로드 섀넌(Claude Shannon)의 획기적인 저작에서 비롯된다. 그가 벨 연구소의 다른 연구자와 동료들이 수행한 이전 작업의 중요성을 인정했더라도, 섀넌은 정보에 관한 수학적 연구 분야의 선구자로서 그 분야의 주요한 결과들 가운데 많은 것을 이루었다. 섀넌 이후에 MTC는 정보 이론으로 알려지게 되었다. 오늘날 섀넌은 '정보 이론의 아버지'로 간주되며, 그리고 MTC가 다루는 정보의 종류는 흔히 섀넌 정보로 불린다. '정보 이론'이라는 술어는 호소력이 있지만 불행한 명칭인데, 그것은 계속해서 끝없는 오해를 초래한다. 섀넌은 그것의 광범위한 보급을 후회하게 되었고, 그래서 나는 이 맥락에서 그것을 자제할 것이다.

MTC는 데이터 코드화와 전송를 포함하는 현상의 배후에 놓여 있는 이론이다. 자체적으로 그것은 다양한 종류의 정보에 대한 분석에 심대한 영향을 끼쳤는데, 전문적 어휘를 비롯하여 최소한 초기의 개념적 틀을 제공했다. 최소한 MTC의 주요 골자를 파악하지 않은 채 정보의 본성을 이해하는 것은 불가능할 것이다. 이것이 이 장의 과업이다.

MTC는 정보를 데이터 통신으로 취급하는데, 일차 목표는 데이터를 코드화하고 전달하는 효율적인 방식들을 고안하는 것이다. 그것은 통신 한계에 관한 연구로서 전기공학이라는 분야에서 비롯되었고 정보에 대한 수량적 접근 방식을 개발한다.


그 접근 방식에 대한 직관적 감각을 얻기 위해 우리 사례로 돌아가자. 존이 정비 기사와 전화로 나눈 대화를 상기하자. 그림 8에서 존은 정보 제공자(informer), 정비 기사는 정보 수신자(informee), '배터리가 방전되었다'는 존에 의해 송신된 (의미론적) 메시지(informant)이고, 언어(영어), 통신 채널(전화 체계) 그리고 어떤 가능한 소음(송신되지 않았지만 수신되는 원치 않은 데이터)를 통한 코딩 절차와 디코딩 절차가 존재한다. 정보 제공자와 정보 수신자는 사용 가능한 기호들의 집합체(전문적으로 알파벳으로 알려져 있는데, 이 경우에는 영어이다)에 관한 동일한 배경 지식을 공유한다.

MTC는 그림 8에 나타낸 자원들의 효율적인 사용에 관한 것이다. 존이 정비 기사와 나눈 대화는 꽤 현실적이고, 그래서 단순화된 사례보다 모형화하기가 더 어렵다. MTC를 소개하기 위해 그 대신에 단 하나의 기호를 산출할 수 있는 매우 지루한 소자를 가정하자. 에드거 앨런 포(Edgar Alan Poe, 1809-1849)는 까마귀 한 마리가 어떤 질문에도 오직'네버모어(nevermore)'라고 대답할 수 있는 내용을 담은 단편을 적었다. 포의 까마귀는 단항 소자(unary device)라고 불린다. 존이 정비소에 전화를 걸고 포의 까마귀가 응대한다고 가정하자. 이런 기본적인 층위에서도 섀넌의 단순한 통신 모형은 여전히 적용된다. 그 까마귀(단항 소자)는 영에 해당하는 정보량을 제공하는 것이 분명하다. 단순화했을 때, 존은 그 통신 교환의 결과를 이미 알고 있는데, 그가 무엇을 묻던 간에 그 대답은 항상 '네버모어'이다. 그래서, 예를 들면, '제가 배터리를 충전할 수 있을까요?"라는 질문으로 표현되는 그의 무지는 감소될 수 없다. 그의 정보적 상태가 무엇이든 간에, 그 까마귀에게 적절한 질문들, 예를 들면, '제가 자동차의 시동을 걸 수 있겠습니까?', '자동차를 수리하러 오실 수 있습니까?' 같은 질문들을 묻는 것은 아무 차이도 만들어내지 못한다. 충분히 흥미롭게도, 이것이 <<파이드로스>>에서 글로 쓰여진 텍스트가 제공하는 의미론적 정보의 가치에 반대하는 플라톤의 유명한 논증의 기초라는 점을 인식하자.

[소크라테스]: 파이드로스, 글쓰기에는 뭔가 이런 기이한 점이 있으니, 그것은 사실 그림 그리기와 똑같네. 거기서 생겨난 것들은 살아 있는 생물처럼 보이지만, 자네가 어떤 질문을 던지면 무겁게 침묵한다네. (글로 쓰인) 말들도 똑같지. 자네에게는 그것들이 마치 무언가 생각을 가지고 말하는 것처럼 보일 수도 있겠지만, 그 글에 담긴 것들 가운데 무언가 배우고 싶은 것이 있어서 질문을 던지면 글은 언제나 똑같이 하나만을 가리킨다네[우리 술어로 그것은 단항 소자이다]. 일단 [275e] 글로 쓰이고 나면, 모든 말은 장소를 가리지 않고 그것을 이해하는 사람들 주변과 그 말이 전혀 먹히지 않는 사람들 주변을 똑같이 맴돌면서, 말을 걸어야 할 사람들과 그렇지 않은 사람들을 가려 알지 못하네. 잘못된 대우를 받고 부당하게 비판을 당하면 언제나 아비의 도움을 필요로 하지. 혼자서는 자신을 지킬 수도 없고 자신을 도울 힘도 없기 때문이라네. [플라톤, <<파이드로스>>(조대호 역, 문예출판사, 2008), pp. 143-4.]

플라톤이 잘 깨닫고 있듯이, 단항 원천은 모든 질문에 침묵 아니면 메시지가 아니라 항상 단 하나의 메시지로 대답하는데, 2장에서 이해했듯이, 침묵도 하나의 메시지로 간주되기 때문이다. 당연히 완전히 침묵하는 원천 역시 단항 원천으로 간주될 수 있다. 그리고 어떤 원천을 침묵시키는 것(검열)이 원천으로 하여금 아무 정보도 제공하지 못하게 하는 메스꺼운 방법이라면, 늑대가 나타났다고 소리치는 것(환경에 상관없이 동일한 메시지를 항상 반복하는)은 정보를 제공하는 원천이 아무 정보도 제공하지 못하는 단항 소자로 퇴화하는 고전적 사례라는 것이 잘 알려져 있다.

이제 확률이 같은 두 가지 기호, 즉 앞면과 뒷면 {h, t}를 갖는 공평한 동전 A처럼, 또는 '오직 너희 말은 옳다 옳다, 아니라 아니라 하라 이에서 지나는 것은 악으로 좇아나느니라'라는 마태 복음 5:37의 구절이 시사하듯이, 두 가지 메시지를 산출할 수 있는 이항 소자를 고찰하자. 동전을 던지기 전에 정보 수신자(예를 들면, 컴퓨터)는 그 소자가 실제로 어떤 기호를 산출할지 '알지' 못하는데, 그것은 영보다 큰 데이터 부족(data deficit) 상태에 놓여 있다. 섀넌은 '불확실성'이라는 전문 용어를 사용하여 그런 데이터 부족을 가리킨다. 비수학적 맥락에서 이것은 이 용어의 강한 심리학적 함의들 때문에 오해를 불러 일으킬 수 있고, 그래서 그 용어를 자제하기를 바랄 것이다. 정보 수신자가 단순한 기계일 수 있고, 그래서 심리적 또는 심적 상태가 분명히 무관하다는 것을 상기하자. 일단 동전을 던지고 나면, 그 체계는 가능한 결과―이 경우에는 확률이 같은 두 개의 기호―의 함수이며 그것이 제거하는 데이터 부족에 해당하는 양의 정보를 산출한다. 이것은 일 비트의 정보이다. 이제 두 개의 공평한 동전 A와 B로 이루어진 약간 더 복잡한 체계를 구축하자. AB 체계는 네 가지 결과, 즉 <h, h>, <h, t>, <t, h>, <t, t>를 산출할 수 있다. 그것은 네 단위의 데이터 부족을 생성하는데, 각 쌍은 원천 알파벳에서 기호 <_,_>로 산정된다. AB 체계에서 각 기호 <_,_>의 발생은 A 체계에서의 어떤 기호의 발생보다 더 높은 데이터 부족을 제거한다. 다시 말해서, 각 기호는 더 많은 대안들을 배제함으로써 더 많은 정보를 제공한다. 동전 한 개를 더하면 여덟 단위의 데이터 부족을 제공할 것인데, ABC 체계에서는 각 기호 <_,_,_>에 의해 운반되는 정보량이 더 증가한다. 기타 등등.

기본 착상은 데이터 부족의 감소(섀넌의 '불확실성')라는 견지에서 정보가 수량화될 수 있다는 것이다. 한 개의 동전은 일 비트의 정보를, 두 개의 동전은 이 비트의 정보를, 세 개의 동전은 삼 비트의 정보를 산출한다. 기타 등등. 불행하게도 실제 동전은 항상 편향되어 있다. 그것들이 실제로 얼마나 많은 정보를 산출하는지 계산하기 위해서는 일련의 유한한 동전 던지기에서 나타나는 기호들의 발생 빈도에 의거하거나, 또는 동전 던지기가 무한정 계속된다면 그것들의 확률에 의거해야 한다. 공평한 동전에 비해서 약간 편향된 동전은 일 비트보다 적은 정보를 틀림없이 산출하지만, 여전히 영 비트보다는 크다. 일련의 '네버모어'의 발생은 정보를 제공하지 않기(더 직관적이지만 심리학적인 섀넌의 어휘를 사용하면 놀랍지 않기) 때문에 까마귀는 도대체 아무 정보도 산출하지 않으며, 그런 이유 때문에 '네버모어'의 발생 확률은 최대이고, 그래서 완전히 예측할 수 있다. 마찬가지로, 편향된 동전에 의해 산출되는 정보량은 h 또는 t 발생의 평균 정보성(informativeness)에 의존한다. 결과들 가운데 하나가 발생할 확률이 더 높을수록, 그 결과를 들을 때 우리는 덜 놀랄 것이고, 결국 정보량이 더욱 더 적을 것이다. 동전이 대단히 편향되어 항상 같은 기호를 산출한다면, 그것은 아무 정보도 제공하지 못하고 까마귀나 늑대가 나타났다고 소리치는 소년처럼 거동한다.

방금 묘사한 정량적 접근 방식은 코딩 이론과 암호학 및 데이터 저장과 전송 기술에서 근본적인 역할을 수행한다. MTC는 주로 데이터를 기록할 수 있고 전송할 수 있는 신호로 효율적으로 암호화할 수 있는 코드와 통신 채널의 특성들에 대한 연구이다. 통신 분석 및 메모리 관리에 있어서 중추적인 역할을 수행하는 두 개념, 즉 중복성(redundancy)과 소음은 매우 중요하여 간략히 설명할 가치가 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 37-42. 

루치아노 플로리디: 정보-의미론적 내용으로서의 정보


의미론적 내용으로서의 정보

데이터가 잘 구성되어 있고 유의미할 때 그 결과는 의미론적 내용(semantic content)으로도 알려져 있다. 의미론적 내용으로 이해되는 정보는 두 가지 주요한 변양태―지시적(instructional) 정보와 사실적(factual) 정보―로 나타난다. 우리 사례에서 적색 등 점등은 두 가지 의미에서 의미론적 내용으로 번역할 수 있다.

(a) 한 편의 지시적 정보로서 그것은 특정한 행위, 즉 방전된 배터리를 충전하거나 교체하는 것에 대한 필요성을 전달한다.
(b) 한 편의 사실적 정보로서 그것은 배터리가 방전되었다는 사실을 나타낸다.

[...]
지시적 정보는 의미가 요구되는 특징인지 여부에 따라 일종의 환경적 정보 또는 의미론적 내용이 될 수 있다. 예를 들면, 컴퓨터 마더보드의 논리 게이트들은 전위를 전달할 뿐인데, 그때 우리는 그것들을 '만약...하다면' 같은 지시적 정보(논리적 지시들)의 견지에서 해석할 수 있을 것이다. 이 경우에 게이트의 층위에 관련된 의미론은 전혀 존재하지 않는다. 이와는 대조적으로, 자동차의 조작 지침서는 명령 형식―먼저 이것을 하고, 그 다음에 저것을 하라는 요리법 형식―이거나 아니면 조건부 형식―이렇다면 이것을 행하고, 저렇다면 저것을 행하라는 어떤 추론적 절차 형식―으로 의미론적 지시적 정보를 제공한다.

환경적이든 의미론적이든 간에 지시적 정보는 어떤 상황, 사실 또는 사태 w에 관한 것이 아니고, 그래서 w를 모형화하거나 서술하거나 표상하지 않는다. 오히려 지시적 정보는 w를 초래하도록(초래하는 데 기여하도록) 하는 의도가 담겨 있다. 사실적 의미론적 정보의 일례로서 '주전자의 물이 방금 끓었다'라는 진술과 주전자의 열선을 통과하는 전기 회로를 단락할 만큼 증기가 바이메탈판을 충분히 가열했을 때 증기에 의해 초래된 과정 사이의 차이를 비교하자. 우리 사례에서, 자동차 수리공이 존에게 전화로 자동차의 방전된 배터리를 충전된 배터리에 연결하라는 말을 할 때, 존이 수신하는 정보는 사실적 정보가 아니라 지시적 정보이다. [...]

약정('x의 값을 3으로 하자' 또는 '유전자 조작으로 일각수를 만들었다고 가정하자'), 초청('대학 파티에 충심으로 초대합니다'), 명령('창문을 닫으시오!'), 지시('상자을 열기 위해서는 키를 돌리시오'), 경기 규칙(체스 경기의 시작은'1.e2-e4 c7-c5')이 의미론적 지시적 정보의 형태들로 올바르게 규정될 수 있는 다양한 그럴듯한 맥락들이 존재한다. 악곡의 인쇄된 음표 또는 프로그램의 디지털 파일들도 지시적 정보의 전형적인 사례들로 간주될 수 있을 것이다. 지시적 정보의 그런 의미론적 사례들이 정보로 간주되기 위해서는 최소한 잠재적으로 유의미해야(해석 가능해야) 할 것이다. 마지막으로, 명명하기(예를 들면, '이제 이 배는 HMS The Informer로 불리게 된다') 또는 프로그래밍(예를 들면, 변수의 유형을 결정할 때처럼)처럼 우리가 말로 무언가를 행하는 수행적 맥락들이 존재한다. 이런 경우들에는 사실적(서술적) 정보는 지시적 가치를 획득한다.

해리 포터(Harry Potter)의 독자들이 추측할 것처럼 마법 주문에서는 두 유형의 의미론적 정보(지시적 및 사실적)가 동반할 것인데, 실생활에서는 틀렸지만 해리 포터의 모험에서는 올바르게도, x의 의미론적 표상들은 x에 대한 어떤 지시적 힘과 통제를 제공하는 것으로 추정될 것이다. 그럼에도, 시험적으로 지시적 정보는 참 아니면 거짓으로 올바르게 규정될 수 없다는 점을 기억해야 한다. 우리 사례에서 '같은 등급의 전압을 갖춘 배터리만 사용하라'는 정보가 참인지 여부를 묻는 것은 어리석을 것이다. 마찬가지로, 약정, 명령, 지시, 경기 규칙 그리고 소프트웨어는 참 또는 거짓이 될 수 없다.

흔히 의미론적 정보는 선언적 정보 또는 사실적 정보로 추정된다. 기차 시간표, 은행 계좌 수지 보고서, 의료 보고서, 내일 도서관이 열리지 않을 것이라는 통지 등과 같은 사실적 정보는 분별 있게 참 아니면 거짓으로 판별될 것이다. 그러므로 사실적 의미론적 정보는 정보를 이해하는 가장 일반적인 방식이자 가장 중요한 것들 가운데 하나인데, 참인 의미론적 내용은 지식에 대한 필요 조건이기 때문이다. [...] 이것을 다루기 전에, 의미도 진리성도 요구하지 않는 정보에 관한 개념들을 철저히 탐구할 필요가 있다. [...]

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 34-36. 

루치아노 플로리디: 정보-환경적 정보



환경적 정보

데이터가 지적인 생산자/정보 제공자에 무관하게 유의미할 수도 있는 가능성을 강조하고 싶을 때 우리는 환경적 정보에 관해 말한다. 환경적 정보에 관한 가장 흔히 인용되는 사례들 가운데 하나는 나무 나이를 추산하는 데 사용될 수 있는, 동체가 절단된 나무에서 볼 수 있는 일련의 동심원들이다. 또한 텔레비전 범죄 연속극 <CSI: 범죄 현장 조사(CSI: Crime Scene Investigation)>의 시청자들은 탄도, 피가 흩어진 유형, 장기 손상, 지문 그리고 다른 비슷한 증거에 매우 친숙할 것이다. 그런데 '환경적' 정보가 자연적일 필요는 없다. 우리 사례로 돌아가면, 존이 시동 키를 돌렸을 때 배터리 부족 표시기의 적색 등이 켜졌다. 이런 인공적 (engineered)신호 역시 환경적 정보의 일례로 해석될 수 있다. 일반적으로 후자는 본래의 데이터 자체에 직접 접근하는 대신에 그것에 의존하는 관찰자(정보적 유기체 또는 정보 수신자)와 관련하여 규정된다. 당연히 환경적 정보는 두 체계를 필요로 하는데, 그것들을 a와 b로 부르자. 여기서 a와 b는 a가 특수한 특징 F를 나타낸다는 사실이 b가 특수한 특징 G를 나타낸다는 사실과 상관되어 있는 방식으로 연결되어 있고, 그래서 두 특징 사이의 이런 연결이 관찰자에게 b는 G라고 말해준다. 요약하면,

환경적 정보 = 체계 a가 F(유형 또는 상태)라는 것이 체계 b가 G(유형 또는 상태)라는 것과 상관되어 있는 방식으로 결합되어 있는 두 체계 a와 b. 그러므로 a의 관찰자에 대해 b가 G라는 정보를 운반한다.

위의 상관관계는 어떤 법칙 또는 규칙을 따른다. 자연적 일례는 리트머스에 의해 제공된다. 산성 용액에서는 적색으로 변하고 알칼리성 용액에서는 청색으로 변하기 때문에 이것은 산/알칼리 표시약으로 사용되는 지의류의 생물학적 염료이다. 환경적 정보의 정의에 따르면, 리트머스(a)와 시험 대상 용액(b)가 리트머스가 적색으로 변하는 것(a가 상태 F에 있음)이 그 용액이 산성이라는 것(b가 유형 G임)과 상관되어 있는 식으로 결합되어 있고, 그래서 리트머스(a)의 관찰자에게 그 용액이 산성(b는 G)이라는 정보를 운반한다는 것을 알 수 있다. 우리의 자동차 사례는 인공적 사례를 제공하는데, 배터리 부족 표시기(a)의 점등(F)는 배터리(b)가 방전된 것(G)에 의해 촉발되고, 그래서 방전 사태에 관한 정보를 제공한다.

우리는 배터리 부족 표시기 점등을 배터리가 방전되었다는 정보를 운반하는 것으로 간주하는 데 매우 익숙하여 환경적 정보와 의미론적 정보―적색 등 점등은 배터리가 부족하는 것을 의미한다―를 충분히 명료하게 구별짓기가 어렵다는 것을 알아챌 것이다. 그렇지만 환경적 정보는 그 어떤 의미론도 필요하지 않거나 포함하지 않을 수도 있다는 점을 강조하는 것이 중요하다. 환경적 정보는 그저 물리적 차이로 이해되는 상관된 데이터의 연결망 또는 유형으로 구성될 수 있다. 확실히 식물, 동물 그리고 메커니즘들―예를 들면, 해바라기, 아메바 또는 광세포―는 유의미한 데이터의 의미론적 처리가 전혀 없더라도 환경적 정보를 실제로 잘 이용할 수 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 32-34.

루치아노 플로리디: 정보-데이터/정보의 유형



데이터/정보의 유형

정보는 상이한 유형들의 데이터로 구성될 수 있다. 용어는 아직 표준적이거나 확정되지 않았지만, 꽤 일반적으로 다섯 가지로 분류된다. 그것들은 서로 배타적이지 않으며, 그것들을 견고한 것으로 이해하지 말아야 한다. 환경에 따라, 수행되는 분석의 종류에 따라, 그리고 채택되는 관점에 따라 동일한 데이터가 상이한 분류에 알맞을 수 있을 것이다.

일차 데이터 Primary data
이것들은 데이터베이스에 저장된 주요 데이터로서, 예를 들면, 스프레드시트에 작성된 단순한 숫자들의 열, 또는 0과 1의 문자열이다. 그것들은 정보 형태로 사용자에게 맨 먼저 전달하도록 정보 관리 체계―자동차의 배터리가 충전될 될요가 있다는 것을 가리키는 것과 같은―가 일반적으로 고안되는 데이터이다. 대체로, 데이터 및 그것들이 나타내는 해당 정보에 관해 말할 때에는 일차 데이터/정보가 문제가 되는 것이라고 암묵적으로 가정된다. 그래서, 기본적으로, 배터리 부족 표시등의 적색 불빛은 스파이를 위한 어떤 은밀한 메시시가 아니라, 일차 정보를 전달하는 일차 데이터의 일례인 것으로 가정된다.

이차 데이터 Secondary data
이것들은 일차 데이터의 반대 데이터로서 일차 데이터의 부재에 의해 구성된다. 존이 처음에 어떻게 배터리가 방전되었는지 추측하게 되었는지 회상하자. 엔진이 아무 소음도 내지 않았고, 그래서 배터리 방전에 관한 이차 정보를 제공했다. 마찬가지로, <<실버 블레이즈(Silver Blaze)>>에서 셜록 홈즈는 다른 모든 것을 빠져나간 것―이례적인 개의 침묵―을 인식함으로써 사건을 해결한다. 분명히, 침묵이 정보를 잘 제공할 수도 있다. 이것이 정보의 특색이다. 정보의 부재가 정보를 제공할 수도 있다. 그럴 경우에 요점은 이차 정보에 관해 말함으로써 강조된다.

메타데이터 Metadata
이것들은 어떤 다른(일반적으로 일차) 데이터의 특질을 가리키는 것이다. 그것들은 위치, 형식, 갱신, 입수 가능성, 용도 제한 등과 같은 특성들을 서술한다. 따라서 메타정보는 정보의 특질에 관한 정보이다. 자동차의 조작 지침서 위에 새겨진 저작권이 간단한 일례이다.

조작적 데이터 Operational data
이것들은 전체 데이터 체계의 조작들과 그 체계의 성능에 대한 데이터이다. 따라서, 조작적 정보는 어떤 정보 체계의 동역학에 관한 정보이다. 그 등이 켜졌을 때 자동차 검사 체계가 오작동하고 있다는 것을 가리키는 노란 등이 자동차에 장착되어 있다고 가정하자. 노란 등이 켜져 있다는 사실은 배터리 부족 표시기(적색 등이 켜짐)가 제대로 작동하지 않는다는 것을 가리킬 수 있고, 그래서 배터리가 방전되었다는 가정의 기반을 약화시킬 수 있다.

파생 데이터 Derivative data
이것들은 데이터에서 추출될 수 있는 데이터인데, 예를 들면, 비교 분석과 정량적 분석을 위해 어떤 데이터 자체가 직접 다루지 않고 있는 것들에 관한 추론적 증거, 유형 또는 단서들을 탐색하는 경우에 그 데이터가 간접적인 원천으로 사용될 때마다 추출될 수 있다. 이 범주는 정확히 규정하기가 어렵기 때문에 친숙한 사례에 의존할 것이다. 신용 카드는 파생 정보의 흔적을 남기는 것으로 악명이 높다. 어떤 특정한 주유소에서 석유를 구매한 것과 관련된 존의 신용 카드 청구서로부터 어떤 주어진 시각에 그의 행방에 관한 파생 정보를 획득할 수 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 29-31

루치아노 플로리디: 정보-아날로그 데이터, 디지털 데이터 그리고 이진 데이터



아날로그 데이터, 디지털 데이터 그리고 이진 데이터

아날로그 데이터와 그것들을 코드화하거나 저장하거나 처리하거나 전송하는 체계들은 연속적으로 변한다. 예를 들면, LP 레코드판은 기록된 소리에 해당하는 연속적인 기계적 데이터를 저장하기 때문에 아날로그적이다. 반면에, 디지털 데이터와 관련 체계들은 상이한 상태들, 예를 들면 온/오프 또는 고전압/저전압 사이에서 이산적으로 변한다. 예를 들면, CD는 소리를 일련의 피트(pit, 우묵한 곳)와 랜드(land, 피트들 사이의 영역)로 변환시킴으로서 저장하기 때문에 디지털적이다. CD는 정보를 그저 기록하기보다는 코드화한다.

우주에 대한 우리의 이해는 낱알 같은 이산적인 디지털적 관념들―자연수, 동전의 앞면과 뒷면, 한 주의 날들, 축구팀이 기록한 골 등―뿐 아니라, 다양한 매끈하고 연속적인 아날로그적 관념들―고통 또는 쾌락의 세기, 실수, 연속 함수, 미분 방정식, 파동, 역장, 시간 연속체―에도 확고하게 기반을 두고 있다. 컴퓨터는 일반적으로 디지털, 즉 이산적 정보 체계로 간주된지만, 두 가지 이유 때문에 이것은 전적으로 올바르지는 않다. 튜링 자신이 진술했듯이,

디지털 컴퓨터는 [...] '이산적 상태 기계'에 속하는 것으로 분류될 수 있는데, 이 기계들은 상당히 명확한 한 상태에서 다른 한 상태로 갑자기 도약하거나 찰깍하며 움직임으로써 이동하는 기계이다. 이런 상태들은 혼동될 가능성이 무시될 수 있을 정도로 충분히 다르다. 엄밀히 말하자면 그런 기계는 전혀 존재하지 않는다. 실제로 모든 것은 연속적으로 움직인다. 그런데 유리하게도 이산적 상태 기계로 간주될 수 있는 다양한 종류의 기계들이 존재한다.

그리고 아날로그 컴퓨터들이 존재한다. 이것들은 해시계 지침판 위의 지시침에 의해 형성되는 그림자, 모래시계에서 모래 또는 물시계에서 물의 거의 규칙적인 흐름, 그리고 수학적으로 일정한 진자의 흔들림 같은 연속적으로 변하는 물리적 현상들의 상호작용을 통해서 계산을 수행한다. 분명히, 어떤 정보 체계를 아날로그 체계로 만드는 것은 특정한 물질을 사용하거나 특정한 물리적 현상에 의존하는 것이 아니라, 그것의 조작들이 고체 물질이 활용되든 액체 물질이 활용되든 기체 물질이 활용되든 간에 그것의 연속적인 물리적 변환들을 측정함으로써 직접 결정된다는 사실이다. 연속적으로 변하는 전압를 이용하는 아날로그 컴퓨터들이 존재하고, 튜링 기계(개인 컴퓨터들의 논리적으로 이상화된 모형)는 디지털 컴퓨터이지만 전기적이지 않을 수도 있다. 자체의 물리적 본성을 고려하면, 아날로그 컴퓨터는 실시간(즉, 현실 세계의 시간에 해당하는 시간)으로 작동하고, 그래서 사건이 발생할 때 사건 시각과 계산 시각 사이의 1:1 대응 관계로 그 사건을 추적하고 제어하는 데 사용될 수 있다. 그렇지만, 자체의 본성 때문에 아날로그 컴퓨터는 범용 기계가 될 수 없으며, 필연적으로 전문화된 장치로서 활용될 수 있을 뿐이다. 그것의 이점은 아날로그 데이터가 매우 강인하다는 것이다. LP 레코드판은 긁히더라도 거듭해서 들을 수 있다.

디지털 데이터는 이진 데이터로 불리기도 하는데, 그것은 일반적으로 비트(bit, binary digit)라고 불리는 단 두 개의 기호로 이루어진 조합들, 즉 모스 부호에서 점과 대시들에 비견되는 0과 1들의 문자열로 코드화되기 때문이다. 예를 들면, 이진 표기법에서 숫자 3은 11로 표현된다. 이진수에서 어느 위치의 값은 오른쪽에서 왼쪽으로 한 자리씩 이동함에 따라 2의 거듭제곱만큼 증가하기 때문에(즉, ....16, 8, 4, 2, 1) 11은 (1 × 2) +  (1 × 1)을 의미하고, 그래서 십진수 체계에서 3이 된다. 마찬가지로, 6을 이진수 체계로 계산한다면, (1 × 4) + (1 × 2) + (0 × 1)과 같고, 그래서 110이 될 수 밖에 없다는 것을 알 수 있다.

비트는 정보의 최소 단위로서 신호의 존재 또는 부재, 0 또는 1에 지나지 않는다. 일련의 8비트는 1바이트(byte, byeight)를 구성하며, 바이트를 조합함으로써 256(2^8)개 문자들의 표를 생성할 수 있다. 데이터의 각 문자는 8비트의 어떤 유형으로 저장될 수 있다. 가장 널리 사용되는 이진 코드는 ASCII(American Standard Code for Information Interchange) 코드로 알려져 있는데, 이 코드는 8비트 중에서 7비트에만 의존하여 128(2^7)개 문자들로 구성되어 있다. 컴퓨터가 'GOD'라는 낱말을 이진 코드로 표현하는 방식은 이렇다. 010001110100111101000100.

이진 체계에 따라 바이트의 양들은 다음과 같이 계산된다.

●   1 킬로바이트(KB, Kilobyte) = 2^{10} = 1,024 바이트
●   1 메가바이트(MB, Megabyte) = 2^{20} = 1,048,576 바이트
●   1 기가바이트(GB, Gigabyte) = 2^{30} = 1,073,741,824 바이트
●   1 테라바이트(TB, Terabyte) = 2^{40} = 1,099,511,627,776 바이트

이런 이유 때문에, 예를 들면, 컴퓨터 RAM의 정확한 크기는 결코 어림수가 아니다.

데이트 코드화의 이진 체계는 최소한 세 가지 이점이 있다. 첫째, 비트는 의미론적으로도(참/거짓을 의미함), 논리수학적으로도(1/0를 나타냄) 그리고 물리적으로도(트랜지스터 = 온/오프; 스위치 = 열림/닫힘; 전기 회로 = 고전압/저전압; 디스크 또는 테이프 = 자화/탈자화; CD = 피트의 존재/부재 등) 동등하게 잘 표현될 수 있고, 그래서 의미론, 수리논리학 그리고 회로와 정보 이론의 물리학 및 공학이 수렴할 수 있는 공통 기반을 제공한다.

이것은 비트를 물리적으로 인식하고, 그런 인식에 의거하여 논리적으로 작동하며, 우리가 유의미하다고 알아채는 방식들로 데이터를 조작할 수 있는 기계를 제작할 수 있다는 것(두 번째 이점)을 의미한다. 이것은 중요한 사실이다. 모든 사람이 컴퓨터에 귀속시킬 준비가 되어 있는 지능의 유일한 단서는 틀림없이 이진 데이터를 판별할 수 있는 컴퓨터 장치와 회로들의 역량에 관한 것이다. 컴퓨터가 도대체 무언가를 지각한다고 말할 수 있다면, 그 이유는 자체 회로들의 작동 프로그램을 구성하는 고전압과 저전압 사이의 차이이다. 기묘한 것은 아무튼 이것이 생물학적 체계에도 마찬가지로 참일 것이라는 점이다.

마지막으로, 디지털 테이터는 일반적으로 두 가지 상태를 나타낼 뿐이기 때문에 그런 이산적 변이는 컴퓨터가, 흔히불만족스럽게 또는 부정확하게 수행할 수 있는 아날로그 기계와는 달리, 처리할 필요가 있는 것에 대해 거의 혼동하지 않을 것이라는 점을 의미한다. 무엇보다도, 디지털 기계는 어떤 데이터가 불완전한지 여부를 인식할 수 있고, 그래서 그것이 다루고 있는 비트의 양에 관해 문자 그대로 기묘한 것이 존재한다면 수학적 계산을 통해서 상실되어버린 데이터를 복구할 수 있다.

―― 루치아노 플로리디(Luciano Floridi), <<정보: 매우 짧은 입문(Information: A Very Short Introduction)>>(2010), pp. 25-29.