1. 보상
가. 배경
1950년대 초에 캐나다 몬트리올 소재 맥길대학교의 제임스 올즈(James Olds)와 피터 밀너(Peter Milner)는 뇌의 전기 자극이 동물의 행동에 주는 영향을 연구하기 위해 쥐의 뇌에 전극을 삽입하는 수행을 했다. 가로세로 3피트 정도의 상자 안에 쥐들이 자유롭게 돌아다닐 수 있게 하였다. 그리고 쥐가 상자 안의 특정 지역을 지날 때 뇌에 자극을 주었다. 올즈와 밀너는 전극이 뇌의 특정 부위에 자리한 경우는 전기 자극을 받은 쥐들이 그 자극을 받았던 장소에 계속 머물렀고, 전기 자극을 받기를 기대하는 것으로 보인다는 것을 관찰하였다. 이 실험 결과에 착안하여 올즈와 밀너는 기막힌 아이디어를 떠올린다. 쥐가 레버를 누르면 뇌에 전기 자극을 받을 수 있는 상자를 만든 것이다. 처음에는 쥐들이 상자 안에서 배회하다가 우연히 레버를 누르곤 했다. 그러나 곧 쥐들은 전기 자극을 받기 위해 레버를 반복하여 누르기 시작하였다. 이러한 행동을 전기적 자기 자극(elecrtical self-stimulation)이라고 한다. 가끔씩 쥐들이 레버를 누르는 데 너무 열중하여 먹고 마시는 것도 마다하였으며 지쳐 쓰러져야 레버 누르기를 중단하기도 하였다. 전기적 자극은 레버를 누르는 습관을 강화(reinforcement)하는 보상(reward)을 부여하는 것처럼 보였다. 과학자들은 어느 부위가 그러한 강화 행동을 유발시키는지 알기 위해 뇌의 각기 다른 부위에 전극을 꽂아 실험했다. 그 결과, 가장 효과적인 자기 자극을 유발하는 부위는 중뇌의 복측피개영역(ventral tegmental area)에서 외측시상하부를 지나 몇 군데 전뇌(forebrain) 영역으로 뻗는 도파민성 늇런 경로에 대부분 해당하는 것으로 확인되었다. 도파민 수용체를 억제하는 약물들은 전기 자극을 감소시키는 것으로 보아 동물들이 실제로 뇌에서의 도파민 분비를 촉진시키기 위해 자기 자극을 행하는 것으로 보인다. 연구자들이 뇌에서 도파민 분비를 촉진시키는 암페타민(amphetamine)과 같은 약물의 주입을 위해서도 동물들이 레버를 누른다는 것을 알게 되면서 이러한 추정이 맞다는 생각이 더 강해졌다. 전기적 자기 자극에서 도파민이 전부는 아니지만 어쨌든 이제 뇌에서의 도파민 분비가 도파민 분비를 유도하는 행동을 강화할 것이라는 데는 거의 의심의 여지가 없다.
나. 도파민의 역할
수년 동안 이 중뇌의 복측피개영역(ventral tegmental area)에서 전뇌(forebrain)로 뻗는 도파민성 신경회로는 쾌락의 보상, 다시 말해 즐거움에 관여하는 경로로 여겨져 왔다. 음식 섭취의 경우, 맛있는 음식에 반응하여 도파민 분비가 증가하여 즐거운 기분을 주는 것을 여겨져 왔다. 동물들은 쾌락적 보상을 위해 맛있는 음식을 찾도록 동기가 부여된다. 전뇌에서 도파민이 분출되는 것이다. 그러나 최근부터 이 단순한 가설이 이의가 제기되고 있다. 외측 시상하부를 통과하는 도파민성 뉴런의 축삭을 손상시키자 동물이 음식을 먹는 것을 중단은 하지만 음식에 대한 쾌락적 반응은 감소되지 않은 것을 발견하였다. 만약 맛있는 음식 한 조각이 그러한 손상을 받은 쥐의 혀 위에 놓이면 그 쥐는 마치 아직도 그 음식이 즐거운 기분을 불러일으키는 것처럼 입술을 다시거나 하는 행동을 하며 격구 그 음식 조각을 먹는다는 것이다. 도파민이 결여된 동물은 마치 음식을 좋아하는 하지만 음식을 원하지는 않는 것처럼 행동한다는 것이다. 이 동물들은 음식이 일단 주어지면 그 음식을 즐기기는 하지만 음식을 찾기 위한 동기는 결여되어 있는 것으로 보인다. 이 동물들은 음식이 일단 주어지면 그 음식을 즐기기는 하지만 음식을 찾기 위한 동기는 결여되어 있는 것으로 보인다. 반대로 정상 쥐의 외측 시상하부의 도파민 뉴런 축삭을 자극하면 이것은 음식에 대한 쾌락적인 요소를 증가시키지 않으면서 음식을 갈망하는 행동을 유발시키는 것으로 보인다.
놀랄 일이 아니듯, 중독과 연관된 갈망에 대한 최근 연구는 도파민성 신경회로의 역할에 초점을 맞추고 있다. 매우 중독성이 강한 약물들 가운데 일부가 뇌의 도파민성 시냅스에 직접 작용하는 것은 우연이 아니라고 할 수 있다. 도파민 신호가 행동을 조절할 수 있다고 생각하게 된 것은 동물의 중뇌의 복측피개영역의 도파민성 뉴런의 활성화를 미세전극으로 관찰하는 연구로부터 시작되었다. 영국 캠브리지대학교의 울프람 슐츠(Wolfram Schultz)박사와 공동연구자들은 원숭이에게 빛을 켠 바로 다음에 주스 한 모금을 줄 때 원숭이의 도파민 뉴런에 어떤 일이 일어나는지 조사했다. 슐츠 박사는 실험 초기에 원숭이들이 주스를 받기 전에 불이 켜진다는 사실을 알게 되기 전까지 도파민성 뉴런이 빛에 전혀 반응하지 않지만 주스를 받을 때는 짧은 시간 동안 활성화되는 것을 관찰하였다. 만약 도파민 뉴런이 단순히 즐거운 경험이 일어나는 것을 입력하는 뉴런이라면 이런 결과를 기대할 수 있을 것이다. 그러나 실험이 진행되면서 빛을 비춘 후 주스를 주는 것이 여러 번 반복되자 도파민 뉴런이 활성화되는 패턴은 곧 바뀌었다. 이제 도파민 뉴런들은 빛에 의해 활성화되었으며 주스에는 전혀 반응하지 않았다. 게다가 슐츠 박사와 연구팀이 이미 훈련된 원숭이에게 속임수로 빛을 비춘 후 주스를 주지 않는 경우는 주스를 받아왔던 시간에 도파민 뉴런의 활성화가 감소했다. 이 연구 결과 도파민 뉴런의 활성화는 보상 예측의 오류에 대해 신호를 보낸다는 개념을 이끌어내었다:
'기대한 것보다 더 좋은 사건'은 도파민 뉴런을 활성화하지만 '기대한 것보다 나쁜 사건'은 도파민 뉴런의 활성화를 억제하고 '기대한 것과 같은 사건'은 아무리 사건 자체가 쾌락적 보상을 주더라도 도파민 활성화를 변화시키지 않는다는 것이다. 기대하게 되거나 기대한 것보다 더 좋은 결과를 주는 행동은 계속 반복하게 되고 기대한 것보다 나쁜 결과를 주는 행동은 하지 않게 되는 것이다.
댓글