본문 바로가기
심리

행동주의적 학습: 조작적 조건화

by PhotoJA 2021. 12. 15.
728x90

행동주의적 학습: 조작적 조건화(조건형성)

 

1. 고전적 조건화와의 차이

  앞서 고전적 조건화에서 학습이 되는 연합(association)을 S0R로 표시할 수 있다면 조작적 조건화에서의 학습은 S-R-O라는 연합니다. 여기서 O는 'outcome(결과, 효과)'의 약자이다. 즉 유기체가 주어진 환경 S에서 "O"라는 결과를 얻기 위해 능동적으로 환경에 R이라는 작업("조작"이라고도 함)을 하는 경향을 갖는 것이 학습인 것이다. 고전적 조건화에서는 조건자극(CS)이 있는 가운데 자연적 자극(US)과 그에 따른 자연적 행동(UR)이 발생할 때만 '조건자극-조건행동'이 되는 수동적인 학습이었다. 따라서 여기에만 의존한다면 유기체가 학습할 수 있는 범위는 너무 좁다. 조작적 조건화는 유기체가 환경에 능동적으로 작업을 걸어 결과를 얻어내는 능동적 학습이다. 

  그러나 수동적 · 능동적이라고 할 때, 의식을 가정하는 것은 아니다. 행동주의는 의식을 가정하지 않고 학습을 설명한다는 입장이다. 늑대가 자신을 혼내 준 검은 곰을 멀리서 보기만 해도 도망치는 것과 비둘기가 먹이가 나오는 손잡이를 쪼는 것을 보고 의식을 갖고 행동한다고 할 수는 없다는 관점이다. 단지 그러한 외적 행동이 유발될 확률이 높아지는 기제를 설명할 때, 조건화 대상인 자극과 자연자극이 수반하는 경우를 기다리는 것을 수동적이라고 본다면 유기체가 환경에 직접 작업 또는 조작을 하는 것을 능동적이라고 한 것이다. 

 

2. 조작적 조건화의 개념

  스키너는 조작적 조건화의 초기 연구라고 할 수 있는 손다이크의 도구적 조건화를 좀 더 확장하고 명칭도 조작적 조건화로 바꾸었다. 그는 심리학의 역사에서 행동주의의 이론을 가장 강력히 광범위하게 제시하고 당시 사회의 도전에서 행동주의를 방어할 수 있는 설득력 있는 적용을 제시한 위대한 심리학자이다. 예를 들어 그는 비둘기를 행동주의적으로 훈련시켜 일반적인 비둘기라면 전혀 하지 않을 행동을 학습하게 하였다. 비둘기가 탁구를 치고 스크린에 나타난 목표물을 특정 방향으로 쪼아 유도탄의 목적지향 비행을 가능하게 한 것 등은 당시 세인을 놀라게 하기에 충분하였다. 그는 스키너 상자를 '발명'했다고 할 만큼 다양한 동물연구에 광범위하게 사용되는 유명한 실험도구를 제작해 사용하였다. 

  상자 안에는 반응행동을 보이는 데 사용되는 도구들, 즉 새들이 쪼을 수 있는 원반, 원숭이가 잡을 수 있는 손잡이, 쥐가작업하는 막대가 있다. 그리고 반응에 따라 먹이나 강화물이 공급되는 통로가 한쪽 벽에 설치되어 있다. 반응도구의 움직임은 컴퓨터나 전기계기에 자동적으로 기록되고 그에 따라 강화물의 제시 또한 자동적으로 통제된다. 

  스키너는 행동의 결과를 강화물(reinforcer)이라고 하였고 그 결과를 받기 전의 행동이 미래에 반복해 나타날 경향성을 변화시키는 것을 강화(reinforcement)라고 하였다. 강화에는 정적 방향(행동 증가)과 부적 방향이 있고 행동경향의 변화가 곧 조작적 조건화를 통한 학습이다. 

 

3. 조형과 연속 근접화

  연구자가 어떤 동물의 행동을 변화시키는 목표를 정하고 강화계획을 실시할 때, 그 동물이 처음부터 목표행동을 하는 것은 아니므로 점차 목표행동의 방향으로 유도해야 한다. 이런 절차를 조형(shaping)이라고 한다. 예를 들어 쥐가 쇠막대에 접근해 누르게 하려면 쥐의 평상적인 행동을 관찰하여 기존 행동에 약간의 변화가 있는 쪽으로 강화를 한다. 

왔다갔다 하기 → 막대 가까이 가기→ 막대에 주기적으로 가까이 가기
→ 매우 가까이 가기 → 일어서기 → 일어서기 →막대접촉하기 →누르기
<참고1> 연속 근접화를 통하여 쥐의 쇠막대누르기 행동 조형

  <참고 1>에서와 같이 연속적인 근접화(successive approximation)를 통하여 쥐의 막대 누르기 행동을 이끌어 낸다. 처음에는 상자 안 쥐의 평상적 행동인 왔다갔다 하는 행동 중에서 막대에 조금이라도 가까이 가는 행동에 강화물을 주어야 한다. 막대에 가까이 자주 갈 정도로 강화가 되면 강화물 제공을 멈추고 막대에 매우 가까이 갈 때까지 관찰한다. 막대에 매우 가까이 간 후에는 즉시 강화물을 주어 그 행동의 경향을 높인다. 그 행동이 어느 정도 강화된 다음에는 강화물 제공을 멈추고 일어설 때까지 기다린다. 일어서는 행동이 보이면 즉시 강화물을 준다. 이 행동이 어느 정도 강화되면 강화물 제공을 멈춘다. 다음은 일어선 상태에서 쇠막대에 접촉했을 때 강화물을 주고 마지막으로 접속상태에서 막대를 누르면 강화물을 준다. '천리길도 한 걸음부터'라는 우리말 속담이 조형 과정을 잘 나타내고 있다.

 

4. 강화물과 강화 방식의 결합에 의한 강화의 분류

  강화물에는 유기체가 좋아하는 것과 싫어하는 것이 있고 강화 방식에는 강화물의 제시와 제거가 있다. 강화물과 강화 방식의 결합에 따라 상이한 조작적 조건화, 즉 네 가지 강화가 이루어진다. 아이가 잘했을 때 좋아하는 결과를 제시하여 행동경향을 증가시키는 강화는 상의 제시이고 잘못했을 때 싫어하는 결과를 제시하여 행동경향을 감소시키는 강화는 벌의 제시이다. 처벌 후 에는 바람직한 행동의 방향이 제시되어야 할 것이다. 

  그런데 행동경향을 증가시키기 위해서는 그 행동경향을 낮출 수 있는 싫은 것을 제거하는 것도 한 방법이다. 예를 들어 여름에 시험 때가 되어 공부를 시작한 아이에게 방안의 더위를 제거하여 공부행동의 경향을 증가시키는 강화는 불편제거이다. 한편 행동경향을 감소시키기 위해 유기체가 좋아하는 결과의 제거, 즉 상을 제거하는 것도 한 방법이다. 예를 들면 학생들이 수업에 적극 참여할 경우 받을 수 있는 보너스 점수가 10점이라고 할 때, 지각을 하거나 수업을 방해할 때마다 그 점수를 감소시켜 좋아하는 결과를 제거하면 바람직하지 않은 행동의 경향이 감소될 것이다. 즉 수업을 방해하면 좋은 결과나 상이 제거되므로 그 행동을 덜하게 될 것이다. 

  상의 제시를 정적 강화(positive reinforcement), 벌의 제시를 정적 처벌(positive punishment), 상의 제거를 부적 처벌(negative punishment) 그리고 벌의 제거를 부적 강화(negative reinforcement)로 한다. 여기서의 '정적(positive)'은 결과의 제시이고 '부적(negative)'은 결과의 제거이다.

 

5. 계속강화와 부분강화

  바람직한 행동을 할 때마다 강화를 주는 것이 계속강화이다. 이 방식이 반응횟수를 빠른 시간에 증가시키므로 신속히 학습된다고 볼 수 있다. 이런 상황에서 강화가 중단되면 그것이 중대한 사건이 되어 즉시 행동을 멈추게 된다. 예를 들면 자판기에 돈을 넣는 행동을 할 때마다 원하는 강화물이 주어지는데 한 번이라도 물건이 안 나오면 그 기계에 돈을 넣는 행동은 즉시 정지된다. 서양에선 가족끼리도 매일 "I love you."라고 표현하다가 하루라도 안 하면 가족의 유대에 문제가 생길 수 있다. 

  물론 생활의 많은 장면에서 계속강화는 드물고 행동발생의 시점이나 횟수가 어느 정도 경과해야 강화물이 주어지는 부분강화가 많다. 낚시꾼이 받는 강화는 부분강화이다. 낚싯대를 던질 때마다 즉시 고기가 물지는 않는다. 고용장면에서는 안정된 근로자에게 매시간 급료를 주기보다는 월급이 선호되고 학교에서 학생의 성적을 알려 줄 때는 매일이나 매주가 아니라 학기말에 학점으로 알려준다. 이러한 부분강화를 할 때, 초기의 학습진도는 계속강화보다 느리지만 일단 습득된 행동은 시간이 지나도 비교적 잘 유지된다.

 

6. 생활 속의 조작적 조건화

   

   (1) 법 · 사회규범의 집행

    교도소나 교정기관에서 하는 법 집행은 싫은 결과를 직접 주는 벌의 제시이다. 예를 들어 가정폭력을 감소시키려고 폭력적인 남편을 신속히 체포하게 된다. 학교에서는 폭력적인 학생에게 처벌을 가한다. 이렇게 법 · 사회규범의 집행 장면에서는 강화의 네 가지 종류 중에서 벌의 제시가 주로 사용된다. 그러나 경우에 따라서는 벌의 제시보다는 상의 제거를 활용할 수도 있을 것이다. 예를 들어 사회적 지위가 높은 사람들 가운데 세금을 내지 않는 경우, 그런 행동을 감소시키기 위해 그들이 사회에서 받는 특권을 감소시킬 수 있다. 즉 세금 미납자들의 명단을 광범위하게 공개하여 직접 처벌 대신 사회적 특권이 감소되도록 하는 것이다.

 

   (2) 행동수정

    임상장면이나 교육장면에서 강화를 선별해 실시하면서 행동을 수정할 수 있다. 바람직한 행동경향을 증가시키기 위해 상을 주거나 불편을 제거하고 바람직하지 않은 행동경향을 감소시키기 위해 벌을 주거나 상과 특권을 감소시키는 것을 행동수정의 원리로 사용할 수 있다. 말썽꾸러기 아이가 차분해지도록 교육시킬 수 있고 정신지체아가 자신을 돌보는 것을 배우며 대인관계를 전혀 하지 않는 자폐아들이 남과 관계 맺는 법을 배우게 할 수가 있다. 

    많은 경우, 아이들의 바람직한 행동에 칭찬과 시선을 주는 것만으로도 행동 방향을 전환시킬 수 있다. 즉 아이는 칭찬이나 관심을 받은 행동을 반복하게 된다. 또는 공격적 행동이나 자학행동을 할 때, 시선을 주지 않고 무시하거나 적시에 꾸짖는 것으로 그러한 행동경향을 감소시킬 수 있다. 극적인 사례를 보자면 세 살짜리 자폐아 19명에게 부모들이 2년간 주 40시간 행동조형 프로그램을 실시하였따. 이때 바람직한 행동에 상 주기, 공격적 · 자학적 행동에서 무시하거나 적시에 벌 주기를 하였더니 놀라운 효과가 있었다. 초등학교 들어갈 때쯤 되니 19명 아이들 중 9명이 학교생활을 성공적으로 하고 정상적인 지능을 보였는데 이런 훈련을 받지 않은 40명 중 오직 1명만 증세가 비슷한 정도로 호전되었을 뿐이었다.

    행동수정 장면에서 교환권을 많이 사용한다. 아이들에게 많이 사용하는 스티커 같은 것인데 수용시설이나 가정에서 행동수정이 필요한 대상자가 선호하는 물품, 기회, 음식물 등이 제한된 상황에서 가능하다. 이때 바람직한 행동을 하거나 늘 하던 공격적 문제행동을 일정 기간 하지 않을 경우, 교환권을 준다. 이 교환권이 쌓이면 그것으로 선호하는 물품으로 바꾸거나 원하는 기회를 얻어 실제로 상을 받게 된다. 

 

   (3) 학습된 무기력(무력감)

    일반적으로 조작적 조건화는 바람직한 행동경향을 증가시키는 데 많이 사용되지만 의도하지 않은 반대 경우도 가능하다. 인간이나 동물이 자신에게 닥친 괴로움을 회피할 수 없거나 좋은 결과를 얻을 수 있는 노력이나 행동을 할 수 없는 불행한 경험을 반복적으로 하게 되면 무기력을 학습하게 된다. 그 결과, 적은 노력으로 좋은 결과를 얻을 수 있는 기회가 와도 움직이지 않게 된다. 환경을 통제할 수 있는 어떤 노력도 포기하게 되고 심한 스트레스나 정신질환으로 고통받게 될 수도 있다. 

 

 

 

 

 

728x90

'심리' 카테고리의 다른 글

기억과정 (1)  (0) 2021.12.17
인지주의적 학습  (0) 2021.12.16
행동주의적 학습: 고전적 조건화  (0) 2021.12.15
지각과정: 지각 조직화, 하향처리  (0) 2021.12.14
감각과정  (0) 2021.12.14