본문 바로가기
Study/발달심리학 이야기

학습 심리

by PhD_Ming 2022. 1. 17.
300x250

기본 학습 개념 및 고전적 조건형성

학습(learning): 경험, 정보, 행동 등을 통해 어떤 것을 획득, 습득하는 과정이며 인간은 학습을 통해 환경에 적응함

  • 고전적 조건형성
  • 조작적 조건형성
  • 인지적 학습 (관찰, 언어 등을 통한 학습)

연합 학습(associative learning): 특정 사건들이 동시에 발생하는 학습. 여기서 사건은 두 개의 자극(고전적 조건형성)일 수 있고 또 반응-결과(조작적 조건형성)일 수도 있음. 

  • 고전적 조건형성(classical conditioning): 두 자극(stimulus)을 연합하여 사건을 예측함. 여기서 자극이란 어떤 반응을 유발하는 특정 사건/상황을 의미함. 예를 들어 번개가 반짝인 후 천둥이 치는 것을 예상할 수 있음. 우리는 자동적으로 자극을 연합하며 이러한 연합을 직접 통제하지 않음. 반응적 행동(respondent behavior: 어떤 자극에 대해 자동적 반응으로 나타나는 행동)을 보임
  • 조작적 조건형성(operant conditioning): 반응(우리의 행동)과 그 결과를 연합시켜 학습함. 따라서 좋은 결과를 일으키는 행동을 반복해서 하며, 나쁜 결과를 일으키는 행동을 피함. 이러한 연합은 조작적 행동(operant behavior: 결과를 유발하는 행동)을 유발함

인지적 학습 (Cognitive Learning): 정보획득은 우리의 행동을 안내해줌. 

  • 관찰학습 (observational learning): 타인의 경험을 통해 학습하는 인지적 학습 방식 중 하나. 침팬지가 다른 침팬지가 퍼즐을 푼 후 음식을 보상으로 받는 것을 보고 그 퍼즐을 더 빨리 풀도록 학습하는 것.

 

고전적 조건형성

Watson의 행동주의(behaviorism):

심리과학은 인간의 내적 사고, 느낌, 동기를 버리고,대신 환경의 자극에 유기체가 어떻게 반응하는지 연구해야한다고 주장함. 이를 기반으로 유명한 파블로프의 개 실험이 등장. 현대 심리학자 대부분은 내적 심리 작용을 무시하라는 데에 대부분 반대하지만, 고전적 조건형성이 모든 유기체가 환경에 적응하는 데 있어서 기본적인 학습 유형임은 동의함.

파블로프의 실험:

개한테 밥을 주는데, 개가 어느 순간 밥을 먹을때 뿐 아니라 밥의 일부만을 보았을 때, 혹은 밥그릇을 보았을 때, 밥을 주는 사람을 보았을 때, 심지어 발자국 소리를 들었을때까지 침을 흘리는 것을 발견하여 유명한 실험을 진행하게 됨. 개에게 밥을 주면서 다양한 중립자극(neutral stimuli; NS)과 연합시킴. 

  • 중립자극: 고전적 조건형성에서 조건형성 전 아무런 반응을 일으키지 않는 자극

반복해서 밥과 중립자극을 함께 제시하자 두 사건이 연합되어 자극만으로도 침을 흘리게 됨. 밥을 먹으며 침을 흘리는 것은 이러한 조건 형성이 필요없으므로, 침흘리는 반응을 무조건반응(unconditioned response: UR), 밥이라는 자극은 무조건 자극(unconditioned stimulus: US)라 할 수 있음. 종을 울리는 자극과 연합하여 조건형성을 시킨 경우 이 때 침을 흘리는 반응을 조건반응(conditioned response: CR), 종이라는 자극을 조건 자극(conditioned stimulus: CS)이라 함. 

이후 파블로프는 획득, 소거, 자발적 획득, 일반화, 변별화의 다섯가지 주요 조건형성 과정을 연구함. 

획득(Acquisition): 고전적 조건형성에서 중립자극과 무조건 반응이 연합되어 중립자극이 조건반응을 일으키는 초기 단계를 말함. 조작적 조건형성에서 강화된 반응이 강해지는 것을 의미함. 

  • 조건형성은 음식을 얻고, 위험을 피하고, 짝을 찾고, 자손을 번영하는 데 도움을 주는 단서에 반응하게 함으로써 인간, 동물의 생존과 번영에 기여함. 
  • 고순위 조건형성(higher-order conditioning): 조건형성 경험으로 나타난 조건 자극이 두 번째 조건자극을 형성하는 과정을 말함. 일반적으로 두 번째 조건자극은 첫번째보다 연합이 야감. 예를 들어 종소리와 음식을 연합시켜 조건형성 시킨 동물이 어떤 빛이 그 종소리를 예측해줌을 학습한 경우, 빛만으로 조건반응을 보일 수 있음

소거(Extinction): 조건자극이 더이상 무조건 자극과 연합되지 않을 경우 조건반응이 감소하는 것. 종소리와 음식을 연합시켜 조건형성한 후 종소리를 제시하고 더이상 음식을 같이 제시하지 않는 경우 침 흘리는 반응이 감소

자발적 획득(Spontaneous Recovery): 자극 제시를 더 하지 않았을 때 소거된 반응이 다시 나타나는 경우. 즉, 종소리가 소거됨에도 며칠 후에 종소리를 듣고도 침흘리는 반응을 보이는 경우. 일반적으로 약한 반응이긴 함.

일반화(Generalization): 반응이 조건형성된 후 조건자극과 유사한 다른 자극이 유사한 반응을 유발하는 경우. 종소리 하나를 들려주면서 조건형성을 하였는데 다른 종소리에도 유사한 반응을 보이는 경우. 조작적 조건형성에서는 어떤 상황에서 학습된 반응이 유사한 다른 상황에서도 나타나는 경우를 말함. 이 역시 적응적임(생존에 기여)

변별화(Discrimination): 조건자극과 무조건 자극을 일으키지 않는 유사한 다른 자극을 변별할 수 있도록 학습된 능력을 말함. 즉, 한 종소리가 밥을 주는데 다른 유사한 종소리는 밥을 주지 않으면 이 종소리들을 변별해 반응함. 조작적 조건형성의 경우, 강화된 반응을 다른 강화되지 않은 유사한 반응들과 변별할 수 있는 능력을 지칭함.

파블로프의 유산 (왜 파블로프의 연구가 중요한가)

  1. 여러 유기체에서 많은 반응들과 많은 자극들이 고전적으로 조건형성이 될 수 있음을 밝히게 됨. 따라서 고전적 조건형성은 모든 유기체들이 환경에 적응하기 위해 학습하는 하나의 방식임
  2. 객관적으로 학습을 연구할 수 있는 과정을 보여줌. 침의 양은 측정가능한 행동이었으며, 파블로프는 이처럼 심리학이 어떻게 과학적 모델을 따라야하는 지 제시해줌. Reductive 한 접근방식

고전적 조건형성의 적용

  • 마약중독
  • 폭식
  • 면역반응
  • 인간의 정서 및 행동이 대부분 조건형성의 결과로 이루어진다는 왓슨의 생각을 뒷받침함. 리틀 앨버트 연구(큰 소리 +. 하얀 쥐 = 두려움 반응 -> 이후 다른 동물로 까지 일반화시킴)

 

조작적조건형성

스키너의 실험

Thorndike 의 효과의 법칙(law of effect): 보상받는 행동은 재발생하고, 처벌된 행동은 덜 발생하는 경향이 있음. 스키너의 행동 통제 원칙을 보여주는 행동주의 기법 발달의 기반이 됨.  

스키너는 스키너 박스라고 불리는 조작실을 설계하고, 그 안에 있는 바를 누르면 (아니면 특정 행동을 한 경우에) 보상으로 물이나 음식을 주었음. 또 이 박스는 이러한 반응을 기록하는 장치가 있어 스키너의 강화 (reinforcement: 어떤 행동을 강화하는 사건) 개념을 측정할 수 있었음. 강화물은 칭찬, 주의, 돈, 음식, 물 등등 다양하게 존재함.

행동 형성(shaping): 원하는 행동을 하게끔 점진적으로 유도하는 것. 예를 들어 쥐가 바를 누르는 행동을 하게끔 유도하기 위해 바에 가까이 왔을 때 보상을 주고, 그 다음에는 바를 만졌을 때 보상을 주고, 그 이후 바를 누를 때 보상을 주는 경우. 다음 단계를 보상하므로써 마지막 원하는 행동을 하게끔 유도하게 됨.

  • 이는 더 복잡한 행동을 점진적으로 형성할 수 있게 해줌. 
  • 비언어적 유기체가 어떻게 지각하는지 이해를 도움 예를 들어 강아지는 빨강과 초록을 변별할 수 있나? 

강화물 유형

  • 긍정적 강화물(positive reinforcer): 행동 반응 후 즉각적으로 만족스러운 자극을 제기함으로써 그 반응을 강화시키는 것
  • 부정적 강화물(negative reinforcer): 행동 반응 직후 어떤 부정적인 것을 감소 혹은 제거함으로써 그 반응을 강화시키는 것. 처벌이 아님!
  • 일차적 강화물(primary reinforcer): 학습되지 않아도 행동을 강화시키는 것. 예를 들어 배고플 때 음식을 받는 것
  • 조건형성된/이차적 강화물(conditioned/secondary reinforcer): 일차적 강화물과 연합되어 강화효과를 가지는 것
  • 즉각적 강화물(immediate reinforcer): 조건 형성이 빠르게 되며 지연된 강화물보다 쥐와 같은 동물에게 더 효과적
  • 지연된 강화물(delayed reinforcer): 인간은 지연된 강화물에도 반응하는데 예를 들어 월급

강화 계획 (Reinforcement schedule)

  • 계속 강화 계획 (continuous reinforcement schedule): 행동반응 후 항상 강화물을 제공하는 것. 행동을 마스터하는 데 가장 효과적인 선택으로 학습이 빠르게 이루어지지만, 강화물이 더이상 제공되지 않는 경우 소거도 빠르게 이루어짐 (자발적 회복을 볼 수도 있음)
  • 부분적/간헐적 강화 계획 (partial/intermittent reinforcement schedule): 행동반응 후 어떤 경우에는 강화물이 제공되지만 어떤 경우에는 제공되지 않는 경우. 학습이 느리게 이루어지지만 소거 역시 느리게 이루어짐. 
    • 고정비율 계획(fixed-ratio schedule): 일정 수의 반응 후 강화물이 주어지는 경우. 예를 들면 커피 10개 마시면 하나 더 주는 쿠폰
    • 변동비율 계획(variable-ratio schedule): 예측불가능한 반응 횟수 후 강화물이 주어지는 경우. 슬롯머신같은 것. 더 높은 비율의 반응을 유발함
    • 고정간격 계획(fixed-interval schedule): 고정 기간 후 첫 반응에 강화물이 주어지는 경우. 택배 오는 시간이 됐을 때 더 자주 택배함을 확인하는 것
    • 변동간격 계획(variable-interval schedule): 다양한 기간 간격 후 첫 반응에 강화물이 주어지는 경우. 아주 고대하던 메시지가 우리의 핸드폰 확인하는 반응을 지속시키는 경우.

비율계획이 간격계획보다 행동강화가 잘 이루어지며, 강화물이 예측불가능한 경우(고정보다는 변동되는 경우) 행동반응이 더 지속적으로 이루어짐. 스키너에 따르면, 행동 자체는 다를수 있지만 조작적 조건형성 자체는 전 세계에 보편적으로 나타난다고 주장함.

처벌(punishment): 강화물이 행동을 강화시킨다면, 처벌은 그 반대로 행동을 감소시킴. 즉각적이고 명확하게 일어나는 처벌제는 원하지 않는 행동을 아주 효과적으로 감소시킬 수 있음. 에를 들어 음주 운전에 대한 법적 처벌을 강화시키기보다 더 자주 있는 경찰 단속이 음주운전 감소에 더 효과적이었음. 

양육에 대해서 처벌은 어떤 점을 시사할까?

- 처벌된 행동은 억압되는 것이지 잊혀지지 않음. 이러한 일시적 반응이 부모의 처벌 행동을 강화시킬 수 있음. 
- 처벌은 상황에 대한 변별을 가르쳐줌. 조작적 조건형성에서 변별은 유기체가 특정 반응만을 학습하는 경우 발생함. 집에서 뛰어다닌 것에 처벌을 하는 경우 & 놀이터에서 뛰어다니는 경우
- 처벌은 두려움을 가르침. 조작적 조건형성에서 일반화가 나타난다고 했음. 특정한 바람직한 행동뿐 아니라 다른 행동에 대해서도 두려움을 학습시킹 수 잇음. 예를 들어 처벌을 사용하는 교사때문에 학교 전체에 대한 두려움이 발생할 수 있음
- 신체적 처벌은 행동 해결을 위한 방식으로 폭력을 사용하는 것을 모델링 시킴으로써 공격성을 증가시킬 수 있음.

하지만 논쟁이 존재해서 약간의 신체적 처벌은 생각보다 많은 문제를 일으키는 것은 아니라고 주장하는 연구도 존재함. 문화권에 따라서 다른 영향이 존재한다는 연구도 있음. 예를 들어 체벌을 엄격히 금지하는 곳에서 아이들을 체벌하는 경우 아동 발달에 부정적 결과가 높게 나타나지만, 체벌이 흔하게 일어나는 국가의 경우 부정적 결과가 크지 않다는 결과. 

부정적인 처벌보다는 (방청소를 하지 않으면 밥 없어) 긍정적인 강화(방청소를 하고나서 맛있는 저녁을 먹자)가 더 도움되며 이러한 훈련 프로그램들이 존재함.

스키너의 유산

  • 인간 내적인 생각, 느낌이 아닌 외부의 환경적 영향이 인간의 행동을 형성한다고 주장하였음. 심지어 뇌과학은 심리학에서 필요하지 않다고 주장. 타인의 행동에 영향을 미치기 위해 학교, 직장, 집 등에서 조작적 조건형성 법칙을 사용하기를 주장. 
  • 비평가들은 스키너가 인간의 개인적인 자유를 무시하고 타인의 행동을 통제하는 것을 추구함으로써 인간을 비인간화했다고 비판함. 하지만 스키너는 외부적 결과는 이미 인간 행동을 위험하게 통제하고 있는데 조작적 조건형성을 통해 더 나은 상황으로 이끈다면 무엇이 문제냐며, 처벌보다 강화물이 더 인간적이며 이미 역사는 우리를 형성했다고 주장했음.

 

생물, 인지, 및 학습

고전적 조건형성에 대한 생물학적 제약

  • 준비성(preparedness): 유기체의 조건 형성에 대한 능력은 생물학적으로 제약되어 있음.각각의 종은 생존을 향상시키는 연합을 학습하도록 준비되어 있으며 이를 준비성이라고 함. 예를 들어 굴을 먹고 아팠으면 그 다음 굴맛에 혐오를 형성했을 것임. 이러한 성향은 궁극적으로 생존할 가능성을 증가시켜줌. 다윈의 법칙을 지지함. 

조작적 조건형성에 대한 생물학적 제약

  • 돼지에게 노래를 부르게 할 수 없음. 즉, 생물학적 제약은 자연적으로 적응적인 연합을 학습시킴. 
  • 본능적 표류(instinctive drift): 학습된 행동은 점진적으로 사라지고 생물학적으로 타고난 패턴을 보이게되는 경향성

고전적 조건형성에서의 인지적 영향

  • 연합자체가 더 예측이 가능하다면(인지적으로), 조건형성 반응이 더 강하게 일어남. 
  • 연합 역시 태도에 영향을 줄 수 있음. 만화 주인공이 맛있게 어떤 것을 먹으면 그 음식과 관련된 만화 캐릭터를 선호함. 
  • 학습한 연합을 사람들이 알아차리고 인식한다면, 조건형성된 선호, 비호가 더 강하게 나타남.

조작적 조건형성과 인지

  • 인지적 지도(cognitive map): 개인의 환경에 대한 정신적 표상. 예를 들어 메이즈를 탐구한 후 쥐들은 그 메이즈에 대한 인지적 지도를 학습한 것처럼 행동함; 즉 보상 없이 길을 학습하게 한 후 어떤 길에 먹이를 놓은 경우 쥐들은 강화된 것처럼 재빠르게 먹이가 있는 길을 찾음. 이는 잠재적 학습의 예시임!
  • 잠재적 학습(latent learning): 보상이 있기 전에는 학습한 것을 실행하지 않는 경우

인지적 관점은 보상의 한계를 제시하기도 함. 즉 과도한 보상은 내적 동기를 저하시키게 됨. 예를 들어 어떤 퍼즐을 그냥 즐길 수 있는데, 보상을 받은 이후에는, 보상 없이는 더이상 그 퍼즐에 관심을 보이지 않을 수 있음.

  • 내적 동기(intrinsic motivation): 어떤 행동 자체를 위해서 그 행동을 효과적으로 수행하고자 하는 동기
  • 외적 동기(extrinsix motivation): 주어지는 보상을 받거나 위협적인 처벌을 피하기 위해 행동을 수행하고자 하는 동기

수업을 열심히 듣는데, 성적을 잘 받기 위해서라면 외적 동기, 수업 자체를 듣는게 재미있다면 내적동기라고 할 수 있음. 두 동기를 모두 가질 수도 있음. 

관찰을 통한 학습

관찰 학습(observational learning): 타인을 관찰함으로써 학습함. 고등동물은 직접적인 경험 뿐 아니라 타인을 관찰하고 따라하면서 간접적인 학습이 가능함.

  • 반두라(bandura)의 보보인형 실험이 유명; 어떤 인형에게 성인이 폭력을 행하는 것을 본 아동은 이를 보지 않은 아동보다 그 인형을 나중에 봤을 때 공격적인 행동을 보여줌
  • 모델링(modeling): 특정 행동을 관찰하고 모방하는 과정
  • 타인을 관찰하고 결과를 살펴봄으로써 대리강화(vicarious reinforcement)/대리처벌(vicarious punishment)을 경험 가능

뇌 속의 거울과 모방

  • 거울 뉴런(mirror neuron): 타인의 특정 행동을 관찰하는 경우 본인이 그 행동을 수행했을 때처럼 반응하는 전두엽에 위치한 신경세포. 우리의 뇌가 타인의 행동에도 반응하는 것은 우리가 하는 모방, 공감을 가능하게 해주는 기반일 수 있음.

과찰학습의 적용

  • 친사회적 효과 (prosocial effects): 친사회적 행동의 모방으로 친사회적 효과를 이끌 수 있음. 도덕성에 대한 관찰학습은 이른 나이부터 시작되며, 행동과 말이 일관적일 때 모델링이 가장 효과적으로 이루어짐.
  • 반사회적 효과 (antisocial effects): 반사회적 효과도 가지고 있는데, 아동을 학대하는 부모의 자녀가 공격성을 보이는 경우 (유전이라고 비판하는 학자도 존재하지만 원숭이 연구를 통한 결과는 환경적 영향이 존재함을 보여주었음) 예로 있음. 이러한 관찰학습은 티비, 영화, 온라인 영상 여러 매체를 통해 일어날 있음
반응형

댓글