본문 바로가기
외국어교수 이론/외국어학습이론

파블로브, 왓슨과 스키너: 행동주의 이론

by 넥스컴 2020. 1. 9.

이반 파블로브, 존 왓슨, B.F. 스키너의 행동주의 언어학에 대한 동영상입니다. 파블로브의 고전적 조건화(Classical Conditioning)와 '조작적 조건형성의 아버지(Father of Operant Conditioning)로도 불리는 스키너의 스키너 박스를 이용한 조건형성(Operant Conditioning)을 발견한 이야기입니다. 동영상은 2부로 구성되어 있습니다.

1. Behaviorism: Pavlov, Watson, and Skinner

https://www.youtube.com/watch?v=xvVaTy8mQrg

Let's talk about behaviorism.  We begin in late 19th century Rssia, where scientist Ivan Pavlov lived with his dogs. Whenever Pavlov would would bring the dogs their the food they would salivate. One day he walked into the room without food and was shocked to see that the dogs were still droolng in anticipation. What Pavlov had accidentally discovered was the concept of "classical conditonal". He didn't have to do anything to make these dogs drool when they saw food. But Pavlov wondered if he did something to make the dogs think they were getting food. Could he make them drool whenever he wanted to? 

행동주의에 대해 말하겠습니다. 이야기는 19세기 말 러시아에서 시작합니다. 과학자 이반 파블로브가 자신의 개들과 살고 있었습니다. 그가 개들에게 음식을 줄 때마다 그들이 침을 흘리는 것을 보았습니다. 어느날 그가 음식이 없이 방으로 걸어갔는데 개들이 그대로 여전히 침을 흘리는 것을 보고 놀랐습니다. 파블로브가 우연히 발견한 것은 "고전적 조건화(classical conditonal)"의 개념이었습니다. 개들이 음식을 보았을 때 침을 흘리게 할 그 어떤 행동도 그는 하지 않았습니다. 그러나 파블로브는 궁금했습니다. 그의 개들이 음식을 받을 것이라고 생각하게 하면 어떨까? 개들이 음식을 원할 때마다 침을 흘리게 할 수 있을까? 

https://www.youtube.com/watch?v=xvVaTy8mQrg

And that's just what he did. Pavlov first ideneified this stimulus, the thing that caused the dog's response or behavior. In this case, the stimulus was the food because it caused the dogs to salivate. Then he paired the stimulus with a separate incident, the sound  of a bell. Every time Pavlov brought the dogs food, he rang a bell. Once the dog used to the sound of the bell at feeding time, Pavlov tried ringing the bell without giving the dogs need food and voila, the dogs started drolling anyway. Pavlov had successfully training the dogs to react to the new stimulus, the ringing of the bellㅡthe same way that they reacted to food.

그래서 그는 그렇게 했습니다. 파블로브는 처음에 이러한 자극과 개의 반응이나 행동을 유발하는 것을 동일시했습니다. 이 경우, 자극은 음식이었습니다. 왜냐하면 음식 때문에 개들이 침을 흘렸기 때문입니다. 그리고 그는 자극을 별도의 사건, 즉 벨의 소리와 연결시켰습니다. 파블로브가 개에게 음식을 줄 때마다, 그는 벨을 울렸습니다. 개가 음식 시간에 벨 소리에 익숙해지자 파블로브는 개들이 원하는 음식을 주지 않고 벨만 울렸습니다. 그런데 그래도 개들은 침을 흘리기 시작했습니다. 파블로브는 새로운 자극, 즉 벨 소리에 개들이 반응하도록--음식에 같은 식으로 그들이 반응하도록--성공적으로 교육을 시켰습니다. 

Classical conditioning is a learning process that inspired behaviorism by taking an uncoditioned stimulus, the food , that naturally caused the dogs to salivate. And combining with something entirely neutral the Bell, he was able to remove the first stimulus and make something that was formerly neutral elicits the conditioned response. But we'll talk about that later. 

"고전적 조건화(classical conditining)"은 무조건적 자극(unconditioned stimulus)인 음식을 취해서, 그 음식으로 자연스럽게 개들이 침을 흘리게 하는 방식으로 행동주의에 영향을 준 하나의 학습 과정입니다. 완전히 '중성 자극(nautral stimulus)'인 벨과 결합하여 파블로브는 첫 번째 자극을 제거하고 이전에 중성적이었던 어떤 것이 조건적 반응을 이끌어내도록 할 수 있었습니다. 그러나 이것은 이후에 이야기하도록 하겠습니다. 

John B. Watson, an American psychologist was intrigued by Pavlov studies, he, along with many other behaviorists in the 20th century, believed that psychology should be a science that is based on facts and observable measurements. He believed that human development could only be based on what one could see. Watson was famous for saying he could take any chil and turn him into anyone he wanted just changing the child's environment. A musician, a lawyer, a businesman, a doctor, even a thief or a begger. 

미국 심리학자인 John B. 왓슨은 파블로브의 연구에 강한 호기심을 받아 20세기에 다른 행동주의자들과 같이 심리학은 사실과 관찰 가능한 측정에 기반한 하나의 과학으로 믿었습니다. 그는 인간적인 발전은 사람들이 볼 수 있는 것이 기반하는 것에 불과하다고 믿었습니다. 왓슨은 어떤 아이라도 데리고 와서 그 아이의 환경만 바꾸어주면 그를 원하는 어떤 사람으로 만들 수 있다고 말한 것으로 유명합니다. 음악가, 변호사, 사업가, 의사, 심지어 도둑이나 거지도 만들 수 있다고 했습니다.

John Watson was most famous for his work with an 11th month old infant named little Albert. Although his methods would be highly unethical today, Watson made great strides in the field of behaviorism and classical conditioning. For example, Watson conditioned little Alberts' have a fear of rats using a very similar method to the one used by Pavlov. Every time little Albert was presented with a white rat, Watson made a loud noises and started the child and made him cry. After a while, all Watson had to do was bring the rat near little Albert and the baby would scream and cry. 

존 왓슨은 '꼬마 알버트'라고 불리는 11세의 유아와의 작업으로 매우 유명했습니다. 그의 방법이 오늘날 매우 비윤리적이긴 하지만 왓슨은 행동주의와 조건 형성의 분야에서 큰 진척을 보였습니다. 예로 왓슨은 꼬마 알버트의 쥐에 대한 공포를 파블로브가 사용한 것과 매우 비슷한 방식을 사용해서 조건형성을 했습니다. 꼬마 알버트에게 흰색 쥐를 보여줄 때마다 왓슨은 큰 소리를 내어서 아이를 울게 했습니다. 얼마 후 왓슨이 해야 하는 것은 쥐를 꼬마 알버트 근처로 데리고 오는 것뿐이었습니다. 그러면 아이는 소리 지르고 울기 시작했습니다. 

In this experiment, the loud noises were considered the uncondtioned stimulus. Little Abert didn't need to learn to be afraid of loud noices. Just like the dogs in Pavlov's experiment didn't need to be taught to drool at the sight of food. These things provoked certain responses naturally. 

이 실험에서, 큰 소리는 '무조건적 자극(unconditioned stimulus)'로 생각되었습니다. 꼬마 알버트는 큰 소리에 두려워하는 것을 배울 필요가 없었습니다. 파블로브 실험의 쥐들처럼 음식 앞에서 침을 흘리도록 교육을 받을 필요가 없다는 것과 같았습니다. 이러한 것들은 자연스럽게 어떠한 반응을 유발시킨 것입니다. 

Therefore little Albert crying serves as the unconditioned response. Crying or creaming is a baby's natural response to loud noices. Likewide drooling is a natural response for dogs that smell good food. Once little Albert began to associate the neutral rat with the negative loud noice, the rats became the conditioned stimulus. That is the previously neutral object that now elicits a reponse. In Pavlov's experiment, this is the bell that eventually made the dogs drool, and that makes little Albert's fear of the rats, the conditioned response. Even though he wasn't afraid of rate at first, he eventually learned by associating rats with loud noises that have said it. 

따라서 꼬마 알버트의 울음은 무조건적 자극이 됩니다. 울고 소리 지르는 것은 큰 소리에 대한 아이의 자연스러운 반응입니다. 마찬가지로 침을 흘리는 것은 좋은 음식 냄새를 맡는 개들에게는 자연스러운 반응입니다. 일단 꼬마 알버트가 '부정적인(negative)' 큰 소리와 '중성적인(nautral)' 쥐와 연상을 시작하면, 쥐들은 '무조건적 자극'이 되는 것입니다. 이것은 앞에서 '중성적인' 물체였고 지금은 반응을 이끌어내는 물체입니다. 파블로브의 실험에서 이것은 개들이 침을 흘리게 했던 벨이고, 그것이 꼬마 알버트가 쥐를 무서워하게 한 것이고 쥐는 알버트에게 '조건적' 반응이었습니다. 처음에 알버트는 쥐를 무서워하지 않았지만 그는 결국 큰 소리와 쥐를 연상시켜서 배우게 되었습니다.

B.F. Skinner, an American scientise born in 1904 took classical conditioning just one step further. Skinner is often called the "Father of Operant Conditioning" and he was most famous for conducting experiments with animal in his Skinner box. Like Watson, Skinner believed that psychology should be studied through a more objective lens and that required hard evidence observation and experimentation. 

1904년 태어난 미국 과학자 B.F. 스키너는 한 발자욱 더 다가서 '조건형성(classical conditioning)'을 택합니다. 스키너는  '조작적 조건형성의 아버지(Father of Operant Conditioning)'으로도 불리고 그의 스키너 박스 안에서 동물로 실험을 수행한 것으로 매우 유명했습니다. 왓슨과 같이 스키너는 심리학은 더 객관적인 렌즈를 통해 연구되어야 하며 이는 구체적 증거 관찰과 실험을 요구한다고 믿었습니다. 

"Operant Conditioning" is similar to classical conditioning, but by no means are the two the same. You see 'Operatant conditioning' involves  changing one's behavior by use of reinforcement or punishment which is given after a desired response. The behaviors that change in operating conditioning are voluntary. The behaviors operate on the environment produce an outcome. It focuses on motivation which is when someone or something has a strong reason to do something. Classical conditioning changes only the timing of the voluntary response. 

'조건형성'은 '고전적 조건화'와 비슷하지만 완전히 같은 것은 아닙니다. 아시듯이, '조건형성은 원하는 반응 후에 주어지는 강화나 처벌의 사용으로 객체 행동의 변화를 포함합니다. 조건형성 내에서 변하는 행동은 자발적입니다. 상황에서 동작하는 행동은 결과를 유발합니다. 그것은 어떤 존재나 어떤 사물이 무엇을 하도록 강한 이유를 가질 때 동기화에 초점을 맞춥니다.  '고전적 고건화'는 자발적인 반응의 타이밍만 변경합니다.


2. Behaviorism: Part 2

https://www.youtube.com/watch?v=eLaa8cgljKk

Let's talk about behaviorism Part 2. Skinner used animals predominantly rats and pigeons to conduct his experiments. And one of his first experiments he placed rats in a box with a feeding tube connected to a lever. Once the rats realized that, every time they pressed a lever, they got food.

그러면 행동주의 2부를 말씀드리겠습니다. 스키너는 대부분 쥐나 비둘기를 이용해서 그의 실험을 수행했습니다. 그의 처음 실험 중의 하나에서 그는 레버와 연결되어 있는 음식 공급 튜브가 있는 박스 안에 쥐를 넣었습니다. 쥐들이 그것을 알게 될 때마다 쥐들은 레버를 누르고 음식을 얻었습니다. 

Skinner notice that the rats spent a great deal of time pressing the lever, Skinner have actually trained the rats to press the lever by using positive reinforcement by giving the rats food every time they pressing the lever, the likelihood of the behavior increased. Aside from positive reinforcement, there are other ways to increase and decrease the likelihood of behaviors. 'Negative reinforcement' occurs when a negative consequence occurs in order to increase the likelihood of a bahavior. If Skinner wanted to use negative reinforcement to make the rats press the lever, he might send an electric shock through the box until the rat press the lever. 

스키너는 쥐들이 레버를 누르는데 상당히 오래 걸리는 것을 보고 그들이 레버를 누를 때마다 음식을 주어서 '긍정적 강화(positive reinforcement)'를 사용하여 레버를 누르도록 쥐들을 실제로 교육시켰습니다. 그 결과로 행동 확률이 증가되었습니다. 긍정적 강화와는 달리 행동 확률을 올리거나 내리는 다른 방법도 있었습니다. 행동 확률을 올리기 위해서 부정적 결과가 발생할 때 '부정적 강화'가 일어납니다. 스키너가 부정적 강화를 사용하여 쥐들이 레버를 누르도록 원하면 그들이 레버를 누를 때까지 박스를 통해 전기 쇼크를 보냈습니다. 

Although this would be an ethically questionable method of reinforcement, the rats behavior would increase due to its desire to make the negative consequence stop. On the other hand, punishment is used to decrease a behavior. When your mom makes you do shores when yo don't do your homework, this is called 'positive punishment'. Because the punishment is added or given to you, it is considered positive. If as a punishment for not finishing your homework, your mom takes away your phone that is considered a negative punishment. It's negative because something was taken away In order to decrease a behavior.

이러한 강화의 방법이 윤리적으로 문제가 될 수는 있었지만 이러한 부정적 결과를 멈추기를 쥐가 원했기 때문에 쥐의 행동은 증가되었습니다. 한편 처벌을 사용하여 행동을 줄일 수 있습니다. 여러분이 숙제를 하지 않았는데 여러분의 엄마가 집안일을 시킬 때 이것을 '긍정적 처벌'이라고 부릅니다. 왜냐하면 처벌이 추가되고 여러분에게 주어지기 때문에 이것을 긍정적이라고 합니다.  처벌이 자신의 숙제를 끝내지 않아서 여러분의 엄마가 여러분의 전화를 가지고 갈 경우 이것은 부정적 처벌로 생각됩니다. 행동을 줄이기 위해서 어떤 것을 빼았겼기 때문에 이것은 부정적입니다. 

Another hallmark of operant conditioning is shaping or successive approximation. When Skinner's rats were learning to press the lever, they do not immediately understand that the lever was the source of their food. Instead it's going to rewarded the rats with food every time they got close to the lever. Then every time the rats got closer to the lever and reached up and then eventually the rats pulled the lever themselves and were rewarded by the food coming down the tube. This process of shaping gruadually leads to the individual completing the desired behavior.

또 다른 조건형성의 특징은 조성(shaping) 또는 계속적 접근(sucessive approximation)입니다. 스키너의 쥐들이 레버를 부르는 것을 배우고 있었을 때, 그들은 레버가 음식의 원천임을 바로 이해하지 못합니다. 대신 그들이 레버에 가까워질 때마다 음식으로 보상을 받는 것입니다. 그러면 쥐들이 레버에 더 가까워지고, 레버에 접근하고, 결국 쥐들이 레버를 스스로 당기게 되면 관을 타고 내려오는 음식으로 보상을 받게 됩니다. 이러한 조성의 과정은 서서히 개별적으로 원하는 행동을 완수하도록 합니다. 

Skinner also pioneered the concept of schedules of reinforcement. When we talk about schedules of reinforcement, ratio means behavior as in how many times the individual must respond with the desired behabior in order to get a reinforcement. Interval means time as in how long the individual must read between reinforcements. Imagine a vending machine. Typically a vendine machine will give a reward every time the hungry customer elicits the desired behavior by putting money in the machine. This is called "continuous reinforcement". The customer only needs to respond once in order to be rewarded, and they're going to be rewarded every single time. 

스키너는 또한 강화 스케줄의 개념을 개척했습니다. 강화 스케줄에 대하여 말할 때, 비율이란 강화를 받기 위해서 원하는 행동으로 개별의 쥐가 몇 번이나 반응하는가를 의미합니다. 간격은 강화들 사이에서 개별의 쥐가 얼마나 긴 시간 동안 읽는가를 의미합니다. 자판기를 상상해 보세요. 일반적으로 자판기는 배고픈 고객이 기계에 돈을 투입하면서 원하는 행동을 끌어낼 때마다 보상을 합니다. 이것을 '지속적인 강화(continuous reinforcement)'라고 부릅니다. 고객은 보상받기 위해 한번만 반응하면 됩니다. 그러면 매번 마다 보상이 이루어집니다. 

What if we change the schedule of reinforcement? If the vendine machine had "fixed ratio reinforcement", it could give a cardy bar after a fixed number of payments such as every five quarters put in. Every five times the customer shows the desired behavior, he is reinforced. The machine may also operate on a "fixed interval schedule", meaning it will dispense a candy bar after a certain amount of time. Let's say every minute as long as a quarter has been put in. The customer is rewarded after one minute passes as long as he shows the desired behavior at least once during that time. 

그러면 강화 스케줄을 바꾸면 어떻게 될까요? 자판기가 "고정 비율 강화(fixed ratio reinforcement)"를 가지고 있다면 고정된 지불 번호 후에 예로 매번 25세트씩 넣은 후에 자판기는 하나의 캔디 바를 줄 것입니다. 5회마다 고객이 희망하는 행동을 보여줄 때마다 그는 강화되는 것입니다. 기계 또한 "고정 간격 계획(fixed interval schedule)"에 작동을 할 수 있게 됩니다. 그 의미는 일정 시간이 흐른 뒤에 자판기는 하나의 캔디 바를 내놓는다는 것입니다. 25센트(1쿼터)가 자판기에 들어가는 이상, 매 일분이라고 하면 되겠습니다. 그 시간 중에 적어도 일회 '희망하는 행동(desired behavior)을 보여주어야, 매 1분이 지난 후에 고객은 보상을 받게 됩니다.

If our friend comes upon a machine that uses "variable ratio reinforcement", there won't be a number of quarters that will consistently give him his snack. The first reinforcement may require three quarters but the next one might not come until he puts in eight. The number of responces required for a reward is unpredictable. 

우리의 친구가 "변동 비율 강화(variable ratio reinforcement)"를 이용하는 자판기에 올 경우, 그에게 그의 과자를 지속적으로 줄 25센트 동전의 수가 있을 수 없습니다. 첫 번째 강화가 3쿼터(25센트x3쿼터)를 요구할 수 있으나, 두 번째 강화는 8 쿼터를 넣을 때까지 내놓지 않을 것입니다. 보상을 위해 요구되는 반응의 수는 예측할 수 없습니다. 

The same goes for "variable interval reinforcement". When no matter how many quarters he puts in, the man will not get a candy until a certain amount of time passes. But this time, the time will be different. Every time he puts in a quarter, for example, the first time he puts in a quarter, it may take 20 seconds for the candy bar to be dispenses, but the second time it might take up to five hours. 

"변동 비율 강화"에도 같습니다. 얼마나 많은 쿼터 동전을 그가 언제 어떻게 넣는지에 관계없이 그는 일정한 시간이 지날 때까지 캔디를 얻을 수 없습니다. 그러나 이번에는 시간이 다릅니다. 예를 들어 그가 1쿼터를 넣을 때마다 처음에 그는 1 쿼터를 넣고 캔디 바가 나오는 데 20초가 걸릴 수 있습니다. 그러나 두 번째는 5시간까지 걸릴 수도 있습니다.

Examples of schedules of reinforcement can be seen all around you. If you have a quiz given on a "fixed interval schedule", it means you're guaranteed to have a quiz say 'every seven day'. Things like gambling and fishing are on "variable ratio schedules", which is why these activities are so popular, you never know which hand of cards for which cast-off will bring you a reward. If you independently sell your mixtape online and you get $50 one week, but a thousand dollars from the next week sales. That's an example of "variable interval reinforcement". 

"강화 일정"에 대한 예제들은 우리 주변에서 쉽게 볼 수 있습니다. "고정 간격 일정으로 주어진 퀴즈가 여러분께 있을 경우, 예로 1주일마다 퀴즈가 보장된다는 것을 의미합니다. 도박이나 낚시와 같은 것들이 "변동 비율 일정"으로 되는 것입니다. 이런 활동들이 그렇게 인기가 좋은 이유는 어떠한 카드 패 또는 어떤 종류의 물고기가 보상으로 여러분에게 갈지 모르기 때문입니다. 여러분이 온라인으로 개인적으로 믹스테이프를 판매해서 일주에 50불의 수입이 있을 경우, 다음 주의 매상이 일천불이 될 수도 있습니다. 이것이 "변동 비율 강화"의 예입니다.

Today we talked about three very influential men in the world of behaviors Ivan Pavlov, John B Watson and B.F. Skinner. They were all integral in inspiring and reiterating these basic concepts of behaviors. Using observation and empirical evidence, behaviors and see psychology of science. Behavior is the result of a stimulus. Something must motivate us to act the way we do. A person's environment determines the way they act and ultimately directs their development. Given this theory, humans and animals learn in very similar ways, and they can be controlled using the environment. A person's behavior can be altered by learning processes such as classical conditioning and operant conditioning. Remember that behaviorim is just a theory, but is a theory that shaped the way that psychologists view their field. 

오늘 우리는 행동주의 세계의 매우 영향력 있는 세 명, Ivan Pavlov, John B.Watson과 B.F. Skinner에 대하여 이야기했습니다. 행동주의의 기본적 개념에 있어서 그들 모두 없어서는 안될 사람들입니다. 관찰과 경험적 증거를 사용하여 행동주의자들은 심리학을 과학으로 보고 있습니다. 행동주의는 자극의 결과입니다. 무엇인가 우리에게 동기를 주어 우리가 행동하게 합니다. 한 사람의 환경이 그 자신이 행동하는 방법을 결정하고 결국 그들의 발전의 방향을 정합니다. 이 이론으로 인간들과 동물들은 매우 비슷한 방법으로 학습하고 그들은 환경을 사용하여 통제될 수 있습니다. 한 인간의 행동주의는 '고전적 조건화'와 조작적 조건형성'과 같은 학습 과정으로 변경될 수 있습니다. 행동주의는 하나의 이론에 불과하다는 것을 기억하시기 바랍니다. 그러나 심리학자들이 자신의 분야를 보는 방식으로 조성되는(shaped) 하나의 이론입니다. 


Ending title here...

Created using PowToon


녹취하고 번역하면서 이해가 어려운 부분도 있었습니다. 마지막 자판기 비유는 재미있네요. 다음편은 이론 마지막 편으로 종합으로 포스팅하려고 합니다. 

 

 

댓글