Điều hòa hoạt động: Định nghĩa, đặc điểm và ví dụ

Điều hòa hoạt động hoặc Điều hòa công cụ là một loại hình học tập trong đó hành vi được kiểm soát với hậu quả.

Nó dựa trên ý tưởng rằng việc củng cố các hành vi có xu hướng xuất hiện nhiều lần hơn, trong khi các hành vi bị trừng phạt bị dập tắt.

Sự khác biệt giữa điều hòa hoạt động và điều hòa cổ điển là gì? Trong điều kiện hoạt động, một phản ứng tự nguyện được theo sau bởi một chất tăng cường. Theo cách này, phản ứng tự nguyện (ví dụ, học tập cho một kỳ thi) có nhiều khả năng xảy ra trong tương lai. Ngược lại, trong điều kiện cổ điển, một kích thích sẽ tự động kích hoạt một phản ứng không tự nguyện.

Điều hòa hoạt động có thể được mô tả như là một quá trình cố gắng sửa đổi hành vi thông qua việc sử dụng củng cố tích cực và tiêu cực. Thông qua điều hòa hoạt động, một cá nhân tạo ra mối liên hệ giữa một hành vi cụ thể và hậu quả. Ví dụ:

Cha mẹ thưởng điểm tốt cho một đứa trẻ với kẹo hoặc một số giải thưởng khác.
Một giáo viên thưởng cho những học sinh bình tĩnh và có học thức. Học sinh nhận ra rằng bằng cách cư xử như thế này, họ nhận được nhiều điểm hơn.
Một thức ăn được trao cho động vật mỗi lần nhấn đòn bẩy.

BF Skinner (1938) đặt ra thuật ngữ điều hòa hoạt động. Skinner đã xác định ba loại phản hồi hoặc toán hạng có thể theo hành vi:

Toán tử trung tính : phản hồi từ môi trường không tăng hoặc giảm xác suất lặp lại hành vi.
Chất tái tạo : phản ứng từ môi trường làm tăng xác suất lặp lại hành vi. Chất tái tạo có thể là tích cực hoặc tiêu cực.
Trừng phạt : phản ứng từ môi trường làm giảm khả năng lặp lại hành vi. Trừng phạt làm suy yếu hành vi.

Tiền đề của điều hòa hoạt động

Thorndike là người đầu tiên nhận ra rằng điều hòa này không chỉ bao gồm câu trả lời và chất tăng cường. Câu trả lời được đưa ra với sự có mặt của một số kích thích nhất định, xem xét ba sự kiện: kích thích, phản ứng và hậu quả của phản ứng hoặc chất tăng cường.

Cấu trúc này tạo điều kiện cho sự phát triển của các mối liên kết khác nhau, chẳng hạn như sự liên kết giữa kích thích và phản ứng, là chìa khóa của Thorndike để xây dựng luật hiệu lực. Thông qua đó, ông khẳng định rằng các câu trả lời được theo sau bằng cách củng cố hậu quả sẽ có nhiều khả năng xảy ra khi kích thích xuất hiện trở lại.

Ngược lại, những phản ứng đi theo hậu quả tiêu cực sẽ có xác suất xảy ra thấp hơn khi kích thích xuất hiện trở lại. Quy luật hiệu lực là tiền đề của điều hòa phẫu thuật hoặc điều hòa dụng cụ, như được đặt tên bởi Thorndike.

Nhưng đối với Skinner, một nhà tâm lý học về hành vi, điều hòa là việc tăng cường các hành vi theo những hậu quả mà trước đây sẽ có được.

Trong dòng này, có hai hình thức điều hòa:

Cổ điển hay Pavlovian: nó dựa trên sự liên kết của các kích thích vô điều kiện và có điều kiện, là các phản ứng được kiểm soát bởi các kích thích tiền sử.
Điều hòa hoạt động: các kích thích hậu quả hoặc củng cố gây ra một hành vi nhất định được ban hành. Skinner giải thích rằng nếu hành vi được theo sau bởi một chất tăng cường tích cực, nó sẽ làm tăng khả năng hành vi đó được ban hành trong tương lai. Ngược lại, nếu một phản hồi không được theo sau bởi một chất tăng cường hoặc chất tăng cường đó là âm, thì xác suất đưa ra hành vi nói trong tương lai sẽ thấp hơn.

Khái niệm cơ bản của điều hòa hoạt động

Gia cố

Nó chịu trách nhiệm cho việc đưa ra câu trả lời, nghĩa là xác suất chúng sẽ xảy ra, cho dù nó lớn hơn hay ít hơn trong tương lai. Nó là một kích thích củng cố và nhất quán, vì nó xảy ra một khi phản ứng đã xảy ra.

Không thể biết liệu một chất tăng cường nhất định có ảnh hưởng đến hành vi hay không cho đến khi nó được trình bày một cách ngẫu nhiên với một phản ứng và được xác minh rằng hành vi đó thay đổi do hậu quả của chất tăng cường.

Có hai loại cốt thép: tích cực và tiêu cực. Cả hai đều có cùng mục đích là tăng xác suất phản hồi sẽ được đưa ra trong các tình huống trong tương lai. Ngoài ra, đối với chất tăng cường Skinner được xác định bởi các hành vi có thể quan sát và đo lường được.

Tăng cường tích cực

Củng cố tích cực củng cố một hành vi bằng cách cung cấp một hệ quả mà một cá nhân tìm thấy bổ ích.

Củng cố tiêu cực

Việc loại bỏ một chất tăng cường khó chịu cũng có thể củng cố một hành vi. Điều này được gọi là củng cố tiêu cực bởi vì nó là loại bỏ một kích thích bất lợi là "bổ ích" cho động vật hoặc người. Củng cố tiêu cực củng cố hành vi bởi vì nó dừng lại hoặc loại bỏ một trải nghiệm khó chịu.

Cốt thép chính

Nó sẽ là tất cả những củng cố cơ bản, những người không cần bất kỳ lịch sử điều hòa trước để hoạt động như vậy. Một số ví dụ sẽ là nước, thực phẩm và tình dục.

Tăng cường thứ cấp

Các chất tăng cường thứ cấp nếu chúng dựa trên lịch sử điều hòa trước đó nhờ vào sự liên kết với các kích thích vô điều kiện. Một số ví dụ sẽ là tiền và bằng cấp.

Dự phòng ba điều khoản

Nó là mô hình cơ bản của điều hòa hoạt động và bao gồm ba thành phần: kích thích phân biệt, phản ứng và kích thích củng cố.

Một kích thích phân biệt sẽ là một trong đó sẽ chỉ ra cho đối tượng rằng chất tăng cường có sẵn, chỉ ra rằng nếu anh ta thực hiện một hành vi nhất định, anh ta có thể có được chất tăng cường nói trên. Ngược lại, chúng ta có các kích thích delta hoặc kích thích chỉ ra rằng hành vi sẽ không dẫn đến việc có được bất kỳ loại chất tăng cường nào.

Câu trả lời sẽ là hành vi mà chủ thể sẽ thực hiện, việc thực hiện của họ sẽ dẫn đến hay không để có được kích thích củng cố.

Một kích thích củng cố, như đã đề cập ở trên, chịu trách nhiệm cho sự phát tán của hành vi vì nhờ sự xuất hiện của nó, xác suất đưa ra phản hồi sẽ tăng hoặc giảm trong tương lai.

Các khái niệm cần biết về điều hòa hoạt động

Trừng phạt

Hình phạt cũng được đo lường bằng tác động của nó đối với hành vi của chủ thể. Mặt khác, không giống như củng cố, những gì được dự định là giảm hoặc triệt tiêu một hành vi nhất định.

Một hình phạt làm giảm khả năng ban hành một hành vi trong các tình huống sau này. Tuy nhiên, nó không loại bỏ phản ứng vì nếu mối đe dọa trừng phạt giảm, hành vi có thể xuất hiện trở lại.

Trong hình phạt cũng có hai loại hoặc thủ tục khác nhau, hình phạt tích cực và hình phạt tiêu cực.

Hình phạt tích cực

Điều này liên quan đến việc trình bày một kích thích gây khó chịu sau khi thực hiện một hành vi nhất định. Nó được đưa ra một cách ngẫu nhiên cho các phản ứng được đưa ra bởi chủ đề.

Hình phạt tiêu cực

Nó bao gồm việc loại bỏ một kích thích do hậu quả của một hành vi nhất định, nghĩa là, nó bao gồm việc rút một kích thích tích cực sau khi thực hiện một hành vi nhất định.

Tuyệt chủng

Trong sự tuyệt chủng, một phản ứng bị dừng lại vì chất tăng cường không còn xuất hiện. Quá trình này dựa trên việc không cung cấp chất tăng cường tương ứng dự kiến sẽ đạt được và điều đó đã khiến hành vi đó được duy trì theo thời gian.

Khi một phản ứng bị dập tắt, kích thích phân biệt đối xử sẽ trở thành kích thích tuyệt chủng. Quá trình này không nên bị nhầm lẫn với việc quên, được đưa ra khi lực của hành vi giảm khi nó không được ban hành trong một khoảng thời gian.

Tổng quát hóa

Để đáp ứng với một tình huống hoặc kích thích cụ thể, một phản ứng được điều hòa, có thể xuất hiện trước các kích thích khác hoặc các tình huống tương tự.

Phân biệt đối xử

Quá trình này ngược lại với khái quát hóa, trong đó nó đáp ứng khác nhau tùy thuộc vào kích thích và bối cảnh.

Chương trình tăng cường

Skinner cũng thiết lập một số chương trình gia cố, bao gồm các chương trình gia cố liên tục và các chương trình gia cố không liên tục.

Chương trình tăng cường liên tục

Chúng dựa trên sự củng cố liên tục của phản ứng mỗi khi nó được trình bày, nghĩa là mỗi lần đối tượng thực hiện hành vi mong muốn, anh ta hoặc cô ta sẽ có được một kích thích củng cố hoặc kích thích tích cực.

Chương trình tăng cường không liên tục

Ngược lại, ở đây, đối tượng không phải lúc nào cũng có được chất tăng cường khi thực hiện hành vi mong muốn. Chúng được xác định dựa trên số lượng câu trả lời được đưa ra hoặc khoảng thời gian giữa các câu trả lời, làm phát sinh các thủ tục khác nhau.

Chương trình tỷ lệ cố định

Trong các chương trình này, bộ gia cố được cung cấp khi đối tượng tạo ra các phản ứng cố định và liên tục. Ví dụ, trong một chương trình tỷ lệ 10, người đó có được chất tăng cường sau khi thực hiện mười phản hồi khi kích thích được đưa ra.

Các chương trình của lý do biến

Điều này được xây dựng như trước đây, nhưng trong trường hợp này, số lượng phản hồi mà đối tượng phải đưa ra để có được chất tăng cường là khác nhau.

Chất tăng cường sẽ tiếp tục phụ thuộc vào số lượng phản hồi phát ra từ chủ thể nhưng với một lý do khác nhau, nhờ đó, đối tượng được ngăn chặn dự đoán khi nào sẽ có được chất tăng cường.

Các chương trình cố định

Trong các chương trình cách quãng, việc có được chất tăng cường không phụ thuộc vào số lượng phản hồi mà đối tượng đưa ra, mà được xác định bởi thời gian trôi qua. Do đó, phản ứng đầu tiên được tạo ra sau khi đã qua một khoảng thời gian nhất định được củng cố.

Trong các chương trình khoảng cố định, thời gian giữa cốt thép và cốt thép luôn giống nhau.

Chương trình khoảng biến

Trong các chương trình này, chất tăng cường có được sau một thời gian, mặc dù thời gian là khác nhau đối với mỗi chất gia cố nhận được.

Thay đổi hành vi

Xấp xỉ liên tiếp hoặc định hình

Việc tạo khuôn bao gồm sự thay đổi hành vi thông qua việc tạo khuôn các hành vi hoặc sự củng cố khác biệt của các xấp xỉ liên tiếp.

Một loạt các bước được theo dõi để định hình một hành vi cụ thể. Ở nơi đầu tiên, hành vi ban đầu được dự định sẽ được xác định để xác định hành vi nào bạn muốn tiếp cận.

Sau đó, các cốt thép có thể sẽ được sử dụng được phân định và quá trình được phân tách theo các bước hoặc các giai đoạn để đi đến hành vi cuối cùng, củng cố từng bước hoặc phương pháp tiếp theo cho đến khi đến bước cuối cùng.

Với thủ tục năng động này, cả hành vi và hậu quả của chúng đều được chuyển đổi. Theo nghĩa này, các cách tiếp cận liên tiếp đối với một hành vi khách quan được củng cố.

Tuy nhiên, để được thực hiện, cần phải bắt đầu từ một hành vi trước đó mà đối tượng đã thực hiện, để dần dần củng cố hành vi của họ cho đến khi đạt được mục tiêu.

Chuỗi

Với nó, một hành vi mới được hình thành từ sự phân tách thành các bước hoặc trình tự đơn giản hơn, củng cố từng phản hồi được đưa ra trong mỗi bước để dẫn đến việc thiết lập một phản ứng phức tạp hơn trong tiết mục hành vi của chủ thể.

Các chuỗi phản hồi dài có thể được hình thành bằng cách sử dụng các chất tăng cường có điều kiện, thông qua một đơn vị chức năng có cơ sở dẫn đến việc mua lại và định nghĩa một kỹ năng cụ thể.