СОБАКА и ДЕЛЬФИН
(окончание первой лекции)
А как насчет собак?
Вы можете легко опробовать дрессировку дельфинов на вашей собаке,
используя положительное подкрепление, в течение одного десятиминутного
эксперимента. Некоторые собаки боятся свистка, поэтому удобнее использовать в
качестве условного подкрепления кликер, детскую игрушку, которая щелкает, когда
ее сжимают; такую игрушку можно купить в детских и галантерейных магазинах, а
также в некоторых магазинах импортных товаров . Вы можете использовать для
подачи сигналов крышку от бутылки, карманный стэплер или автоматическую ручку.
Приготовьте кликер и несколько кусочков лакомства. Лакомство
должно быть достаточно мелким, чтобы животное не объелось, получив 15 - 20
кусочков. Некоторые собаки работают за свой обычный корм, особенно незадолго до
кормления, но возможно вам придется использовать что-то более интересное для них;
демонстрируя этот метод с незнакомыми собаками, я обычно использую кусочки
курицы. Объясните собаке значение щелчков, 4 - 5 раз щелкнув кликером и тут же
дав лакомство, в разных частях комнаты или двора (чтобы у собаки не появилось
смешного представления, что система срабатывает только на одном месте).
Затем щелкните кликером и дайте лакомство через несколько секунд;
если вы видите, что собака волнуется и активно ищет лакомство, значит, сигнал
стал условным подкреплением. Теперь вы можете выработать навык - мы называем это
"формированием".
Довольно легко сформировать навык "Гоняйся за своим хвостом".
Конечно, существует столько же способов добиться этого, сколько существует
дрессировщиков, которые будут придумывать эти способы: вы можете поворачивать
собаку за ошейник; вы можете намазать кончик хвоста кусочком бекона, чтобы
собака крутилась, стремясь вылизать свой хвост. Вот способ формирования этого
действия "с нуля", без подсказок.
Прекратите щелкать и ждите. Возможно, ваша собака к этому
моменту будет заинтригована и взволнована; если вы не будете ничего делать,
собака, вероятно, будет вертеться, а может быть даже скулить и лаять. В тот
момент, когда собака случайно двинется или повернется вправо, щелкните. Дайте
лакомство.
Ждите снова. Игнорируйте все, что делает собака, кроме движения
вправо (не требуйте чудес; поворот головы или шаг в сторону правой передней
ногой - все, что вам нужно). Если вы "поймали" действие, то есть если вы успели
вовремя, после 3 - 4 подкреплений вы увидите, что ваша собака поворачивается
вправо дальше и чаще.
Теперь вы обнаружите, что вам уже не нужно поощрять один шаг
вправо, но вы можете поощрять повороты вправо, которые состоят из нескольких
шагов, может быть на четверть круга; а переход от поворота на четверть круга в
повороту на полный круг может произойти очень быстро.
Теперь как раз пора закончить первый урок; остановиться, пока вы
преуспеваете - золотое правило. Уберите кликер, хорошенько приласкайте и
похвалите собаку, и попробуйте снова на следующий день, начиная с одного шага,
затем переходите к повороту на четверть круга, затем больше; вы будете
продвигаться быстрее, чем в первый раз.
После того, как вы выработаете поворот на один круг, следующим
шагом будет выработка поворота на два круга, а затем последует очень важный шаг
- переход к вариабельному подкреплению, то есть вознаграждению собаки иногда за
половину круга, иногда за два круга, или за один, или за три полных круга, или
за один с четвертью; это заставляет собаку все время стараться угадать. Щелчок
должен иногда следовать после одного поворота, а иногда - после двух; собака не
будет знать, когда она услышит щелчок, поэтому она будет крутиться, быстрее и
быстрее; таким образом вы начнете вырабатывать забавную погоню за собственным
хвостом.
Конечно, это глупая шутка, не очень приличествующая серьезной
собаке; есть другие навыки, которые вы можете использовать для тренировки,
например, касание какого-либо предмета носом (дрессировщики морских львов учат
своих животных тыкаться носом в сжатый кулак; затем, держа кулак на земле, в
воздухе или над стойкой, они могут заставить морского льва двигаться туда, куда
они хотят, не применяя силу). Цель эксперимента - не научить собаку выполнять
трюк, а показать вам, как пользоваться условным подкреплением при формировании
навыка, а также продемонстрировать эффективность данного вида подкрепления.
Почему нужен кликер? Почему нельзя использовать в качестве
условного подкрепления только голос и слова "Хороший мальчик"? Основная причина
- то, что вы не можете произнести слово, даже "Хороший мальчик" с точностью до
долей секунды, но можете легко достичь столь высокой точности с помощью кликера.
Немного потренировавшись, вы можете подкрепить с помощью кликера малейшие
движения например, шаг одной лапой вправо, в тот момент, когда они происходят;
поощрение голосом неизбежно будет довольно расплывчатым, так как оно занимает
больше времени.
Вторая трудность при использовании слова - то, что мы разговариваем в
присутствии собак и даже с ними, не подкрепляя свои слова. Собаке будет сложно
выделить значимые слова из потока звуков, которые мы издаем; в то же время,
кликер не похож на другие звуки в комнате, и его значение будет абсолютно ясно.
На самом деле, вы увидите разницу в том, как собака, у которой установлено
условное подкрепление, реагирует на кликер (абсолютное внимание, оживление,
волнение) по сравнению с тем, как она реагирует на "Хорошая собака!" (Что? А
Улыбнулись, вильнули хвостом.)
Использование условного
подкрепления в реальных условиях
Естественно, я слышала, как многие дрессировщики собак говорят,
что кликер годится только для обучения собаки трюкам и больше ни для чего - так,
его не удастся использовать в дрессировке по курсу послушания. Конечно, нет, да
это и не нужно; кликер ценен при выработке нового навыка или при
совершенствовании отдельных аспектов того или иного навыка; нет необходимости в
выделении навыка, которому собака уже обучена. Но даже при работе с опытной
собакой - чемпионом по рабочим качествам, условное подкрепление может быть
полезным дрессировочным инструментом. Один из участников соревнований рассказал
мне, что он научил свою суку добермана понимать щелчки, а затем использовал их
для того, чтобы научить ее смотреть ему в лицо, а не в сторону, во время работы.
"Было похоже, что она на самом деле благодарна за информацию: для нее исчезла
неясность," - сказал он. Конечно, как только собака поняла, что от нее хотят, в
ринге она делала все правильно без щелчков.
Тем не менее, не следует думать, что люди никогда не используют
условное подкрепление в ринге: все, что нужно дрессировщику - это установить
сигнал, о котором знает собака, но которого не замечают другие. Я знаю одного
увлеченного дрессировщика по послушанию, который использует едва слышное
шмыганье носом в качестве условного подкрепления. Я видела спортсмена, который
говорил своей собаке "Отлично!" (что проявлялось в счастливом выражении на морде
собаки), всего лишь прикасаясь одним пальцем к ее голове.
Одна моя знакомая спортсменка научила свою собаку, Рекса, что
лакомство называется "Билли". Теперь, участвуя в соревнованиях по послушанию,
она может подкрепить особенно хорошую работу - например, хороший подзыв - тем,
что кажется командой: "Билли, рядом!". Никто не интересуется, почему в ринге она
называет собаку другой кличкой.
Когда действие выучено, использование условного подкрепления позволяет вам не
только отсрочить получение лакомства без потерь в качестве работы, но и в целом
давать меньше лакомства; вам не придется волноваться, что собака объестся до
того, как работа будет закончена. Один пример: на выставках собак я часто
замечаю, как хэндлеры постоянно приманивают собаку или кормят ее, чтобы получить
красивую стойку или настороженный взгляд. Каждый раз, когда я вижу, как собака
постоянно получает лакомство, я осознаю, что эти люди не понимают условного
подкрепления! Насколько более эффективно было бы "сформировать" стойку,
отработать команду, а затем подкреплять действия собаки щелчком, когда она
встает в нужную стойку и удерживает ее в течение значительного времени - а
лакомство давать позже, вне ринга или когда эксперт двинется дальше.
Положительной чертой условного подкрепления является то, что оно
работает - передает информацию и влияет на поведение животного - в любых
ситуациях, в которых реальное подкрепление либо нежелательно, либо невозможно.
Подумайте, например, как полезно было бы простое условное подкрепление при
выборке по запаху, работе по следу, выработке выдержки в посадке и укладке, в
том числе и в отсутствие владельца, обнаружении и вспугивании птиц, а также при
любой другой работе, которая требует, чтобы собака находилась на расстоянии от
вас.
Контроль неправильного
поведения с помощью положительного подкрепления
Утверждение о том, что плохое поведение можно контролировать с
помощью положительного подкрепления, а не "коррекции", может показаться
неразумным, но у дрессировщиков дельфинов есть много способов такого контроля.
Вот несколько примеров:
1. Выработка условного отрицательного подкрепления
Это не обязательно должен быть сигнал, означающий "Сейчас я тебя побью" (хотя
его тоже можно установить), но сигнал, означающий "Нет, я не буду тебя поощрять".
Он сообщает животному, что какое-то действие, которое оно производит, не даст
результата; животное быстро учится, что когда бы оно ни получило этот "красный
свет" или сигнал "неправильно", оно должно изменить то, что делает. Вы можете
использовать этот сигнал, например, чтобы приучить животное не прыгать на вас
при приветствии, а оставаться всеми четырьмя лапами на полу, чтобы получить
подкрепление - ласку.
2. Использование положительного подкрепления для выработки
несовместимого поведения
Во время наших шоу в Парке "Морская Жизнь" одно из животных все время нападало
на девушку-пловчиху, участвовавшую в шоу. Вместо того, чтобы дать пловчихе ружье
(или другое подобное орудие наказания), мы приучили дельфина нажимать на
подводный рычаг за рыбу и свисток, и заставляли животное выполнять это действие,
когда пловчиха была в воде. Дельфин не мог одновременно нажимать на рычаг и
докучать пловчихе; эти два действия были несовместимы (и конечно нажатие рычага
было более подкрепляющим, так как нападения на пловчиху прекратились). Вы
используете этот прием, приучая собак лежать в дверях гостиной, пока вы
обедаете, чтобы они не могли попрошайничать.
3. Тайм-аут
Иногда дельфин делает что-то действительно неприемлемое, например, проявляет
агрессию (например, целится головой или зубами в руку дрессировщика). Как только
это случится, дрессировщик поворачивается спиной, хватает все дрессировочные
приспособления и ведро с рыбой и уходит на одну целую минуту. Это конец веселья.
Дельфин в этом случае склонен высовывать свою голову из воды, выглядя
встревоженным: "Эй, что я такого сделал?" После нескольких повторений он
научится следить за своими манерами. В дрессировке собак аналогичным наказанием
будет посадить собаку на короткое время в ее клетку.
Дрессировщики в океанариумах успешно используют тайм-ауты, чтобы
прекратить агрессию по отношению к пловцам, даже при работе с очень
доминирующими животными, такими как самцы косаток, а также для контроля других
проявлений непослушания; тем не менее, этот прием очень огорчителен для животных
и должен использоваться как можно меньше.
Умственные отношения
Использование подкрепления требует большой работы дрессировщика,
так как оно заставляет нас думать. Нет, зачем эта морока! Намного проще
следовать чьим-то правилам: если собака устроила беспорядок, ткните ее носом;
если она не идет рядом, дерните цепочку. Тем не менее, научившись задумываться о
том, что вы поощряете, вы станете более успешным дрессировщиком, А концентрация,
которая вам потребуется при совершенствовании своевременности ваших подкреплений,
сделает дрессировку захватывающей, а не скучной.
С точки зрения животного, этот вид дрессировки - не способ
уберечься от беды, делая то, что от него требуют, что воспринимается как
неприятная работа и ничего больше. Наоборот, этот вид дрессировки дает животному
возможность победить, снова и снова, а также возможность контролировать как
минимум часть своего мира. Например, с точки зрения дельфина, с того момента,
как он понял значение свистка, дрессировка - это не обмен командами и
послушанием, а игра-"угадайка", в которой дельфин старается найти различные
способы заставить дрессировщика дунуть в свисток. Это игра со строгими правилами,
но на равных. Ничего удивительного, что дельфинам нравятся их послушные
дрессировщики!
Эффект от использования условного положительного подкрепления на
самом деле значительно более сильный, чем можно достичь, давая лакомство просто
так. Если вы прекратите полагаться на контроль неправильного поведения и начнете
формировать хорошее с применением ясных условных сигналов в качестве
подкрепления, ваша собака будет по-новому уважать вас; она наконец поймет, что
вы от нее хотите.
Карен Прайор