поддержка
проекта:
разместите на своей странице нашу кнопку!И мы
разместим на нашей странице Вашу кнопку или ссылку. Заявку прислать на
e-mail
код нашей кнопки:
Обучение
Это слово вне контекста информатики вызывает в нашем представлении
что-то вроде школьных занятий, курсов вождения автомобиля или служебного
собаководства. Несмотря на ощутимые различия между этими занятиями, их
объединяет нечто, позволяющее называть их одним словом. Способность к
обучению - одна из основных черт разумного, интеллектуального поведения.
Не имея такой способности и не обладая абсолютным, "на все случаи жизни"
знанием, "жестко запрограммированный" субъект не может успешно
действовать в сложных ситуациях, полных неопределенности.
Рассмотрим один из взятых нами примеров (скажем, связанный с
собаководством) и попытаемся выделить в нем общие черты процесса
обучения. Во время обучения хозяин (инструктор) произносит команду,
стремясь вызвать определенные действия собаки. Собака изначально хочет
добиться лишь поощрения (или избежать наказания) за свои действия.
Совершая действия, которые от нее требуют, она добивается поощрения.
После неверных действий она его не получает. Чтобы достичь желаемого,
собака должна отбирать внешнюю информацию, существенную для дальнейших
действий.
В чем она заключается? Команду могут произносить разные люди: хозяин,
хозяйка, члены их семьи, инструктор и т. д., которым собака подчиняется.
Они могут быть по-разному одеты, произносить команду разными голосами,
проводить обучение в разных местах, в разное время дня и года. Можно
предположить, что, запоминая разные ситуации (нас в данном случае не
интересуют реальные физиологические механизмы этого процесса) , собака
усваивает несущественность этих обстоятельств и существенность
следующего: "Если тот, кого ты обычно слушаешься, произнес звуки,
похожие на эти, делай то-то и тогда тебя похвалят, иначе будет плохо".
Пытаясь обобщить приведенный пример, можно сказать, что обучение
заключается в выборе субъектом обучения на основе обучающей информации
правила поведения, которое гарантирует субъекту в дальнейшем успешные
действия.
Такое толкование, конечно, трудно назвать определением - слишком много
слов здесь можно понимать по-разному (субъект обучения, обучающая
информация, успех действия, гарантировано). Значительную часть случаев
обучения можно описать как обучение распознаванию. Очертим сначала
значения, которые могут принимать указанные слова в контексте
распознавания, а затем опишем некоторые другие возможности.
Субъект обучения - тот, кто (или то, что) обучается. В информатике это
программа или вычислительное устройство - компьютер, нейронная сеть и т.
п. Поэтому обучение в информатике часто называют машинным или
автоматическим, отделяя его тем самым от обучения людей.
Действие - выбор одной из предложенных альтернатив. Для собаки они
состоят из множества действий, связанных с выполнением или невыполнением
команды, для программы или вычислительного устройства это отнесение
ситуаций по их описаниям к одному из нескольких возможных классов
ситуаций. Обычно этих классов два (случаи с большим количеством классов
можно свести к случаю с двумя классами). Классы ситуаций часто называют
понятиями, а сам процесс обучения - процессом обучения понятиям. В
случае с обучением собаки понятием будут "ситуации, в которых
реализуются условия выполнения команды".
Обучающая информация - описание конкретных ситуаций вместе с указанием,
как следует действовать в этих ситуациях (т. е. какой класс выбирать).
Если есть два класса объектов, ситуации, относящиеся к одному классу
(который представляет больший интерес), называют положительными
примерами, а другие - отрицательными примерами. Множество всех примеров
обычно называют обучающей выборкой. Примеры из обучающей выборки
представляются субъекту в виде сообщений на определенном языке.
Решающее правило - правило, позволяющее по описанию ситуации отнести ее
к определенному классу. Решающие правила также выражаются на некотором
языке (быть может, отличном от языка описания примеров).
Успех действия - отнесение ситуации к классу, к которому она в
реальности принадлежит.
Гарантированный результат - это результат, которому можно доверять
(например, полученный с достаточно высокой вероятностью, если мы
используем вероятностную модель).
Алгоритм обучения - однозначно понимаемая инструкция для построения
подходящего решающего правила по обучающей информации. Некоторые
обучающиеся системы включают в алгоритм обучения элемент случайности,
тем самым разрушая детерминированность на уровне выбора правила.
Приведем примеры, показывающие различные способы уточнения этих понятий.
Предположим, например, что нам известно множество данных о людях, легкие
которых исследовались в клинике. Предположим, что было выделено две
группы: люди, страдающие раком легких, и здоровые люди.
Предположим также, что о каждом пациенте известно, сколько сигарет в
день он выкуривает и каков уровень загрязнения воздуха в месте его
постоянного проживания (в каких-нибудь общепринятых единицах).
Будем представлять каждого пациента парой чисел: число сигарет, уровень
загрязненности (первое число - это количество сигарет, выкуренных за
день, а второе - уровень загрязненности воздуха в выбранных нами
единицах измерения). Выбрав систему координат, в которой по оси абсцисс
будем откладывать количество сигарет, а по оси ординат - загрязненность
воздуха, построим множество точек на плоскости. Точки, соответствующие
здоровым пациентам (будем называть их положительными примерами),
обозначим белым цветом, а точки, соответствующие больным (отрицательные
примеры), - черным цветом.
Вычислительная программа обучается диагнозу "рак легких" по обучающим
данным указанного вида, если она может сформировать решающее правило, по
которому она в дальнейшем по координатам точек сможет в большинстве
случаев правильно определять, к какому классу они должны относиться -
классу белых или классу черных точек. Правило такого рода можно задавать
по-разному. Им может служить линия, разделяющая множество белых и черных
точек с минимальным количеством ошибок. Если программа определила такую
линию, например прямую, то решающее правило будет иметь следующий вид:
те точки, которые лежат по одну сторону от прямой (в данном случае слева),
соответствуют здоровым людям, а те, которые лежат по другую сторону от
прямой, соответствуют больным.
В данном случае ситуация соответствует некоторому пациенту, описание
ситуации есть набор сведений о его здоровье (т. е. болен он раком легких
или нет), о том, сколько сигарет в день он выкуривает, и о том, каков
уровень загрязненности воздуха. Действием будет отнесение программой
новых ситуаций к классу больных или здоровых, а успешным действием будет
правильная классификация. Решающим правилом будет прямая, разбивающая
множество всех точек, а качество обучения, т. е. гарантию успеха, можно,
например, оценивать долей точек, которые лежат по противоположную
сторону от большинства точек того же цвета относительно выбранной прямой.
В примере на рис. 1 качество обучения оценивается как 1/4, что вряд ли
может считаться хорошим результатом. В таком случае исследователь должен
как-то изменить модель. Например, в случае с пациентами добавить еще
какой-нибудь параметр в обучающую информацию, скажем, качество
потребляемой пищи (тогда ситуация будет представима в трехмерном
пространстве).