поддержка
проекта:
разместите на своей странице нашу кнопку!И мы
разместим на нашей странице Вашу кнопку или ссылку. Заявку прислать на
e-mail
код нашей кнопки:
Обучение на примерах
Процесс обучения распознаванию объектов и явлений окружающего мира
лежит в основе всей интеллектуальной деятельности человека. Прежде чем
начать действовать, надо научиться узнавать и классифицировать ситуации
во внешнем мире. Поэтому воспроизведение процедур обучения распознаванию
в искусственных системах так важно для систем искусственного интеллекта
и робототехники. Процедуры обучения распознаванию составляют важную
часть научного направления, получившего название распознавание образов.
В основе всех известных процедур обучения распознаванию лежит общая
модель. Предполагается, что имеется совокупность объектов или явлений,
для которых уже известна их принадлежность к некоторым заранее известным
классам. Для примера рассмотрим фигурки, изображенные на рисунке.
Известно, что эти фигурки делятся на два класса. Номер класса, к
которому данная фигурка принадлежит, написан над каждой из них. Отметим,
что каждая фигурка содержит шесть элементов: голову (Г), туловище (Т),
левую и правую руки (Р), левую и правую ноги (Я). Но поскольку "руки" и
"ноги" у каждой из фигурок однотипны, то можно считать, что фигурки
отличаются друг от друга четырьмя элементами. Эти элементы играют роль
классифицирующих признаков. Каждый из них может принимать одно из двух
значений, условно называемых А и В. Левая фигурка в ряду состоит из
элементов, каждый из которых принимает значение А, а правая фигурка в
ряду состоит из элементов, каждый из которых принимает значение В. При
такой договоренности "формулу" для второй слева фигурки можно записать в
виде: (Гв, ТА, РА, НА), ибо только голова отличает эту фигурку от той,
что нарисована слева от нее.
Исходная последовательность объектов с указанными
номерами классов, к которым они принадлежат, называется обучающей
последовательностью. С ее помощью формируется гипотеза о том, как
устроено решающее правило, которое надо найти в процессе обучения
распознаванию.
В нашем примере обучающая последовательность состоит из восьми
объектов-фигурок.
Чтобы выдвигать гипотезы о решающем правиле, нужны какие-то
основополагающие принципы. Эти принципы могут быть различными, что
приводит к разным реализациям процедуры поиска решающего правила.
Наиболее естественными принципами (во всяком случае для человека)
представляются принципы единства и различения по значениям признаков.
Естественно считать, что в класс объединяются объекты, которые чем-то
сходны между собой, а классы отделяются друг от друга различием значений
некоторых признаков.
Если мы примем эти принципы для нашего примера, то классы 1 и 2 должны
объединять фигурки, в чем-то сходные между собой, а между фигурками из
классов 1 и 2 должно существовать определенное различие.
В процессе обучения, последовательно воспринимая и сравнивая между собой
объекты, необходимо искать сходство в объектах, принадлежащих одному
классу, и находить отличие в тех парах, которые принадлежат к различным
классам.
Начнем этот процесс, сравнивая фигурки слева направо. Первые две фигурки
принадлежат к одному классу. В них совпадают все элементы, кроме головы.
Из анализа этой пары можно сформировать гипотезу, что к классу 1
относятся все фигурки, у которых в "формулах" содержится тройка (ТА, РА,
Нд). Проверка этой гипотезы с помощью 3-й по порядку фигурки
подтверждает ее. Поскольку "формула" для 3-й фигурки отличается от
гипотезы о предполагаемом решающем правиле отнесения фигурок к классу 1,
то происходит сохранение выдвинутой гипотезы. Однако следующая фигурка
заставляет изменить ее. Ведь она тоже принадлежит к классу 1, а ее
туловище принимает значение В, а не значение А, как того требует
гипотеза. Новая гипотеза состоит в том, что для отнесения фигурки к
классу 1 достаточно наличия в ее "формуле" лишь пары (РА, НА).
Дальнейший процесс обучения приводит к гипотезе о том, что к 1-му классу
относятся фигурки с НА, а ко 2-му - фигурки с Нв.
Этот пример - простейший случай обучения распознаванию. Он
характеризуется наличием одного ядра сходства, которое в примере связано
с формой ног. Но вполне возможно, что таких ядер окажется несколько. В
этом случае поиск решающего правила усложнится.
Вернемся к рисунку. Теперь в обучающей последовательности принадлежность
фигурок к классам определяется цифрами, написанными под фигурками. В
этом случае попытки применить для поиска решающего правила прием,
использованный ранее, не приведет к успеху. Не описывая подробно, как
это удалось сделать, укажем на два ядра сходства, которые определяют для
этой обучающей последовательности принадлежность фигурок к 1-му классу:
(ГАРВ); (Гв, ТА). А принадлежность ко 2-му классу определяют три ядра
сходства: (ГВ,ТВ); (ГА, РА); (РА,ТВ). (Для тех, кто прочитал статью
Алгебра логики, решающее правило можно представить в виде формул алгебры
логики:
ГА Р в V Гв ТА
и Гв ТВ V ГА РА V РА ТВ.)
Мы рассмотрели задачу обучения распознаванию на конечной обучающей
последовательности. Сложнее задача о бесконечном множестве объектов. В
этом случае обучающая последовательность выступает лишь как обучающая
выборка из множества возможных объектов. Решающие правила, найденные по
ней, могут оказаться и ошибочными при появлении новых объектов.
Стандартный прием проверки эффективности решающих правил - разделение
исходной выборки объектов на две части: обучающую выборку и
экзаменационную выборку. Правила находят по обучающей выборке, а затем
они применяются для объектов экзаменационной выборки, для которых
истинная принадлежность к классам, конечно, известна. По проценту
ошибок, допускаемых решающими правилами на объектах экзаменационной
выборки, судят о качестве обучения.
Задача еще более усложнится, если явно наблюдаемые в объектах признаки
не являются классифицирующими и на первом этапе обучения надо эти
классифицирующие признаки выявить. О том, насколько они могут быть
экзотичными, можно показать на примере объединения предметов мебели в
классы: кухонная мебель или садовая мебель. Задачи такого типа пока еще
не получили сколько-нибудь удовлетворительного решения.
Для задач, где классифицирующие признаки входят в множество признаков,
задаваемых в описаниях объектов обучающей выборки, разработаны мощные
процедуры обучения. Наиболее известная процедура такого типа в нашей
стране получила название ДСМ-метод, где первые три буквы
расшифровываются как Джон Стюарт Милль. Именно Милль (уже весьма давно)
разработал индуктивную логику, основанную на принципах сходства и
различия, используемых в ДСМ-методе.