За
последние 10 лет в области исследования методов формирования знаний на основе
машинного обучения (в дальнейшем для краткости мы будем употреблять термин машинное
обучение — machine learning) наблюдается бурный прогресс. Но мы
не будем в этой главе делать широкого, а следовательно, и поверхностного обзора
имеющихся работ, а сконцентрируемся на тех методах, которые имеют прямое отношение
к проблематике экспертных систем:
извлечение множества правил из предъявляемых
примеров;
анализ важности отдельных правил;
оптимизация
производительности набора правил.
Таким образом, обучение — это одновременно
и способность, и действие.
Любая программа обучения должна обеспечивать возможность сохранять и анализировать
полученный опыт решения проблем, а также обладать способностью применять сделанные
выводы для решения новых проблем.
В рамках проекта
DENDRAL была разработана программа CONGEN, которая формировала описание полной
химической структуры, манипулируя символами, представляющими атомы и молекулы.
В качестве входной информации эта программа получала формулу молекулы и набор
ограничений, накладываемых на возможные взаимные связи между атомами. Результатом
выполнения программы является список всех возможных комбинаций атомов в структуре
молекулы с учетом заданных ограничений.
Роль программы
Meta-DENDRAL во всем комплексе состояла в хом, чтобы помочь химику выявить
взаимосвязи между вариантами фрагментации молекул в процессе получения массового
спектра и структурными характеристиками компонентов молекулы. Работая совместно,
программа и химик решают, какие данные о структуре компонентов представляют интерес,
а затем отыскивают спектрометрический процесс, который может объяснить появление
таких данных.
Для того чтобы "рассуждать" о правилах, касающихся
масс-спектрометрии, система Meta-DENDRAL должна располагать языком представления
концептов и отношений между ними в этой предметной области. В Meta-DENDRAL это
объектно-ориентированный язык, который описывает
сеть с помощью узлов и связей между ними.
Выполнение
алгоритма начинается с инициализации пространства версий — заполнения
его множеством всех описаний концептов, совместимых с первым позитивным
экземпляром в обучающей выборке. ОДУ
высших порядков Математика Примеры решения задач
Теперь открывается возможность дать определение
частичного упорядочения по Митчеллу, специфичное для той предметной области,
в которой используется система Meta-DENDRAL. В этом определении будет использовано
и приведенное выше определение связности. Строчными буквами будем обозначать узлы
образца, а прописными — весь образец в целом.
Можно рассматривать
дерево решений и
с другой точки зрения: промежуточные узлы дерева соответствуют атрибутам классифицируемых
объектов, а дуги — возможным альтернативным значениям этих атрибутов.
Алгоритм
использует последовательность
тестовых процедур, с помощью которых множество 5 разделяется на подмножества,
содержащие объекты только одного класса. Ключевой в алгоритме является процедура
построения дерева решений, в котором нетерминальные узлы соответствуют тестовым
процедурам, каждая из которых имеет дело с единственным атрибутом объектов из
обучающей выборки. Как вы увидите ниже, весь фокус состоит в в выборе этих тестов.
В
качестве иллюстрации авторы работы рассматривали простое правило
системы MYCIN, которое "оппонирует" применению тетрациклина при
лечении детей, поскольку этот препарат оказывает нежелательный побочный эффект
на состояние зубов ребенка.
Проведите разграничение между задачами "обучение
концептам" и "обобщение дескрипторов".