1. Знания, виды знаний , базы знаний, банки знаний
Знания – это основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактически знания), а также стратегии принятия решений в этой области (иначе стратегические знания)
Под «знаниями» понимают формализованную информацию, на которую ссылаются или которую используют в процессе решения задачи. Знание о предметной области включает описание объектов, их окружения, необходимых явлений, фактов, а также отношений между ними. Сложность понятия «знание» заключена во множественности его носителя и неразрывности с понятием «данные».
Выделяют несколько уровней формализации знания о предметной области:
· знания в памяти человека;
· знания в форме языковой модели предметной области, используемые человеком и зафиксированные на физических носителях с использованием контекстно-зависимых языков, графических образов и т.п.;
· знания, формализованные для их представления при использовании в ЭВМ;
· фактографические сведения или данные.
Знания обычно разделяют на 2 большие категории: факты и эвристики. Первая категория (факты) указывает на хорошо известные в той или иной предметной области обстоятельства. Такие знания еще называют текстовыми, имея в виду достаточную их освещенность в специальной литературе и учебниках. Вторая категория (эвристики) основывается на индивидуальном опыте специалиста (эксперта) в предметной области, накопленном в результате многолетней практики. Эта категория нередко играет решающую роль при построении интеллектуальных программ.
База знаний - это совокупность моделей, правил и факторов (данных), порождающих анализ и выводы для нахождения решений сложных задач в некоторой предметной области.
2. Модели представления знаний
Наиболее распространенными моделями представления знаний являются:
В продукционных системах знания представляются в виде совокупности специальных информационных единиц, имеющих следующую структуру:
Имя продукции: name
В общем случае продукционная система включает следующие компоненты:
· базу данных, содержащую множество фактов;
· базу правил, содержащую набор продукций;
· интерпретатор (механизм логического вывода) или правила работы с продукциями.
База правил и база данных образуют базу знаний. Факты в базе данных представляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по море накопления опыта. Правила являются более долговременной информацией и предназначены для порождения гипотез (новых фактов) из того, что уже известно.
Продукции по сравнению с другими формами представления знаний имеют следующие преимущества:
· единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);
· естественность (вывод заключения в продукционной системе во многом аналогичен процессу рассуждений эксперта);
· гибкость родовидовой иерархии понятий, которая поддерживается только как связи между правилами (изменение правила влечет за собой изменение иерархии).
Однако продукционные системы не свободны от недостатков:
· процесс вывода менее эффективен, чем в других системах, поскольку большая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;
· этот процесс трудно поддается управлению;
· сложно представить родовидовую иерархию понятий.
Логические модели представления знаний реализуются средствами логики предикатов.
Предикатом называется функция, принимающая только два значения - истина и ложь – и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием.
В общем случае модели, основанные на логике предикатов, описываются формальной системой, которая задается четверкой:
Т – множество базовых элементов или алфавит формальной системы;
Р – множество синтаксических правил, с помощью которых можно строить синтаксически корректные предложения;
А – множество аксиом или некоторых синтаксически правильных предложений, заданных априорно;
П – правила продукций (правила вывода или семантические правила), с помощью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.
Фрейм чаще всего определяют как структуру данных для представления стереотипных ситуаций. Фреймы (дословно - «рамка») – это единица представления знаний, детали которой могут изменяться в соответствии с текущей ситуацией. Фрейм в любой момент времени может быть дополнен различной информацией, касающейся способов применения данного фрейма, последствий этого применения и т.п.
Семантическая сеть описывает знания в виде сетевых структур. В качестве вершин сети выступают понятия, факты, объекты, события и т.п., а в качестве дуг сети – отношения, которыми вершины связаны между собой.
3. Стратегии получения знаний
Существует несколько стратегий получения знаний. Наиболее распространенные:
Рисунок 1 - Три стратегии получения знаний
Рисунок 2 - Классификация методов извлечения знаний
Под приобретением знаний понимается способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура знаний заранее закладывается в программу). Эта стратегия требует существенной предварительной проработки предметной области. Системы приобретения знаний действительно приобретают готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные экспертные системы с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными.
Термин обнаружение (формирование) знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов анализа данных для получения знаний и обучения. Эта область включает индуктивные модели формирования гипотез на основе обучающих выборок, обучение по аналогии и другие методы.
4. Свойства систем, основанных на знаниях
Рисунок 3 – Свойства систем, основанных на знаниях
5. Критерии целесообразности решения задач с помощью систем, основанных на знаниях
Рисунок 4 – Критерии целесообразности решения задач с помощью систем, основанных на знаниях