СЕКЦИЯ 2

реклама
СЕКЦИЯ 2. ТЕХНИКАЛЫҚ ҒЫЛЫМДАР
ФОРМАЛИЗАЦИЯ ПОНЯТИЙ ДАННЫЕ, ИНФОРМАЦИЯ И
ОНТОЛОГИЯ ЗНАНИЙ
Рустамов Н. Т.
Университет «Сырдария», г Жетысай
Введение. Необходимость анализа и формализации задач, связанных со
сравнением и классификацией объектов (точек), сознавали ученые далекого
прошлого. “Его (Аристотеля) величайшим и в то же время чреватым
наиболее опасными последствиями вкладом в науку была идея
классификации, которая проходит через все его работы… Аристотель ввел
или по крайней мере кодифицировал способ классификации предметов,
основанный на сходстве и различии…” [1].
Авторы выдающихся классификаций не располагали современным
математическим аппаратом статистического анализа и распознавания, однако
основные идеи и методологические принципы этого аппарата явно или
неявно пронизывают логику их конструкций. С развитием интеллектуальных
систем, и ростом интереса к семантической обработке информации к
проблемам классификации начали рассматривать с точки зрения
информационного подхода к определению точки в пространстве [2]. Так как,
процедура распознавания, тесно связана семантической обработкой
информации, то обучающих базу должны описывать исходя из
информационного определения точки в пространстве. Сходства или различия
объектов легче определять если мы сумеем оценить их информационную
семантику. В свою очередь такая оценка достигается представлением этих
объектов (точек) в виде базы знаний (БЗ). Создание БЗ тесно связана как
определена понятия «данных», «информация», и «знание». При этом
информация должна быть семантической. Надо сразу отметить,
традиционная (шенноновская) теория информации, являющейся частью
теории связи изучает методы кодирования сообщений различных источников
и проблемы надежной передачи сообщений по каналам связи с шумом. Сама
семантика сообщений здесь остается в стороне и, следовательно,
семантическая информация не является предметом этой теории. Понятие
семантической информации, семантика знаний отсутствует и в традиционной
(виннеровской) кибернетике. Это связано с тем, что в кибернетике в
ситуациях, когда каждый из исследуемых точек множества Х
характеризуется (если смотреть эту точку в информационном пространстве)
большим числом разнотипных взаимосвязанных свойств, тогда определить
знание об этой точки требует более глубже (диалектическом смысле) изучить
свойство и идентификации его семантического указателя. Решение указанной
проблемы требует привлечения методологии диалектического материализма,
взаимодействия теории познания, коммуникации, психологии, лингвистики,
знаковых систем, прикладных дисциплин математики и других наук.
Актуальность этой проблемы обусловлена как необходимостью решения
задачи, определение семантики свойств точки, так и связанные с созданием
базы знаний. Для информационных систем работающих семантическими
информациями, сама создания базы знаний тесно связана представлением
знаний для обработки, хранения и передачи. Чтобы решит эту задачу, сперва
мы должны формально оценить характеристику свойств точки х  Х с
информационной точки зрения. Так, как именно сведения свойств  точки
х  Х определяет семантику знание о х  Х . Или, алгоритмически оценить
семантику знаний.
Целью данной работы является определение характеристики свойств 
точки х  Х , являющийся основой оценки глобальных и локальных
характеристик знаний, определяющий онтологические свойства, и играющая
существенную роль в проектировании базы знаний (БЗ).
Метод решения задачи. Объект – первичное и неопределяемое строго
понятие. Оно всегда противопоставляется другому, двойственному ему
понятию – субъект. Субъект обладает способностью воспринимать,
преобразовывать и использовать информацию об объекте. Эта способность
называется интеллектом [1].
Всякий объект обладает определенными свойствами, проявляющими при
отражении с другими объектами. Всякое свойство объекта проявляется в
рамках того или иного контекста [2]. Такое проявление фиксируется
датчиками как сведение о объекте. Причем всякое сведение описывает два
множества объектов. Одно опорное множество Х тех объектов которые
являются допустимыми для датчика. Другое – множество  тех объектов из
Х , для которых датчиком фиксируются вполне определенные свойства. Тем
самым, второе множество есть часть первого, т.е. подмножество,   Х
Далее, всякое сведение должно иметь указатель (имя) объекта, о котором
сообщается в данном сведении. Обозначим через х тот объект, который
указан в сведении. Тогда х является элементом как опорного множества Х ,
так и подмножества  , т.е. х  Х , х   В случае табличном представлении
х1 , х2 ,..., хn  X будет выражать строку таблицы. Таким образом указателем
объекта будет строка таблицы. А  выражает столбцы таблицы. По своей
сути  - выражает свойство точки х , т.е. признаки этой точки. Все это
сказанное схематически выглядит следующим образом:
Таблица Х
1
2
3
х0
a 01
a 02
a 03
х1
х2
a11
a 21
a12
a 22
a13
a 23
…
…
…
…
n
a0n
a1n
a2n

xn

a n1

an2

a n3

…

amn

Информация J 
в контексте 
Рис.1. Табличное представление свойство точки х  Х
Если множество, Х представляет некую область в пространстве R
X
х1
х2
х3
хn
Рис.2. Пространственное представление точки x  X
Тогда каждая клетка области X представляет определенную контекст и
описывается набором свойств    1 ,  2 ,... n  или данными об x  X , т.е.
 px .
Семантика всякого сведения предполагает наличие следующих четырех
величин: опорного множества Х объектов, семантического указателя x
одного из объектов Х , т.е. x  X , подмножества  объектов из Х , т.е.   X и
контекст p (семантическая достоверность), которая характеризует
выполнения главного условия x   . Здесь  информационное представление
объекта x [3]. В связи с этим всякое сведение об объекте x  X будем
обозначать триадой
(1)
 p  ( x )
Наряду с отдельными сведениями вида (1) об объекте, имеют дело с
наборами (семействами) сведений об одном объекте. Такие наборы называют
данными об объекте.
 р1 х;  p 2 x;...   px
(2)
где   1 ; 2 ;... - называется набором свойств
Определение 1. Непустое семейство элементарных сведений о объекте x из
Х назовем информацией об объекте х  Х , и обозначим через J х x  в
заданном контексте р ; если выполняются три условия:
1) из  р  х   J х x  следует, что   непустое множество, т.е.  p  x  
~
2) из  р  х   J х x  следует, что любое общее сведение  p   x  также
~
принадлежит J х x  , т.е. для любого подмножества  p    p  в X будет
 x   J х x 
3) из 1 x ,  2 x   J х x  следует что  p1 x &-  p  2 x0   J p x 
~
Если задан контекст х  х1 , х2 ,..., хn , тогда семантика информации J х x 
выглядит как:
J х x    p1  1 x ,  p 2  2  x ,...,  p n  n x 
(3)
Из рис.1. видно что данные интерпретируются по строкам и по столбцам.
Тогда у нас получится информация в контексте  и в контексте х , т.е.
J  x    1 x0 ,  1 x1 ,  1 x 2 ,...,  1 x n 
J x  x0    0 x0 ,  1 x0 ,  2 x0 ,...,  n x0 
Обе эти выражения J  x  и J x x0  являются информацией об объекте x  X .
Потому, что выполняются три условия определение 1.
По своей диалектической природе  могут иметь глобальные и локальные
выраженности [3].
Определение 2. Глобальной выраженностью  является такое, благодаря
которому каждый из  , отдельно взятый, необходим, а все вместе взятые
достаточны, чтобы с их помощью отличить данную точку х  Х от всех
остальных по той его стороне, которая так связана в самой точке со всеми его
 , распознав эту  , можно уяснить зависимость о нее других 
распознаваемой точки.
Определение 3. Локальной выраженностью  точки х  Х , является такое,
благодаря которому определяется  , необходимая для распознавания точки
х  Х по известной его  , причем  эта устанавливается задачей,
выдвигаемой практикой в каждом конкретном случае.
Определение 4. Информативной выраженностью    точки х  Х ,
называется такая, которая образует  с совпадающими глобальными и
локальными выраженностями.
Именно выраженность  рождает причинно- следственные связи между
элементарными информациями.
При решении практических задач существенную роль играет информации
J х x  связанные с «причинно-следственными» свойствами. Допустим, что
точка x  X имеет различные свойства определяются тройкой  p  x . Каждое
свойство отражается в J х x  . Различия этих свойств формально можно
выражать с помощью логической импликаций, объединением, и
 p1  x1    p2  x2    p3  x3    p4  x4 ..... .
пересечением.
Т.е.
Такое
представление информации называется интерпретацией данных в контексте.
х  х1 , х2 , ..., хn  . Интерпретация данных в контексте тесно связана
определением из данных  px   p1 x,  p 2 x.... имеющих «причинные» и
«следственные» свойства. Естественно из этих соображений вытекает, что
информация J х x  тоже имеет «причинно-следственные» свойства. Из-за
глобальных и локальных выраженности свойств 
порождается
«причинные» и следственные характеристики свойств  . Это в свою очередь
порождает глобальные и локальные характеристики информации.
Из (3) видно что, если контекст изменится то семантика той же информации
будет интерпретироваться по другому.
Определение 5. Семейство L подмножеств множества X назовем решеткой
uei для X если:
а) X  L,   L
б) из 1 , 2  L следует 1  2  L где 1  ue1 , 2  ue2
в) из 1 , 2  L следует 1  2  L
г) из 1 , 2  L следует 1 \ 2  L
Элементы решетки будет отождествляться с информационными единицами
( uei ), объем которых определяется этими элементами как множествами.
При таком представлении uei будет выражать совокупность 
характеризующих определенные свойства изучаемого объекта, эти свойства
определяются практикой. Потребность к uei вытекает из-за того, что надо
представить предметную область в виде знаний.
Например
   ue0  пустое множество,

   доктора наук

ue1  имеющие научную степень   1

 2  кандидаты наук

  3  не доктора наук

ue2  не имеющие научную степень   4  не кандидаты наук

   ассистенты
L1  
 3

  4  не доктара наук

  не кандидаты наук

 5
ue

профессора



3
  6  доктор наук

  7  кандидат наук

 Х  ue  все преподователи
4

Этот пример показывает как образуются информационные единицы ue
Как известно подтверждение гипотез на основании верификации ее
следствий осуществляется способом превращения заключения в
умозаключений, от утверждения следствия к утверждению основания,
поэтому надо брать всю совокупность взаимосвязанных следствий, и тогда
гипотеза однозначно будет вызываться только данной совокупностью
следствий, а поэтому заключение будет вызываться только данной
совокупностью следствий, и поэтому заключение будет не вероятным, а
достоверным, протекающим по формуле
H  c1  c2  c3  ...  cn  , где H - гипотеза;
c1 , c2 , c3 ,..., cn - следствия вытекающие из нее “  ” импликация от гипотезы к
совокупности следствий.
Эта процедура выражает превращение элементарной информации в
элементарное знание. Понятно, что такое преобразование осуществляется
алгоритмом имеющие эвристические свойства. Решение практических задач
показала, что информативные  являются гипотезами H [2,5,7]. Именно
 будет
определение информативных
началом работы алгоритма
преобразования информации в знание.
Определение 6. Элементарным знанием будем называть информацию
 p  x  J х x интерпретируемый в uei и имеющие следующие свойства:
~
- всякое подмножество  pue  множества  pue  x  J ue x принадлежит
J
ue
i
x 
i
- пересечение конечного числа множеств из J ue x  принадлежит J ue x 
- пустое множество Ø не принадлежит J ue x 
~
- при   ue элементарное знание Ф ue ' x  , где ' x   J ue x   J ue x  ; здесь
~
J ue  x    1 x    2 x   ...;
(4)
Утверждение 1. Всякая конечная  px информация J ue x  эквивалентен
элементарному знанию Ф ue x  если   ue
Доказательство. Пусть ( x)   1 x ;...;  n ( x) в контексте ue . Тогда их
конъюнкция  x   1 x  & ... &  n x  также принадлежит J ue x  . По определению
J ue x  для  x  существует  i x  из x , менее общее, чем  0  x  , т.е.  i   0 .
Следовательно, среди сведений данных x есть сведение  i x    0 x  , а
 0  x  дает ту же
остальные сведения более общие чем  0 x0  . Поэтому x
~
информацию J ue x  , что и J ue x  значит   ue . Из этого следует, что J ue x 
является элементарным знанием. ■
Определение 7. Носителем элементарного знания Ф ue об объекте из Х
назовем всякое подсемейство ' x информации, входящих в состав  px ,
~
что для любого причинно-следственно связанные сведения   х  из J х x 
~
существует менее общее сведение  x  из х , т.е. ( p ) (    ), в
информационном единице uei
Утверждение 2. Если знание Ф ue имеет одиночный носитель ' x в uei , то
этот носитель определяется однозначно.
Доказательство. Приведем от противного. Предположим, что имеются два
одинаковых носителя '1 x и '2 x для знаний Ф ue ' x  так как '2 x
носитель Ф ue , то '2 x принадлежит Ф ue x  . В свою очередь, по
определению носителя '1 x для любой информации из ' x , в частности,
~
~
для   х  существует менее общее сведение из носителя, т.е.  р     в uei .
~
~
Аналогично получается обратное включение  р     , тем самым    1 .■
Обратим особое внимание на предикатную форму записи элементарного
знания (4) и ее носителя
i
i
i
i
i
i
i
Ф
uei
' x   J х x 
Здесь предикатный символ Ф ue  p x  интерпретируется как реляционное
отношение свойств х  Х в информационном измерении uei . ∆- как базис
i
J х x  . Предикатный аргумент интерпретируется как семантический указатель
знания о объекте х  Х , причем запись (4) означает что для любого
'1 x   Ф ue справедливо x  J х x 
Из записи (3) можно формально написать семантику элементарного знания.
Если определен   ue , тогда предикатная семантика элементарного знания
Ф ue выглядит следующим образом:
Ф ue ' x   '1 x , ' 2 x , ..., ' n x  (5)
Для определения семантики элементарного знания, мы должны указать
процедуру интерпретации информации J х x  в заданном контексте
uei  х i . Такая процедура связана определением причинноследственных свойств J p x . В этом случае (5) превращается в табличную
форму [5].
Понятно,
что
две
элементарные
знания
о
объекте
x X
ue
ue
'
'
Ф1  p  x , Ф2  p  x  будут сравнимы на больше-меньше если один из
знаний Ф1ue  p ' x , Ф2 ue  p ' x  мажорует другой (т.е. содержит другой как
подмножество). При этом, если Ф1ue  p ' x   Ф 2 ue  p ' x  , то будем
говорить, что знание Ф 2 ue  p ' x  больше знания Ф1ue  p ' x  или, что
ue
ue
ue
ue
Ф 1  x  меньше, чем Ф 2  x  и записывать Ф1  p '  x   Ф 2  p ' x  . Если
для некоторой информации о объекте х из X нет знаний большей, чем она,
то будем ее называть максимальной и обозначать Ф max ue  p ' x . Если же для
некоторой информации о объекте х из X знаний меньшей, чем оно, то будем
ее называть минимальной и обозначать Ф min ue  p ' x  . Элементарные знания
о разных объектах в одной uei между собой не сравниваются [4].
Теорема. Две элементарные знания Ф 1ue , Ф2 ue имеющие одиночные носители
p
p
J 1 x , J 2 x , сравнимы на большее-меньше тогда и только тогда, когда
сравнимы на общность информации J 1 p x , J 2 p x , . Причем, для того чтобы
ue
ue
p
p
Ф1 '  x   Ф 2 ' 2  x  , необходимо и достаточно, чтобы J 1 x   J 2 x  .
Другими словами, среди знаний с одиночными носителями большое знание
приносит менее общая информация и только оно.
Доказательство. Необходимость Пусть Ф1ue ' x   Ф 2 ue ' x  . Тогда любое
1
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
'
i
'
'
'
'
i
'
i
i
i
информация из Ф 1ue в частности, J 1 p x  принадлежит Ф 2 ue . Но J 2 p x 
одиночный носитель Ф 2 ue . Следовательно, J 2 p x  - менее общая информация,
чем J 1 p x  , т.е. J 2 p x   J 1 p x  .
Достаточность. Пусть J 1 p x   J 2 p x  . Тогда информация J 1 p x  , как более
общее, чем J 2 p x  , принадлежит Ф 2 ue по определению знание.
Следовательно, и любая другая информация из Ф 1ue , как более общее, чем
ue
p
J 1 x  , также принадлежит Ф 2 . Тем самым имеет место включение
ue
Ф 1  Ф ue .
'
'
i
i
'
i
'
'
'
'
'
'
'
i
i
'
i
i
Теорема. Для любого элементарного знания Ф ue ' x0  о точке x0  X из
~
~
информации J х x0  семейство подмножеств J х  x  образует фильтр в X ,
который будем обозначать тем же символом Ф ue . Для всякого носителя ' x
~
знания Ф ue из информации вида J ue x0  семейство подмножеств J х  образует
базис фильтра Ф ue . Этот базис будем обозначать через ue . Верно и
~
обратное. Всякий фильтр Ф ue в X из подмножеств J х  X , которые содержат
~
точку x 0 из X , выдает знание Ф ue ' x0  из информации вида J х x0  . При
этом любой базис ue этого фильтра Ф ue определяет носитель ' x такое
знание.
Доказательство. Из определения 6 элементарного знания следует что
~
~
семейство всех подмножеств J х  x  , которые определяют J х x0  из Ф ue ' x  ,
образуют фильтр Ф ue в X . Рассмотрим носитель ' x0  знание Ф ue ' x0  , где
~
' х0   J ue x0   J ue x0  . Из определения носителя имеем: для любого
~
J ue  Ф ue x0  существует менее общая информация J ue  x 0  из Ф ue x0  ,
образует базис фильтра Ф ue . Обозначим этот базис буквой ue  Ф ue .
~
Обратно, если Ф ue - фильтр в X и любое подмножество J ue  Фue содержит
~
точку x0  X , то семейство элементарных информации J ue x  образуют
элементарные знания, которую естественно обозначить Ф ue x0 . При этом
всякий базис ue фильтра Ф ue определяет подсемейство информации вида
~
~
определению
J x x0   J x x0 , J x x0   J x x0  , которые удовлетворяют
носителя знаний J x x  . ■
Эта теорема является основой создания базы знаний.
Обратим особое внимание на предикатную форму записи элементарного
знания и ее носителя:
Ф ue x0   ue x0  где uei  
(6)
ue
Здесь предикатный символ Ф интерпретируется как фильтр в X , а ue - как
базис фильтра Ф ue . Предикатный аргумент интерпретируется как
семантический указатель, т.е. идентификатор точки x0  X , причем запись (6)
~
~
означает, что для любого J  Фue справедливо x0   . Это дает нам
возможность аналитически определят базис ue в виде продукции свойств
точки x0  X .
Базис ue знание Ф ue состоит из двух частей, глобальным порождающим
базисом (ГПБ) и локальным порождающим базисом (ЛПБ). Разделение
базиса на ГПБ и ЛПБ связана с информативностью свойства    1 ,  2 , ...,  n .
В свою очередь и знание имеет свойство локальности и глобальности.
ГПБ состоит из таких  , у которых выраженность глобальное (определение
1.), а ЛПБ состоит из таких  у которых выраженность локальное
(определение 2.). Что интересно ГПБ имеют причинные свойства, а ЛПБ
следственные свойства. Это нам дает возможность оценить базис ue в виде
причинно-следственных связей элементарных информаций в uei т.е.
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
uei
i
i
i
i
i
i
i
1
i
i
~
uei  ГПБ  ЛПБ  J ue  ГПБ   J ue ЛПБ 
~
где J ue  ГПБ   J ue ЛПБ 
(7)
Таким образом знание Ф ue ' x  имеющие базис в виде (7) называются
продукционными знаниями [3,9,10]. Здесь мы хотели отметить, что именно
разделение базиса ue на ГПБ и ЛПБ, порождает глобальных (ГЗ) и
локальных (ЛЗ) знаний, т.е. онтологию. При этом всегда надо учитывать
причинно-следственную связь этих знаний, т.е. (ГЗ)  (ЛЗ).
Выводы. Предположенная выше концепция дает инженерам знаний
возможность проектировать БЗ на базе идеи продукции [10]. Такой подход к
проектированию БЗ имеет ряд преимуществ. Самое главное это
представление БЗ в табличной форме [6,7,8]. В принципе базис ue знание
Ф ue ' x  определяется причинно-следственными связями сведений точки
x0  X . Глобальные и локальные характеристики базиса ue порождает такие
же характеристики знаний. Оценка этих характеристик знание является
началом семантической обработки знания. Понятно что когда БЗ
спроектирована в табличной форме, то создание СУБЗ (систем управления
базами данных) приобретает реальность. Табличное представление знаний
сам по себе самостоятельная алгоритмическая задача. Решение этой задачи
помогает создать систему управления базами знаний (СУБЗ) являющейся
необходимой частью любой интеллектуальной системы. Онтологическое
свойство знаний [7], вытекает именно из семантических свойств
информации. Если интерпретировать одну и ту же информацию в разных
контекстах, то семантика знаний будет другой. Такое свойство информации
является
предпосылкой
появления
онтологии
знаний.
Поэтому
представление знание через «данные», «информации» имеет принципиальное
значение при проектировании БЗ и СУБЗ.
i
i
i
Литература
1. Бернал Дж. Наука истории общества. М.: Изд. иностр. литература, 1956.
117 с.
2. Чечкин А. В. Математическая информатика. – М.:
Наука. Гл. ред. Физ-мат. лит. 1991. – 416с.
3. Рустамов Н. Т., Темирбеков А. Н., Асабаев О. М. Экспертный подход к
созданию продукционной базы знаний. // Вестник МКТУ им. Х.А. Яссави
№1, 2008, с 92-96
4. Рустамов Н.Т. Прикладное распознавание. Туркестан, 1999. -84 с.
5. Рустамов Н.Т., Исраилов Р.И., Асабаев О.М., Рустамов Б.К.
Информационный метод выявление роли воскулита при мозговом инсульте.
Шымкент. Труды межд. науч.- прак. конференций «Казахстан в новом мире
и проблемы Национального образования» посвященной 10-летию
университета «Сырдария»., т.3, 2008, с. 371-375.
6. Рустамов Н.Т., Асабаев О.М., Кантуреева М.А. Особенности
продукционных знаний. // Вестник ЕНУ им. Л.Н. Гумилева, № 4 (65), 2008. с.
36-42
7. Темирбеков А.Н., Рустамов Н.Т., Сейдикеримова Д.С., Рустамов Б.К. К
вопросу создания базы знаний для хронических заболеваний. // Вестник
МКТУ им. Х.А. Яссави, № 1, 2007, с. 15-21
8. Асабаев О.М., Исраилов Р.И., Рустамов Б.К. Продукционная база знаний
для мозгового инсульта. Шымкент, Труды международной научнопрактической конференции “Казахстан в новом мире и проблемы
национального образования” посвященной 10-летию университета
“Сырдария”, т.3, 2008г., с. 342-346.
9. Тузовский А.Ф., Чириков С.В., Ямпольский В.З. Системы управления
знаниями (методы и технологии). / Под общей редакцией Ямпольского В.З. –
Томск, Изд-во НТЛ, 2005-2006 г.
10. Поспелов Д.А. Представление знаний. Опыт системного анализа //
Системные исследования. Методологические проблемы: Ежегодник.- М.:
Наука, 1985, с. 83-102.
11. Темирбеков А.Н., Асабаев О.М. Превращение гипотезы в достоверное
знание. // Вестник МКТУ им. Х.А. Яссави, №3, 2008, с.67-72
12. Рустамов Н.Т., Темирбеков А.Н., Асабаев О.М. К вопросу
проектирования системы управления базами знаний. // Вестник МКТУ им.
Х.А. Яссави, №3, 2008, c. 45-49.
Скачать