ПРЕДСТАВЛЕНИЕ МЕТАДАННЫХ ДЛЯ ПУБЛИКАЦИЙ ПО БИОЛОГИИ И МЕДИЦИНЕ В СЕМАНТИЧЕСКОМ ВЕБЕ > Полезные советы
Тысяча полезных мелочей    

ПРЕДСТАВЛЕНИЕ МЕТАДАННЫХ ДЛЯ ПУБЛИКАЦИЙ ПО БИОЛОГИИ И МЕДИЦИНЕ В СЕМАНТИЧЕСКОМ ВЕБЕ

ПРЕДСТАВЛЕНИЕ МЕТАДАННЫХ ДЛЯ ПУБЛИКАЦИЙ ПО БИОЛОГИИ И МЕДИЦИНЕ В СЕМАНТИЧЕСКОМ ВЕБЕ

M. Плесневич Г.С. Шекшеев Э.М. В работе показано как, используя концептуальный язык «Бинарная Модель Знаний», можно представлять метаданные для публикаций по биологии медицине в Семантическом Вебе. Представление метаданных дается в форме соответствующих онтологий. Статья в формате PDF 151 KB Семантический вебсамантические аннотацииметаданныебиомедицинские ресурсы вебамодели знанийSemantic websemantic annotationsmetadabiomedical resoursesknowledge models. 1. Метаданные в Семантическом Вебе

В самых общих терминах, метаданные - это данные о данных. Более точное определение: метаданные - это структурированные данные, описывающие хаpaктеристики информационных объектов (в частности, ресурсов Веба) и имеющие целью способствовать их поиску, идентификации и оценке, а также управлению этими объектами.

Метаданные играют ключевую роль в Семантическом вебе. С их помощью выполняется семантическая аннотация веб-ресурсов. Метаданные передают (частично) семантику ресурсов. Другими словами, метаданные, выполняющие семантическую аннотацию веб-ресурса - это на самом деле формально представленное знание, (частично) содержащиеся в этом ресурсе.

Семантические аннотации записываются в соответствующем языке представления знаний. Обычно используются концептуальные языки, основанные на терминологической логике (или логике описаний - description logic) [1].

В простейшем случае семантическая аннотация представляет собой список терминов (в данном языке терминологической логики) и утверждений. Например, мы можем задать термин Менингит    причина.Вирус  причина.Вирус,  (1) который обозначает менингит, вызываемый вирусом и только вирусом. Другими словами, этот термин определяет вирусный менингит, и мы можем записать утверждение

Вирусный Менингит = Менингит  причина.Вирус  причина.Вирус (2)

Таким образом, предложение выражает утверждение о кореферентности (синонимии) атомарного термина Вирусный Менингит и составного термина (1).

Между терминами также можно устанавливать отношение включения: t1  t2, если класс объектов, определяемый термином t1, содержится в классе объектов, определяемом термином t2. Другими словами, если t1  t2, то термин t2 является более общим, чем термин t1.

Совокупность терминов и утверждений указанного вида, записанных для данной области, составляет онтологию этой области.

Ключевым понятием аннотированных ресурсов в Интернете является релевантность терминов. Степень релевантности ρ (t1,t2) - это некоторое число из интервала [0,1]. Если ρ(t1,t2)=1, то эти два термина кореферентны (что означает их полную релевантность); если ρ(t1,t2)=0, то термины не релевантны.

Как отметил Заде в [2]: «Релевантность - центральное понятие для поиска. Фактически, начальный успех Google в большой мере обязан простому, но хитроумному алгоритму ранжирования в соответствии с оценкой релевантности».

Онтологию можно рассматривать как граф, вершинами которого служат термины, а дуги отвечают отношению непосредственного следования по включению. Релевантность можно определить, используя заданную на этом графе метрику. Конечно, такого типа релевантность является лишь некоторым приближением. Формальная экспликация понятия релевантности является весьма трудной задачей. Заметим, что Заде относит это понятие к нечетким.

В настоящее время  комитет W3C (World Wide Web Consorcium) в качестве стандарта  для языков  спецификации веб-онтологий предложил язык OWL (Ontology Web Language).  На самом деле OWL имеет три диалекта: OWL Lite, OWL DL и OWL full. Эти диалекты связаны последовательно отношением синтаксического и семантического включения. Таким образом, если это отношение обозначим символом <, то будем иметь: OWL Lite < OWL DL < OWL Full. Эти языки, однако, имеют некоторые недостатки:

  • атрибуты объектов представляются как роли, что не естественно, когда значением атрибута является тип данных;
  • отсутствуют средства для спецификации составных типов данных, а это затрудняет совместимость онтологий с объектно-ориентированными базами данных.

2. Составление онтологий на основе Бинарной Модели Знаний

Мы предлагаем использовать для составления онтологий в области биологии и медицины язык «Бинарная Модель Знаний» (БМЗ) [3], [4]. БМЗ лишен вышеуказанных недостатков языков OWL.

Онтология (концептуальная схема), записанная в БМЗ, содержит два вида понятий: классы и бинарные связи. (Заметим, что связи могут также выступать в роли классов.) Структура понятий (универсумы понятий) задается с помощью структурных предложений, имеющих следующий абстpaктный синтаксис.

• Элементарными структурными предложениями являются:

C[A:T], C[A:D], C[A:D(*)], C[A:D(m,n)], (C L D).

Здесь  C  и  D - имена понятий (классов или бинарных связей), L - имя бинарной связи, А - имя атрибута, Т - спецификация типа данных (значений атрибута),  m ≤ n - натуральные числа. Выражение D(*) обозначает понятие, экземплярами которого служат конечные множества экземпляров понятия D, а экземплярами понятия D(m,n) являются те экземпляры понятия D(*), число элементов в которых не меньше, чем m и не больше, чем n. Атрибуты можно обозначать теми же именами, что и понятия. Например, выражение C[E:E] - допустимое обозначение для элементарного структурного предложения (но вместо него можно писать просто C[E] ).

• Произвольные структурные предложения получаются соединением «хвостов» элементарных предложений с одинаковыми «головами».

Например, соединяя элементарные предложения C[E], C[K:Integer], C[A: D(*)] и С[B: (Integer(*), LIST(String)], получаем структурное предложение C[E, K: Integer, A: D(*), B: (Integer(*), LIST(String)]. Это предложение определяет универсум UC понятия С, элементами которого являются кортежи [E: x, K: y, A: z, B: u], где x - суррогат (системное имя - идентификатор объекта), y - целое число, z - конечное множество суррогатов, u - элемент абстpaктного типа данных (Integer(*), LIST (String)).

БМЗ включает язык для спецификации типов данных. Типы данных могут быть примитивными (такими, как Integer, String и т.п.) или составными, т.е. абстpaктными типами данных, определяемыми экспертом при помощи заданных конструкторов типов. Для спецификации операций, действующих на абстpaктном типе данных используется подъязык функционального программирования. Этот подъязык играет роль хостязыка.  БМЗ также включает запросный язык (к базам данных, структурированным в соответствии со подсхемами структурной спецификации).

Спецификация экстенсионалов понятий дается при помощи следующих типов предложений:

  • логические предложения. Примером является предложение вида EACH C(α) L SOME D(β),     где α и β - атрибутные условия;
  • предложений, специфицирующих поведение объектов.

Примером  являются продукция

X IN C(α), Y IN D(β) ==> DELETE f(X,Y) FROM E;

INSERT g(X,Y) INTO; ASSERT φ,

где f и g - функции, выраженные в хост-языке,  а φ - логическое или модальное предложение) ;

  • модальных предложений. Примером является

FUTURE EXIST X IN С(K=0) AND f

(X) =/= 1.

Замечание. Для того, чтобы сделать предложения БМЗ более читаемыми, мы можем использовать конкретный синтаксис, близкий, например, к тому, который обычно применяется в объектно-ориентированных базах данных и знаний, в частности, в такой системе как DEGAS, [5].

В БМЗ имеются две стратегии вывода (логической дедукции): прямой и обратный вывод. Прямой вывод имеет преимущество перед обратным выводом в зависимости от того, когда решается задача противоречивсти схемы. Но при вычислении ответов на запросы более эффективен обратный вывод.

Приведем пример онтологии, записанной в языке БМЗ.

Болезнь[Этиология: Фактор (*), Хаpaктер_течения: String,

Способы_лечения: Способ_лечения (*),

Патологич_изменения:Орган (*),...], (Орган Входит_в Система),

Система ISA Нервная_система | Иммунная_система |

Пищеварит _ систем а |  Ре спираторная_система |

Мышечная_система  |  Гормональная_система |...

Внутренняя_болезнь ISA Болезнь,

Внутренняя_Болезнь[Категория: (Гастроэнтерология |

Гематология|Кардиология|Нефрология |Пульмонология)],     

Место_поражения:

Орган(*)],

Гепатит ISA Внутренняя_болезнь,

Печень ISA Орган,

Гепатит  =  Внутренняя_болезнь (Место_поражение = Печень) Вирусный_гепатит  =  Гепатит (Этиология.Фактор = Вирус),

Г е п а т и т _ С  =  В и р у с н ы й _ г е п а т и т

(Вирус.Назв = С).

Работа выполнена при финансовой поддержке РФФИ (проект № 08-0100465)

СПИСОК ЛИТЕРАТУРЫ:

  1. Baader, D. Calvanese, D. McGuinness, D.Nardi, P. Patel-Schneider (eds.) The Description Logic Handbook (theory, implementation and applications). - Cambridge University Press, USA, 2003.
  2. L.A. Zadeh. From search machine to question answering systems - problems of world knowledge, relevance and precisiation. In: E. Sanchez (ed.) Fuzzy Logic and th Semantic Web. - Elsevier, 2006.
  3. G.S. Plesniewicz. Binary Data and Knowledge Model // Proceedings of the 6th Joint Conference on Knowledge-based Software Engineering, IOS Press, 2004.
  4. Г.С. Плесневич. Бинарная модель знаний // III-й Международный научнотехнический семинар «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Сб. научных трудов (Коломна, май 2005). - М: Физматлит, 2005.
  5. J. van den Akker, A. Siebes. DEGAS: a database of autonomous objects // Information Systems, v. 22, No. 3, 1997.


ПОВЫШЕНИЕ ВОСПРОИЗВОДИМОСТИ ОПРЕДЕЛЕНИЯ ГАЗОХРОМАТОГРАФИЧЕСКИХ ИНДЕКСОВ УДЕРЖИВАНИЯ С ИСПОЛЬЗОВАНИЕМ АДСОРБЦИОННЫХ КАПИЛЛЯРНЫХ КОЛОНОК

ПОВЫШЕНИЕ ВОСПРОИЗВОДИМОСТИ ОПРЕДЕЛЕНИЯ ГАЗОХРОМАТОГРАФИЧЕСКИХ ИНДЕКСОВ УДЕРЖИВАНИЯ С ИСПОЛЬЗОВАНИЕМ АДСОРБЦИОННЫХ КАПИЛЛЯРНЫХ КОЛОНОК Одним из главных факторов, определяющих межлабораторную воспроизводимость газохроматографических индексов удерживания, является редко принимаемая во внимание их зависимость от соотношения хаpaктеризуемых и реперных компонентов. Показано, что данная зависимость в разной степени проявляется не только в распределительном, но и в адсорбционном варианте хроматографического разделения. Следовательно, ее необходимо учитывать для повышения воспроизводимости измерения хроматографических индексов в газо-адсорбционной хроматографии, в том числе с использованием капиллярных колонок. ...

23 04 2024 10:19:56

АНАЛИЗ ПОНЯТИЯ «СИСТЕМЫ» С ЦЕЛЬЮ ПОИСКА «ЦЕЛОГО»

АНАЛИЗ ПОНЯТИЯ «СИСТЕМЫ» С ЦЕЛЬЮ ПОИСКА «ЦЕЛОГО» Любая научная дисциплина строится на основных понятиях, которые, являясь фундаментальными, имеют философский исток. В биологических науках среди прочих таковыми являются понятия «системы» и «целого». В настоящее время возникла необходимость по-новому взглянуть на их роль в решении вопроса о функционировании живого организма, на их взаимоотношения и структурно-функциональное наполнение. Первый шаг в таком рассмотрении сделан авторами настоящей статьи, в которой определено место этих понятий в описании функций живого, как в теоретическом, так и в пpaктическом плане. ...

20 04 2024 14:24:41

КЛАССИЧЕСКАЯ ФИЗИКА НА ГНИЛОМ ФУНДАМЕНТЕ (КАТАСТРОФА В МЕХАНИКЕ )

КЛАССИЧЕСКАЯ ФИЗИКА НА ГНИЛОМ ФУНДАМЕНТЕ (КАТАСТРОФА В МЕХАНИКЕ ) 1.Второй закон Ньютона в катастрофе это неоспоримый факт. 2.Нужно думать, что после такой катастрофы вся классическая физика полетит к чёрту, вместе с физиками, которые попытаются её защищать. 3.Учёные физики всех стран попали в капкан у них дилемма: или они признают теорию Ростовцева или им грозит скамья подсудимых за ложную науку и обман человечества. ...

14 04 2024 17:11:38

РИЗОГЕННАЯ СПОСОБНОСТЬ КЕДРА СИБИРСКОГО

РИЗОГЕННАЯ СПОСОБНОСТЬ КЕДРА СИБИРСКОГО Статья в формате PDF 121 KB...

10 04 2024 16:57:50

ЛЕЧЕНИЕ ОЖИРЕНИЯ КАК ОБЪЕКТ ПАТЕНТНОГО ПРАВА

ЛЕЧЕНИЕ ОЖИРЕНИЯ КАК ОБЪЕКТ ПАТЕНТНОГО ПРАВА Статья в формате PDF 129 KB...

06 04 2024 7:43:47

ТАНГАНОВ БОРИС БАДМАЕВИЧ

ТАНГАНОВ БОРИС БАДМАЕВИЧ Статья в формате PDF 142 KB...

04 04 2024 22:29:55

ЦЕЛИ И ПРОБЛЕМЫ ЭКОНОМИЧЕСКОГО ОБРАЗОВАНИЯ В ШКОЛЕ

ЦЕЛИ И ПРОБЛЕМЫ ЭКОНОМИЧЕСКОГО ОБРАЗОВАНИЯ В ШКОЛЕ Статья в формате PDF 103 KB...

30 03 2024 19:58:57

СВОЙСТВА КРУГА ЛАГИРА

СВОЙСТВА КРУГА ЛАГИРА Статья в формате PDF 555 KB...

23 03 2024 21:52:49

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::