ПРЕДСТАВЛЕНИЕ МЕТАДАННЫХ ДЛЯ ПУБЛИКАЦИЙ ПО БИОЛОГИИ И МЕДИЦИНЕ В СЕМАНТИЧЕСКОМ ВЕБЕ

В самых общих терминах, метаданные - это данные о данных. Более точное определение: метаданные - это структурированные данные, описывающие хаpaктеристики информационных объектов (в частности, ресурсов Веба) и имеющие целью способствовать их поиску, идентификации и оценке, а также управлению этими объектами.
Метаданные играют ключевую роль в Семантическом вебе. С их помощью выполняется семантическая аннотация веб-ресурсов. Метаданные передают (частично) семантику ресурсов. Другими словами, метаданные, выполняющие семантическую аннотацию веб-ресурса - это на самом деле формально представленное знание, (частично) содержащиеся в этом ресурсе.
Семантические аннотации записываются в соответствующем языке представления знаний. Обычно используются концептуальные языки, основанные на терминологической логике (или логике описаний - description logic) [1].
В простейшем случае семантическая аннотация представляет собой список терминов (в данном языке терминологической логики) и утверждений. Например, мы можем задать термин Менингит причина.Вирус причина.Вирус, (1) который обозначает менингит, вызываемый вирусом и только вирусом. Другими словами, этот термин определяет вирусный менингит, и мы можем записать утверждение
Вирусный Менингит = Менингит причина.Вирус причина.Вирус (2)
Таким образом, предложение выражает утверждение о кореферентности (синонимии) атомарного термина Вирусный Менингит и составного термина (1).
Между терминами также можно устанавливать отношение включения: t1 t2, если класс объектов, определяемый термином t1, содержится в классе объектов, определяемом термином t2. Другими словами, если t1 t2, то термин t2 является более общим, чем термин t1.
Совокупность терминов и утверждений указанного вида, записанных для данной области, составляет онтологию этой области.
Ключевым понятием аннотированных ресурсов в Интернете является релевантность терминов. Степень релевантности ρ (t1,t2) - это некоторое число из интервала [0,1]. Если ρ(t1,t2)=1, то эти два термина кореферентны (что означает их полную релевантность); если ρ(t1,t2)=0, то термины не релевантны.
Как отметил Заде в [2]: «Релевантность - центральное понятие для поиска. Фактически, начальный успех Google в большой мере обязан простому, но хитроумному алгоритму ранжирования в соответствии с оценкой релевантности».
Онтологию можно рассматривать как граф, вершинами которого служат термины, а дуги отвечают отношению непосредственного следования по включению. Релевантность можно определить, используя заданную на этом графе метрику. Конечно, такого типа релевантность является лишь некоторым приближением. Формальная экспликация понятия релевантности является весьма трудной задачей. Заметим, что Заде относит это понятие к нечетким.
В настоящее время комитет W3C (World Wide Web Consorcium) в качестве стандарта для языков спецификации веб-онтологий предложил язык OWL (Ontology Web Language). На самом деле OWL имеет три диалекта: OWL Lite, OWL DL и OWL full. Эти диалекты связаны последовательно отношением синтаксического и семантического включения. Таким образом, если это отношение обозначим символом <, то будем иметь: OWL Lite < OWL DL < OWL Full. Эти языки, однако, имеют некоторые недостатки:
- атрибуты объектов представляются как роли, что не естественно, когда значением атрибута является тип данных;
- отсутствуют средства для спецификации составных типов данных, а это затрудняет совместимость онтологий с объектно-ориентированными базами данных.
2. Составление онтологий на основе Бинарной Модели Знаний
Мы предлагаем использовать для составления онтологий в области биологии и медицины язык «Бинарная Модель Знаний» (БМЗ) [3], [4]. БМЗ лишен вышеуказанных недостатков языков OWL.
Онтология (концептуальная схема), записанная в БМЗ, содержит два вида понятий: классы и бинарные связи. (Заметим, что связи могут также выступать в роли классов.) Структура понятий (универсумы понятий) задается с помощью структурных предложений, имеющих следующий абстpaктный синтаксис.
• Элементарными структурными предложениями являются:
C[A:T], C[A:D], C[A:D(*)], C[A:D(m,n)], (C L D).
Здесь C и D - имена понятий (классов или бинарных связей), L - имя бинарной связи, А - имя атрибута, Т - спецификация типа данных (значений атрибута), m ≤ n - натуральные числа. Выражение D(*) обозначает понятие, экземплярами которого служат конечные множества экземпляров понятия D, а экземплярами понятия D(m,n) являются те экземпляры понятия D(*), число элементов в которых не меньше, чем m и не больше, чем n. Атрибуты можно обозначать теми же именами, что и понятия. Например, выражение C[E:E] - допустимое обозначение для элементарного структурного предложения (но вместо него можно писать просто C[E] ).
• Произвольные структурные предложения получаются соединением «хвостов» элементарных предложений с одинаковыми «головами».
Например, соединяя элементарные предложения C[E], C[K:Integer], C[A: D(*)] и С[B: (Integer(*), LIST(String)], получаем структурное предложение C[E, K: Integer, A: D(*), B: (Integer(*), LIST(String)]. Это предложение определяет универсум UC понятия С, элементами которого являются кортежи [E: x, K: y, A: z, B: u], где x - суррогат (системное имя - идентификатор объекта), y - целое число, z - конечное множество суррогатов, u - элемент абстpaктного типа данных (Integer(*), LIST (String)).
БМЗ включает язык для спецификации типов данных. Типы данных могут быть примитивными (такими, как Integer, String и т.п.) или составными, т.е. абстpaктными типами данных, определяемыми экспертом при помощи заданных конструкторов типов. Для спецификации операций, действующих на абстpaктном типе данных используется подъязык функционального программирования. Этот подъязык играет роль хостязыка. БМЗ также включает запросный язык (к базам данных, структурированным в соответствии со подсхемами структурной спецификации).
Спецификация экстенсионалов понятий дается при помощи следующих типов предложений:
- логические предложения. Примером является предложение вида EACH C(α) L SOME D(β), где α и β - атрибутные условия;
- предложений, специфицирующих поведение объектов.
Примером являются продукция
X IN C(α), Y IN D(β) ==> DELETE f(X,Y) FROM E;
INSERT g(X,Y) INTO; ASSERT φ,
где f и g - функции, выраженные в хост-языке, а φ - логическое или модальное предложение) ;
- модальных предложений. Примером является
FUTURE EXIST X IN С(K=0) AND f
(X) =/= 1.
Замечание. Для того, чтобы сделать предложения БМЗ более читаемыми, мы можем использовать конкретный синтаксис, близкий, например, к тому, который обычно применяется в объектно-ориентированных базах данных и знаний, в частности, в такой системе как DEGAS, [5].
В БМЗ имеются две стратегии вывода (логической дедукции): прямой и обратный вывод. Прямой вывод имеет преимущество перед обратным выводом в зависимости от того, когда решается задача противоречивсти схемы. Но при вычислении ответов на запросы более эффективен обратный вывод.
Приведем пример онтологии, записанной в языке БМЗ.
Болезнь[Этиология: Фактор (*), Хаpaктер_течения: String,
Способы_лечения: Способ_лечения (*),
Патологич_изменения:Орган (*),...], (Орган Входит_в Система),
Система ISA Нервная_система | Иммунная_система |
Пищеварит _ систем а | Ре спираторная_система |
Мышечная_система | Гормональная_система |...
Внутренняя_болезнь ISA Болезнь,
Внутренняя_Болезнь[Категория: (Гастроэнтерология |
Гематология|Кардиология|Нефрология |Пульмонология)],
Место_поражения:
Орган(*)],
Гепатит ISA Внутренняя_болезнь,
Печень ISA Орган,
Гепатит = Внутренняя_болезнь (Место_поражение = Печень) Вирусный_гепатит = Гепатит (Этиология.Фактор = Вирус),
Г е п а т и т _ С = В и р у с н ы й _ г е п а т и т
(Вирус.Назв = С).
Работа выполнена при финансовой поддержке РФФИ (проект № 08-0100465)
СПИСОК ЛИТЕРАТУРЫ:
- Baader, D. Calvanese, D. McGuinness, D.Nardi, P. Patel-Schneider (eds.) The Description Logic Handbook (theory, implementation and applications). - Cambridge University Press, USA, 2003.
- L.A. Zadeh. From search machine to question answering systems - problems of world knowledge, relevance and precisiation. In: E. Sanchez (ed.) Fuzzy Logic and th Semantic Web. - Elsevier, 2006.
- G.S. Plesniewicz. Binary Data and Knowledge Model // Proceedings of the 6th Joint Conference on Knowledge-based Software Engineering, IOS Press, 2004.
- Г.С. Плесневич. Бинарная модель знаний // III-й Международный научнотехнический семинар «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Сб. научных трудов (Коломна, май 2005). - М: Физматлит, 2005.
- J. van den Akker, A. Siebes. DEGAS: a database of autonomous objects // Information Systems, v. 22, No. 3, 1997.
Статья в формате PDF
154 KB...
08 03 2026 5:11:33
Статья в формате PDF
107 KB...
07 03 2026 10:37:18
Школьная научно-исследовательская деятельность – это сочетание приемов и методов, направленных на решение актуальных проблем, которые служат активизации познавательной деятельности учащихся. Научно-исследовательская работа учащихся – это пpaктическая работа поискового хаpaктера, которая способствует расширению знаний учащихся, развитию их пpaктических умений. В процессе создания естественнонаучных проектов у школьников возрастает познавательный интерес к общим законам природы, стремление к приобретению обширных знаний, обогащается умственная деятельность учащихся, развивается умение мыслить творчески.
...
06 03 2026 0:22:40
05 03 2026 1:45:28
Статья в формате PDF
326 KB...
03 03 2026 19:53:32
В статье излагается позиция автора о необходимости максимально ответственно относиться к своему здоровью, исходя из объективных предпосылок нашего времени.
...
01 03 2026 7:30:35
Статья в формате PDF
109 KB...
28 02 2026 5:47:35
Статья в формате PDF
103 KB...
27 02 2026 17:48:24
Статья в формате PDF
115 KB...
26 02 2026 5:20:18
Статья в формате PDF
122 KB...
25 02 2026 0:59:36
Статья в формате PDF
102 KB...
24 02 2026 23:33:54
Статья в формате PDF
584 KB...
23 02 2026 3:21:55
Статья в формате PDF
132 KB...
20 02 2026 15:17:49
19 02 2026 3:38:24
Статья в формате PDF
252 KB...
18 02 2026 10:58:20
С помощью комплекса ядерно-физических методов, ЯМР-спектроскопии, выявлена неоднозначная степень насыщения связанной фазы воды молекулами воды и ряда химических элементов, где основу их специфической связи представляет многослойная поляризованная структура сыворотки крови и лимфы здоровых людей, пациентов с актуальными заболеваниями. Разработана иерархическая двухуровневая модель, согласно собственной концепции сопряженного действия и эффекта энергии, системного ЭМП, энергии биохимических цикловых процессов, объединенных потоком протонов, регулируемых буферной системой и гормонами стресса.
...
17 02 2026 17:40:52
Статья в формате PDF
132 KB...
16 02 2026 7:46:49
Статья в формате PDF
194 KB...
15 02 2026 11:44:48
Статья в формате PDF
102 KB...
14 02 2026 12:16:35
Статья в формате PDF
807 KB...
13 02 2026 19:52:46
Статья в формате PDF
107 KB...
12 02 2026 12:35:11
Статья в формате PDF
271 KB...
11 02 2026 16:17:44
Статья в формате PDF
113 KB...
09 02 2026 2:41:38
Статья в формате PDF
105 KB...
08 02 2026 15:17:13
Статья в формате PDF
129 KB...
07 02 2026 14:37:44
Статья в формате PDF
107 KB...
06 02 2026 20:21:49
Статья в формате PDF
115 KB...
05 02 2026 13:48:20
Статья в формате PDF
125 KB...
04 02 2026 19:12:33
Статья в формате PDF
303 KB...
03 02 2026 21:45:30
Статья в формате PDF
321 KB...
02 02 2026 2:28:12
Статья в формате PDF
143 KB...
01 02 2026 19:24:48
Статья в формате PDF
151 KB...
31 01 2026 22:48:14
Статья в формате PDF
167 KB...
30 01 2026 9:41:59
Статья в формате PDF
101 KB...
29 01 2026 5:20:32
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::