ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ > Полезные советы
Тысяча полезных мелочей    

ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

Комар Ф.В. Статья в формате PDF 58 KB

В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.

Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных

На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.

На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.

Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:

    (1)

Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.

       (2)

Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.

В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка  не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка  будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.

Представленные ниже оценки лишены указанных выше недостатков:

   (3)

Комбинированная оценка, которая с помощью параметра  позволяет изменять вклад оценок P и  в конечный результат. При   , оценка  не учитывает. При   , оценка P не учитывает. При  оценки P и  учитываются равноценно и можно получить следующую комбинированную оценку [5]:

 (4)

В работе [0] была представлена, а в работе [0] использована следующая оценка:

   (5) 

С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:

Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.

Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.

Для численного анализа результатов предлагается использовать количественные оценки качества  и .

СПИСОК ЛИТЕРАТУРЫ:

  1. Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
  2. Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
  3. Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
  4. Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
  5. Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.


СТАНДАРТИЗАЦИЯ СОЦИАЛЬНОЙ РЕКЛАМЫ

СТАНДАРТИЗАЦИЯ СОЦИАЛЬНОЙ РЕКЛАМЫ Статья в формате PDF 182 KB...

10 06 2026 15:51:33

Договор купли продажи

Договор купли продажи Статья в формате PDF 103 KB...

06 06 2026 0:59:19

Об интеграционном подходе в менеджменте

Об интеграционном подходе в менеджменте Статья в формате PDF 133 KB...

28 05 2026 14:38:31

P.aeruginosa как представитель госпитальной флоры

P.aeruginosa как представитель госпитальной флоры Статья в формате PDF 115 KB...

27 05 2026 7:24:24

Молекулы средней массы плазмы крови при сифилисе

Молекулы средней массы плазмы крови при сифилисе Статья в формате PDF 106 KB...

25 05 2026 6:58:24

ФАКТОР НЕКРОЗА ОПУХОЛЕЙ И ГИБЕЛЬ КЛЕТОК ПЕЧЕНИ

ФАКТОР НЕКРОЗА ОПУХОЛЕЙ И ГИБЕЛЬ КЛЕТОК ПЕЧЕНИ Статья в формате PDF 97 KB...

24 05 2026 4:47:23

РОЛЬ РЕГУЛЯТОРНЫХ ПЕПТИДОВ В МЕХАНИЗМАХ ПОВРЕЖДЕНИЯ ЦЕНТРАЛЬНОЙ НЕРВНОЙ СИСТЕМЫ ПРИ ЭНДОТОКСЕМИИ

РОЛЬ РЕГУЛЯТОРНЫХ ПЕПТИДОВ В МЕХАНИЗМАХ ПОВРЕЖДЕНИЯ ЦЕНТРАЛЬНОЙ НЕРВНОЙ СИСТЕМЫ ПРИ ЭНДОТОКСЕМИИ Патогенез грамотрицательного септического шока рассматривается с позиций нового класса пептидов - цитокинов, инициирующих и опосредующих токсичность молекулы липополисахарида. В механизмах церебральных расстройств при септицемии цитокины считаются ключевыми медиаторами, т.к. головной мозг, наряду с другими органами, является местом активного их синтеза. Считается, что основа будущих неврологических расстройств при эндотоксемии в эксперименте и клинике формируется вначале на молекулярном уровне и затем проявляется в виде морфологического субстрата на ультраструктурном уровне. При нeблагоприятном стечении обстоятельств прогрессирование процесса может привести к развитию клинической картины острой церебральной недостаточности или шокового мозга. ...

21 05 2026 11:32:27

ЗДОРОВЬЕ ДЕТЕЙ ЛИЦ, ПЕРЕБОЛЕВШИХ ХЛОРАКНЕ

ЗДОРОВЬЕ ДЕТЕЙ ЛИЦ, ПЕРЕБОЛЕВШИХ ХЛОРАКНЕ Статья в формате PDF 109 KB...

17 05 2026 10:43:43

МЯСНАЯ ПРОДУКТИВНОСТЬ БЫЧКОВ ПРИ ВВЕДЕНИИ В РАЦИОН ХИТОЗАНСОДЕРЖАЩИХ ДОБАВОК

МЯСНАЯ ПРОДУКТИВНОСТЬ БЫЧКОВ ПРИ ВВЕДЕНИИ В РАЦИОН ХИТОЗАНСОДЕРЖАЩИХ ДОБАВОК Применение хитинсодержащих препаратов оказывает положительное влияние на мясную продуктивность бычков, а превосходство по хаpaктеристикам химического состава и энергетической ценности мякоти имеют бычки, получавшие сукцинат хитозана. ...

13 05 2026 8:59:52

ИССЛЕДОВАНИЕ ВРОЖДЕННЫХ ПОРОКОВ РАЗВИТИЯ И НАСЛЕДСТВЕННЫХ ЗАБОЛЕВАНИЙ В ЗАПАДНОЙ ЗОНЕ АЗЕРБАЙДЖАНА

ИССЛЕДОВАНИЕ ВРОЖДЕННЫХ ПОРОКОВ РАЗВИТИЯ И НАСЛЕДСТВЕННЫХ ЗАБОЛЕВАНИЙ В ЗАПАДНОЙ ЗОНЕ АЗЕРБАЙДЖАНА Проведены медико-генетические исследования среди населения трех крупных районов Западной зоны Азербайджана с целью дальнейшего составления регистра фенотипически наиболее легко диагностируемых врожденных пороков развития и наследственных заболеваний, подлежащих обязательной регистрации. Установлена высокая частота распространения нарушений ЦНС, врожденных патологий зрения и слуха. Вычислены фенотипические частоты выявленных патологий. У детей с диагнозом гемолитическая болезнь выявлен полный и частичный дефицит фермента глюкозо-6-фосфатдегидрогеназы. С использованием молекулярного метода полимеразно-цепной реакции идентифицированы типы мутаций β-талассемии в обследованных районах. ...

11 05 2026 10:31:43

РОЛЬ ОХОТОВЕДЕНИЯ В СОХРАНЕНИИ БИОРАЗНООБРАЗИЯ

РОЛЬ ОХОТОВЕДЕНИЯ В СОХРАНЕНИИ БИОРАЗНООБРАЗИЯ Статья в формате PDF 125 KB...

10 05 2026 0:33:57

Иммунная система и сердечная недостаточность

Иммунная система и сердечная недостаточность Статья в формате PDF 115 KB...

06 05 2026 4:44:34

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::