ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.
Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных
На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.
На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.
Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:
(1)
Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.
(2)
Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.
В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.
Представленные ниже оценки лишены указанных выше недостатков:
(3)
Комбинированная оценка, которая с помощью параметра позволяет изменять вклад оценок P и в конечный результат. При , оценка не учитывает. При , оценка P не учитывает. При оценки P и учитываются равноценно и можно получить следующую комбинированную оценку [5]:
(4)
В работе [0] была представлена, а в работе [0] использована следующая оценка:
(5)
С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:
Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.
Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.
Для численного анализа результатов предлагается использовать количественные оценки качества и .
СПИСОК ЛИТЕРАТУРЫ:
- Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
- Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
- Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
- Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.
Статья в формате PDF
100 KB...
23 05 2026 7:50:42
22 05 2026 9:28:18
Статья в формате PDF
119 KB...
21 05 2026 6:44:32
Статья в формате PDF 137 KB...
19 05 2026 10:19:27
Статья в формате PDF
113 KB...
18 05 2026 23:40:10
Статья в формате PDF
266 KB...
17 05 2026 7:27:35
Статья в формате PDF
256 KB...
16 05 2026 16:47:34
В данной статье говориться о морфологических изменениях в стенках крупных артерии мышечного типа и слизистой оболочки желудка крыс в ходе эксперимента, вызванные двигательной активностю и ее ограничением. Основные изменения наблюдались в стенках слизистой оболочки желудка и ее артериях.
...
15 05 2026 21:22:42
Статья в формате PDF
114 KB...
14 05 2026 6:40:43
Статья в формате PDF
285 KB...
13 05 2026 16:37:40
Статья в формате PDF
456 KB...
12 05 2026 21:36:30
Статья в формате PDF
109 KB...
11 05 2026 19:56:58
Статья в формате PDF
147 KB...
09 05 2026 22:26:44
В работе впервые приведены данные по соотношению отдельных составных частей яиц японских перепелок, выращенных в новых суточных ритмах. В начале яйцекладки средний масса желтка у опытных птиц больше на 1,0 %, масса белка у контрольных больше на 1,04 % от общего веса яйца. Масса скорлупы у обеих групп в начале яйцекладки одинакова .У опытных птиц между весом яйца и весовыми долями желтка и белка установлена прямая коррелятивная связь. Между массами яйца и желтка –слабая (r = +0,335), между массами яйца и белка – тесная(r = +0,999), между массами желтка и белка(r = +0,549) – средняя корреляция.). Отношение белка к желтку у контрольных яиц больше на 0,08 %.
...
08 05 2026 21:25:31
07 05 2026 15:47:49
Статья в формате PDF
150 KB...
06 05 2026 15:44:45
Статья в формате PDF
249 KB...
05 05 2026 19:45:31
Статья в формате PDF
110 KB...
04 05 2026 23:51:59
Статья в формате PDF
117 KB...
03 05 2026 7:56:36
Уточнено систематическое положение отдельных подвидов и видов рода Ctenocephalides и их распространение по зоогеографическим областям.
...
02 05 2026 4:28:34
Статья в формате PDF
275 KB...
30 04 2026 12:41:25
Статья в формате PDF 113 KB...
29 04 2026 19:20:22
Статья в формате PDF
101 KB...
28 04 2026 3:11:48
Данная статья является отчетом о научной деятельности, которая была проведена в рамках диссертационного исследования вопросов российского антимонопольного законодательства. В исследовании затронут ряд хаpaктерных правовых проблем, таких как: различные процедуры антимонопольного контроля в России, причины и условия антимонопольного регулирования экономической концентрации и т.д. В ходе исследования и работы по этой теме были изучены научные статьи и публикации других авторов. Полная библиография приведена в конце статьи, некоторые прямые ссылки можно найти в тексте.
...
27 04 2026 1:49:24
Понимание в статье рассматривается как условие реализации потенциала, который заложен в каждом ребенке. При этом одаренность выступает с точки зрения восприимчивости, инициативы, достижений. Реализация потенциала происходит в процессе обучения, где понимание рассматривается как познавательная процеДypa и с точки зрения общения.
...
26 04 2026 16:53:57
Статья в формате PDF
154 KB...
24 04 2026 13:12:42
Статья в формате PDF
119 KB...
23 04 2026 10:18:54
Статья в формате PDF
116 KB...
22 04 2026 3:11:10
Представлен экспериментальный вариант физического воспитания младших школьников в образовательных учреждениях с целью предупреждения негативных последствий воздействия чрезмерной учебной нагрузки на организм школьников. Использование в процессе физического воспитания изометрических упражнений, включенных в уроки физической культуры, показало увеличение статической выносливости на фоне улучшения функционального состояния младших школьников.
...
21 04 2026 1:26:13
Статья в формате PDF
174 KB...
20 04 2026 16:36:58
Статья в формате PDF
122 KB...
19 04 2026 15:36:10
Статья в формате PDF
300 KB...
18 04 2026 13:47:15
Статья в формате PDF
127 KB...
17 04 2026 23:38:58
Статья в формате PDF
134 KB...
15 04 2026 18:35:22
Статья в формате PDF
103 KB...
14 04 2026 9:47:40
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::