ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ
В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.
Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных
На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.
На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.
Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:
(1)
Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.
(2)
Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.
В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.
Представленные ниже оценки лишены указанных выше недостатков:
(3)
Комбинированная оценка, которая с помощью параметра позволяет изменять вклад оценок P и в конечный результат. При , оценка не учитывает. При , оценка P не учитывает. При оценки P и учитываются равноценно и можно получить следующую комбинированную оценку [5]:
(4)
В работе [0] была представлена, а в работе [0] использована следующая оценка:
(5)
С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:
Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.
Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.
Для численного анализа результатов предлагается использовать количественные оценки качества и .
СПИСОК ЛИТЕРАТУРЫ:
- Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
- Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
- Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
- Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.
На основе анализа природных условий залегания месторождений полезных ископаемых Якутии обоснованы основные группы геоэкологических факторов, влияющие на динамику и степень преобразования экосистем при недропользовании. Формы, масштабы воздействия на природную среду зависят от стадии развития горных работ, вовлеченности отдельных участков месторождения в разработку. ...
28 03 2024 3:44:28
На основе собственных фактических данных, полученных в процессе длительных наблюдений (1982-2000 гг.) за качественным состоянием каспийских осетровых, выявлена прострaнcтвенно-временная динамика патоморфологических и функциональных нарушений во внутренних органах рыб. С позиций современной патологии, регенерации экологическая и физиологическая пластичность современных каспийских осетровых рассматривается в связи с адаптивной модификацией и нормой реакции. Обсуждаются вопросы дальнейшего изучения механизма регенерации в связи с известной гипотезой о существовании креаторной системы, выполняющей в организме регуляцию функциональной зависимости между клетками и органами. ...
27 03 2024 1:31:37
Статья в формате PDF 313 KB...
26 03 2024 8:27:22
Статья в формате PDF 136 KB...
25 03 2024 15:57:46
Статья в формате PDF 109 KB...
24 03 2024 14:59:57
Статья в формате PDF 123 KB...
23 03 2024 0:37:12
Статья в формате PDF 109 KB...
22 03 2024 19:40:43
Проведен анализ результатов научных исследований об использований труда заключенных филиалов ГУЛАГа в Казахстане для развития народного хозяйства Центрального Казахстана в 30–40-е годы ХХ века. На основе архивных данных были сделаны выводы о том, что заключенные филиалов ГУЛАГа, несмотря на тяжелое социально-экономическое, политически бесправное положение, испытывая все невзгоды, работали на промышленных предприятиях, сельском хозяйстве, на строительстве железных дорог, в голод и холод создавали экономическую базу для укрепления социалистического строя. Из основной категории заключенных выделялись женщины – жены так называемых «изменников Родины». Условия труда и содержание их в лагерях было намного тяжелее, чем у мужчин. Несмотря на это они занимались физическим трудом наравне со всеми заключенными, выполняли норму выработки, повышали производительность труда, не получая за это никаких ослаблении в труде. ...
21 03 2024 22:15:56
Статья в формате PDF 219 KB...
20 03 2024 21:41:56
Статья в формате PDF 194 KB...
19 03 2024 22:41:48
Статья в формате PDF 113 KB...
18 03 2024 22:30:22
Статья в формате PDF 792 KB...
17 03 2024 8:48:55
Статья в формате PDF 107 KB...
16 03 2024 2:31:52
Статья в формате PDF 254 KB...
15 03 2024 16:33:58
Статья в формате PDF 123 KB...
14 03 2024 20:37:15
13 03 2024 7:27:18
Статья в формате PDF 130 KB...
12 03 2024 0:28:52
Статья в формате PDF 114 KB...
11 03 2024 13:21:39
Статья в формате PDF 121 KB...
09 03 2024 3:43:55
Статья в формате PDF 107 KB...
08 03 2024 7:23:21
Статья в формате PDF 127 KB...
07 03 2024 15:22:54
Статья в формате PDF 113 KB...
06 03 2024 20:39:23
Статья в формате PDF 124 KB...
04 03 2024 3:20:16
Статья в формате PDF 109 KB...
03 03 2024 16:53:24
Статья в формате PDF 121 KB...
02 03 2024 11:26:20
На основе построения тренд-сезонных моделей исследуется динамика цен на первичном и вторичном рынках жилья Ивановской области в период 2000-2007 гг. В статье освещаются основные этапы построения моделей, приводятся количественные оценки их параметров. Особое внимание уделяется присутствию S – образной кривой роста в динамике цен на жилье. В результате использования методики с учетом индексов сезонности получены средние прогнозные значения цен на жилье Ивановской области. ...
01 03 2024 16:18:42
Статья в формате PDF 105 KB...
29 02 2024 15:11:33
Статья в формате PDF 116 KB...
28 02 2024 18:51:27
Статья в формате PDF 115 KB...
27 02 2024 16:47:10
Статья в формате PDF 131 KB...
26 02 2024 19:19:34
Статья в формате PDF 105 KB...
25 02 2024 11:24:32
Статья в формате PDF 145 KB...
23 02 2024 15:34:29
Статья в формате PDF 329 KB...
20 02 2024 20:51:12
Статья в формате PDF 106 KB...
19 02 2024 19:50:13
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::