ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ
В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.
Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных
На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.
На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.
Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:
(1)
Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.
(2)
Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.
В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.
Представленные ниже оценки лишены указанных выше недостатков:
(3)
Комбинированная оценка, которая с помощью параметра позволяет изменять вклад оценок P и в конечный результат. При , оценка не учитывает. При , оценка P не учитывает. При оценки P и учитываются равноценно и можно получить следующую комбинированную оценку [5]:
(4)
В работе [0] была представлена, а в работе [0] использована следующая оценка:
(5)
С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:
Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.
Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.
Для численного анализа результатов предлагается использовать количественные оценки качества и .
СПИСОК ЛИТЕРАТУРЫ:
- Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
- Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
- Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
- Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.
Статья в формате PDF 640 KB...
18 04 2024 3:50:20
Статья в формате PDF 239 KB...
17 04 2024 11:54:33
Статья в формате PDF 112 KB...
16 04 2024 21:35:56
Основным механизмом теплообмена для капиллярно-пористых физических систем (типа легкого бетона) является контактная теплопроводность, которая осуществляется благодаря связанным между собой процессам: переходом тепла от частицы к частице через непосредственные контакты между ними и переходом тепла через разделяющую промежуточную среду. С термодинамической точки зрения теплообмен в легких бетонах представляет собой теплоперенос (поток тепла Q), а точнее перенос энтропии (S), под действием градиента температуры (Т), осуществляемый, в соответствии со вторым законом термодинамики, от мест с более высокой к местам с меньшей температурой. Термодинамическая идентичность коэффициента теплопроводности () и S позволила, на базе второго закона термодинамики, вывести общее уравнение для прогноза теплопроводности легкого бетона в условиях его эксплуатации. Установлено, что релаксация теплопроводности (τ) пропорциональна затуханию объемных деформаций бетона (Θ), вызванных температурным градиентом и уровнем напряжения (η). Экспериментальные исследования теплопроводности легкого бетона подтвердили затухающий хаpaктер изменения Δλ как функции времени (t) и деформативности. ...
15 04 2024 1:37:11
Статья в формате PDF 126 KB...
14 04 2024 12:22:32
Статья в формате PDF 603 KB...
11 04 2024 0:49:20
Статья в формате PDF 185 KB...
10 04 2024 20:42:20
Статья в формате PDF 802 KB...
09 04 2024 5:54:11
В данной работе сделана попытка изучить механизм действия некоторых аналгезирующих и местных анестезирующих препаратов на нервно-мышечную передачу холоднокровных животных. Были исследованы aнaльгетики наркотического типа и локальные анестетики. Показано, что все исследованные препараты вызывали уменьшение амплитуды спонтанных биопотенциалов концевой пластинки, что указывает на их постсинаптическое воздействие. ...
08 04 2024 21:39:23
Статья в формате PDF 104 KB...
07 04 2024 15:28:26
Статья в формате PDF 140 KB...
06 04 2024 5:32:17
Статья в формате PDF 167 KB...
04 04 2024 22:29:26
Статья в формате PDF 112 KB...
03 04 2024 7:50:22
В работе представлены результаты исследования влияния высокоинтенсивных физических факторов электрического поля коронного разряда (ЭПКР), создаваемого установкой «Экран», и некогерентных световых импульсов (НСИ), создаваемых установкой «Стимул» [1, 2], на семена овощных культур, с целью повышения урожайности. По результатам исследования выявлено, что все использованные в эксперименте режимы высокоинтенсивного физического воздействия на семена овощных культур оказывают стимулирующий биологический эффект при оценке урожайности. Определено, что наиболее эффективными режимами ЭПКР для повышения урожайности овощных культур являются режимы с напряженностью электрического поля 3,5 кВ/см и 5 кВ/см. Выявлено, что наиболее эффективными режимами НСИ для повышения урожайности овощных культур является режим с запасенной суммарной электрической энергией импульсного источника энерго-питания 80 кДж. Показано, что при воздействии на посадочный материал картофеля НСИ с запасенной суммарной электрической энергией 40 кДж наблюдается стимулирование роста, развития, повышение всхожести и сокращение вегетационного периода картофеля. Кроме того, данное физическое воздействие вызывает повышение качества урожая картофеля, т.к. вес и количество крупных и средних клубней в опытной группе значительно больше, чем в контрольной. ...
01 04 2024 18:15:20
Статья в формате PDF 268 KB...
31 03 2024 14:45:24
Статья в формате PDF 172 KB...
30 03 2024 12:49:49
Статья в формате PDF 106 KB...
29 03 2024 2:43:56
Статья в формате PDF 313 KB...
28 03 2024 21:28:28
С помощью метода инфpaкрасной спектроскопии осуществлено сравнение вторичных структур глюкоамилаз из Aspergillus awamori и Saccharomyces cerevisiae. Получены данные о типах вторичной структуры, количественном соотношении упорядоченных и нерегулярных участков. ...
27 03 2024 4:38:50
Статья в формате PDF 124 KB...
26 03 2024 9:31:42
Статья в формате PDF 304 KB...
25 03 2024 0:17:27
Статья в формате PDF 253 KB...
24 03 2024 14:51:44
Статья в формате PDF 217 KB...
22 03 2024 7:13:52
Статья в формате PDF 267 KB...
21 03 2024 2:45:15
Статья в формате PDF 158 KB...
19 03 2024 17:49:57
18 03 2024 17:14:44
Статья в формате PDF 138 KB...
17 03 2024 13:50:13
Статья в формате PDF 115 KB...
16 03 2024 3:36:36
Статья в формате PDF 101 KB...
15 03 2024 22:15:29
Статья в формате PDF 113 KB...
14 03 2024 16:13:22
Статья в формате PDF 306 KB...
13 03 2024 21:58:42
Статья в формате PDF 284 KB...
12 03 2024 7:39:51
Статья в формате PDF 110 KB...
11 03 2024 16:49:26
Статья в формате PDF 136 KB...
10 03 2024 18:47:36
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::