ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ > Полезные советы
Тысяча полезных мелочей    

ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

Комар Ф.В. Статья в формате PDF 58 KB

В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.

Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных

На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.

На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.

Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:

    (1)

Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.

       (2)

Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.

В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка  не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка  будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.

Представленные ниже оценки лишены указанных выше недостатков:

   (3)

Комбинированная оценка, которая с помощью параметра  позволяет изменять вклад оценок P и  в конечный результат. При   , оценка  не учитывает. При   , оценка P не учитывает. При  оценки P и  учитываются равноценно и можно получить следующую комбинированную оценку [5]:

 (4)

В работе [0] была представлена, а в работе [0] использована следующая оценка:

   (5) 

С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:

Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.

Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.

Для численного анализа результатов предлагается использовать количественные оценки качества  и .

СПИСОК ЛИТЕРАТУРЫ:

  1. Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
  2. Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
  3. Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
  4. Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
  5. Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.


ИЗМЕНЕНИЯ КАЧЕСТВА ЖИЗНИ БОЛЬНОГО СИФИЛИСОМ

Статья в формате PDF 100 KB...

10 04 2026 10:11:45

ФАКТОРНЫЙ АНАЛИЗ ЗАГРЯЗНЕНИЯ РОДНИКОВ

ФАКТОРНЫЙ АНАЛИЗ ЗАГРЯЗНЕНИЯ РОДНИКОВ Получены закономерности взаимного влияния концентрации по 22 видам загрязнения семи родников, отобранных для исследования моделированием взаимосвязей между факторами. Дана полная корреляционная матрица монарных (на основе рангового или рейтингового распределения) и бинарных (между парами взаимно влияющих факторов) связей. Коэффициент функциональной связности равен сумме коэффициентов корреляции, разделенной на произведение числа строк на количество столбцов. Этот статистический показатель для всей сети родников применим при сопоставлении разных территорий. Первое место как влияющий параметр занимает общее микробное число, а как зависимый показатель – цветность. Анализ всех 484 моделей показал, что высокой предсказательной силой обладают слабые и средние факторные связи. Они же зачастую приводят к научно-техническим решениям мировой новизны на уровне изобретений. ...

09 04 2026 15:47:45

СВИРСКИЙ МОИСЕЙ СОЛОМОНОВИЧ

СВИРСКИЙ МОИСЕЙ СОЛОМОНОВИЧ Статья в формате PDF 1903 KB...

08 04 2026 2:36:24

ДЫХАТЕЛЬНАЯ МАСКА ДЛЯ ВНУТРИУТРОБНОГО ПЛОДА (ВНУТРИМАТОЧНЫЙ АКВАЛАНГ) И СПОСОБ ОБЕСПЕЧЕНИЯ ГАЗООБМЕНА В ОРГАНИЗМЕ ПЛОДА ЗА СЧЕТ ИСКУССТВЕННОГО ДЫХАНИЯ (ВЕНТИЛИРОВАНИЯ ЕГО ЛЕГКИХ ДЫХАТЕЛЬНЫМ ГАЗОМ) ВНУТРИ МАТКИ

ДЫХАТЕЛЬНАЯ МАСКА ДЛЯ ВНУТРИУТРОБНОГО ПЛОДА (ВНУТРИМАТОЧНЫЙ АКВАЛАНГ) И СПОСОБ ОБЕСПЕЧЕНИЯ ГАЗООБМЕНА В ОРГАНИЗМЕ ПЛОДА ЗА СЧЕТ ИСКУССТВЕННОГО ДЫХАНИЯ (ВЕНТИЛИРОВАНИЯ ЕГО ЛЕГКИХ ДЫХАТЕЛЬНЫМ ГАЗОМ) ВНУТРИ МАТКИ Предложено устранять внутриутробную гипоксию и асфиксию плода путем искусственной вентиляции его легких дыхательным газом. Для искусственного дыхания внутриутробного плода разработано специальное устройство, названное внутриматочным аквалангом. Внутриматочный акваланг включает аппарат искусственной вентиляции легких и дыхательный контур со специальной раскладной (раздувной) дыхательной маской, надеваемой внутри матки на голову плода наподобие сетчатого шлема. Разработана контролируемая с помощью УЗИ технология введения маски внутрь матки через естественное отверстие в шейке матки, технология одевания дыхательной маски на голову внутриутробного плода при головном его предлежании и технология вентилирования легких внутриутробного плода дыхательным газом. ...

06 04 2026 14:59:32

ВОСПИТАНИЕ ДЕТЕЙ В СЕМЬЕ

ВОСПИТАНИЕ ДЕТЕЙ В СЕМЬЕ Статья в формате PDF 108 KB...

01 04 2026 4:33:52

Звягинцева Татьяна Владимировна

Звягинцева Татьяна Владимировна Статья в формате PDF 69 KB...

29 03 2026 4:17:33

ПОЗИТИВНЫЙ ОПЫТ НЕГАТИВНЫХ СОБЫТИЙ В ПОЗНАВАТЕЛЬНОЙ СИСТЕМЕ ПРОФЕССОРА И.С.МУСТАФИНА

ПОЗИТИВНЫЙ ОПЫТ НЕГАТИВНЫХ СОБЫТИЙ В ПОЗНАВАТЕЛЬНОЙ СИСТЕМЕ ПРОФЕССОРА И.С.МУСТАФИНА Рассмотрены основные составляющие познавательной системы профессора И.С.Мустафина, которая включает позитивное использование опыта негативных событий, а также применение оригинальных задач-рассказов и поэтического творчества для развития творческих и естественнонаучных способностей. ...

25 03 2026 12:12:40

НА ПУТИ К ФИЗИЧЕСКИМ ПРИНЦИПАМ БИОЛОГИЧЕСКОЙ ЭВОЛЮЦИИ

НА ПУТИ К ФИЗИЧЕСКИМ ПРИНЦИПАМ БИОЛОГИЧЕСКОЙ ЭВОЛЮЦИИ В экспериментах по микроэволюции генетически модифицированных бактерий (ГМО) при непрерывном культивировании показано, что при переходе от одного стационарного состояния к другому в открытой биологической системе скорость производства энтропии должна возрастать, а не уменьшаться, как следует из основных положений неравновесной термодинамики. С точки зрения термодинамики проточные культуры микроорганизмов – хемостат и турбидостат – это открытые термодинамические системы, способные находиться в устойчивых стационарных состояниях. Причем, в соответствии с классификацией М.Эйгена (1973), хемостат соответствует случаю постоянных потоков, а турбидостат – случаю постоянной организации. Несмотря на кажущееся разнообразие микроэволюционных переходов в двух типах открытых систем при их изучении обнаруживаются общие закономерности. Важнейшей из них является возрастание потока использованной популяциями свободной энергии, и, следовательно, возрастание теплорассеяния и скорости производства энтропии. Результаты свидетельствуют о необходимости дальнейшего развития термодинамической теории открытых биологических систем, дальнейшего изучения общих закономерностей биологического развития. ...

15 03 2026 23:47:39

БЕРЕГИТЕ ТИШИНУ

БЕРЕГИТЕ ТИШИНУ Статья в формате PDF 125 KB...

14 03 2026 23:57:58

МЕДИЦИНСКАЯ ПИЯВКА (HIRUDO MEDICINALIS L.) В КРАСНОДАРСКОМ КРАЕ

МЕДИЦИНСКАЯ ПИЯВКА (HIRUDO MEDICINALIS L.) В КРАСНОДАРСКОМ КРАЕ Медицинская пиявка (Hirudo medicinalis L.) относится к классу пиявок (Hirudinea) подклассу настоящих пиявок (Euhirudinea) отряду челюстных пиявок (Ghathobdellidae), роду Hirudo. Более 30 веков она использовалась человеком как лечебное средство. В России велик опыт клинического применения пиявки (гирудотерапия), его расцветом считаются 18-19 века, когда по экспорту пиявки Россия занимала место, равное злаковым культурам, что являлось существенной статьей дохода государственной казны. В статье показаны оптимальные условия среды для обитания медицинской пиявки и возможные лимитирующие факторы ее распространения и численности. Сегодня основной причиной снижения численности пиявки в Краснодарском крае является антропогенный фактор. Так бpaконьерский вылов Hirudo medicinalis привел к сильному подрыву ее популяции в большинстве районов Краснодарского края, по сравнению с серединой 90-х годов, ее численность снизилась до 10 раз. В 2002 г. губернатором Краснодарского края А.Н. Ткачевым было выпущено постановление №955 «Об изучении и сохранении медицинской пиявки на территории Краснодарского края». Важным условием сохранения медицинской пиявки в нашем крае является введение запрета на ее вылов на территории Ростовской области, куда в последнее время сместились рынки нелегальной торговли пиявкой. Идеальным вариантом стал бы запрет на ловлю пиявки во всем Южном федеральном округе и принятие коллективных мер по ее охране. ...

10 03 2026 3:14:33

Викулина Мария Анатольевна

Викулина Мария Анатольевна Статья в формате PDF 381 KB...

09 03 2026 14:13:21

ВЛИЯНИЕ КРАТКОСРОЧНОЙ ИЗОЛЯЦИИ НА ПОВЕДЕНИЕ КРЫС В ТЕСТЕ «ОТКРЫТОЕ ПОЛЕ»

ВЛИЯНИЕ КРАТКОСРОЧНОЙ ИЗОЛЯЦИИ НА ПОВЕДЕНИЕ КРЫС В ТЕСТЕ «ОТКРЫТОЕ ПОЛЕ» В работе рассматривается влияние краткосрочной изоляции в течение пяти суток на поведение крыс в открытом поле. Показано, что у крыс, находящихся в изоляции, уменьшается время выхода из центра, снижается сумма дефекаций и уринаций. Показатели ориентировочно-исследовательской реакции при повторном тестировании изменялись одинаково у изолированных и групповых крыс. ...

08 03 2026 19:52:21

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::