Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Верификация и проверка получившихся результатов.




Интерпретация автоматически полученных знаний человеком в целях их использования для принятия решений, добавление получившихся правил и зависимостей в базы знаний и т.д.

Типы закономерностей

Выделяют пять стандартных типов закономерностей:

Классификация. Она позволяет выявить признаки, характеризующие однотипные группы объектов – классы, чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Ключевым моментом выполнения этой задачи является анализ множества классифицированных объектов. Наиболее типичным примером использования классификации – конкурентная борьба между поставщиками товаров и услуг за определенные группы клиентов.

Кластеризация. Логически продолжает идею классификации на более сложный случай, когда сами классы не определены.

Выявление ассоциаций. Имеет место между двумя или несколькими одновременно наступающими событиями. При этом производимые правила указывают на то, что при наступлении одного события с той или иной степенью вероятности наступает другое.

Выявление последовательностей. Подобно ассоциациям, последовательности имеют место между двумя событиями, но наступающими не одновременно, а с некоторым определенным разрывом во времени. Таким образом, ассоциация есть частный случай последовательности с нулевым временным шагом.

Прогнозирование. Это особая форма предсказания, которая на основе особенностей поведения из текущих и исторических данных оценивает будущие значения определенных численных показателей.

Методы Data Mining

Кластеризация

Позволяет разделить изучаемую совокупность объектов на группы «схожих» объектов, разнести записи в различные группы, или сегменты.

К недостаткам кластеризации следует отнести зависимость результатов от выбранного метода кластеризации и методы кластерного анализа не дают какого-либо способа для проверки достоверности разбиения на кластеры.

Ассоциация

Ассоциация, или метод «корзины покупателя», является одним из вариантов кластеризации, используемым для поиска групп характеристик, наблюдаемых одновременно. Анализ ассоциации имеет смысл в том случае, если несколько событий связаны друг с другом. имеют форму:

если {условие}, то {результат}.

Примером такого правила, служит утверждение, что абонент, использующий услугу А, будет использовать услугу Б.

Деревья решений

При данном методе правила представляются в виде последовательной иерархической структуры, называемой деревом решений, при которой каждый уровень дерева включает проверку (test) определённой независимой переменной.

Иерархические структуры деревьев решений весьма наглядны. Их выразительная мощность в значительной степени определяется множеством, в котором ищутся критерии расщепления узлов.

Самыми известными являются See5/C5.0 (Австралия), Clementine (Integral Solutions,Великобритания), SIPINA (University of Lyon, Франция), IDIS (Information Discovery, США), Knowledge SEEKER (ANGOSS, Канада). 4) Метод «ближайших соседей»

Цель данного метода заключается в том, чтобы предсказать значение зависимой переменной для некоторой записи из определенного массива, для которого известны значения как зависимой, так и независимой переменных. Для этого в этом массиве записей, выбирается запись, наиболее «близкая» к той, для которой необходимо сделать предсказание, и она интерпретируется как искомая зависимая переменная.

Примеры систем, использующих данный метод, – КАТЕ tools (Acknosoft, Франция), Pattern Recognition Workbench (Unica, США).

Нейронные сети

Нейронная сеть представляет из себя структуру, состоящую из узлов и связей между ними. Причем, для того чтобы данную сеть можно было бы применять в дальнейшем, её прежде надо «настроить» с использованием полученных ранее данных, содержащих значения входных и выходных параметров (правильные ответы). Настройка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам.

Основной недостаток, сдерживающий использование нейронных сетей для извлечения знаний – их «непрозрачность». Построенная модель, как правило, не имеет четкой интерпретации (концепции «черного ящика»). Примеры нейросетевых систем – BrainMaker (CSS), NeuroShell (Ward Systems Group), OWL (HyperLogic). Стоимость их довольно значительна: 00 – 00.

Нечеткая логика

Нечеткая логика применяется для анализа таких наборов данных, когда невозможно причислить данные к какой-либо группе и возникает необходимость манипулировать категорией «может быть» в дополнении к «да» и «нет».

Генетические алгоритмы

Генетические алгоритмы обладают ярко выраженным свойством создания нового знания. Интуитивный анализ генетического алгоритма помогает выявить аналогии между искусственной генетической системой и свойственными человеческому интеллекту процессами, обычно называемыми творческими и инновационными (направленными на создание новшеств).

Одним из недостатком данного метода заключается в том, что критерий отбора хромосом и используемые процедуры являются эвристическими и далеко не гарантируют нахождения «лучшего» решения. Это становится особенно заметным при решении высокоразмерных задач со сложными внутренними связями.

Эволюционное программирование

Основная идея этого метода состоит в формировании гипотез о зависимости целевой переменной от других переменных в виде автоматически синтезируемых программ, выраженных на внутреннем языке программирования. Использование универсального языка программирования позволяет выразить практически любую зависимость или алгоритм.

МОДУЛЬ 4. СЕТИ И ЗАЩИТА ИНФОРМАЦИИ

ТЕМА 7. Сети и телекоммуникации

План лекции

Устройства передачи данных.

Типы сетей. Стековые протоколы: TCP/IP, OSI.

Локальные и глобальные сети.

Телекоммуникационные технологии.

Устройства передачи данных.

Передача данных (обмен данными, цифровая передача, цифровая связь) — физический перенос данных (цифрового битового потока) в виде сигналов от точки к точке или от точки к нескольким точкам средствами электросвязи по каналу передачи данных, как правило, для последующей обработки средствами вычислительной техники. Примерами подобных каналов могут служить медные провода, ВОЛС, беспроводные каналы передачи данных или запоминающее устройство.

Передача данных может быть аналоговой или цифровой (то есть поток двоичных сигналов), а также модулирован посредством аналоговой модуляции, либо посредством цифрового кодирования.

Для подключения компьютеров к среде передачи используются специализированные устройства. Основными функциями этих устройств является физическое кодирование и декодирование данных, а также синхронизация приема и передачи. Наряду с этим современные устройства могут решать задачи логической организации передачи, относящиеся к канальному уровню модели OSI. Наиболее известными в настоящее время устройствами являются модемы и сетевые адаптеры.

Модем (МОдулятор/ДЕМодулятор, Modem) представляет собой устройство, осуществляющее физическое кодирование данных методом модуляции. Существуют различные типы модемов для подключения к сетям по разным физическим каналам, как правило, не предназначенным для построения компьютерных сетей. Так, для подключения по телефонным линиям используются телефонные модемы (или - просто модемы, поскольку исторически под этим термином понималось устройство для подключения по телефонным линиям), для подключения по кабельным каналам - кабельные модемы, для подключения по радиоканалам - радиомодемы. Технические характеристики используемого канала накладывают ограничения на правила формирования сигналов (модуляции).

Обычно модемы используются для взаимодействия в сетях типа "точка-точка". В таких сетях не требуется сложной логической организации передачи, поскольку нет необходимости упорядочивать взаимодействие нескольких пар абонентов. К числу дополнительных функций, связанных с организацией передачи, можно отнести сжатие передаваемых данных и обнаружение и исправление ошибок с целью повышения эффективности и надежности передачи по низкокачественным каналам, например, телефонных.

Сетевой адаптер (сетевая плата, плата сетевого интерфейса, Network Interface Card) - это устройство, которое предназначено для подключения компьютера к высококачественным физическим каналам компьютерных сетей. Поэтому для физического кодирования передаваемых данных используются различные типы цифрового кодирования.

Поскольку компьютерные сети могут иметь сложные топологии? и в них одновременно могут осуществлять взаимодействие несколько пар абонентов, то требуется решать достаточно сложные задачи по упорядочиванию этого взаимодействия. Поэтому сетевые адаптеры реализуют также определенное число логических функций организации взаимодействия, например, адресации абонентов и упорядочивания одновременного доступа нескольких к общей физической линии и т.д.










Последнее изменение этой страницы: 2018-05-10; просмотров: 244.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...