Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Які проблеми виникають з вхідними даними.




Лабораторна робота №3

з дисципліни:

«Інтелектуальний аналіз даних»

Використання інструменту Xelopes для аналізу та рішень щодо отримання іпотечного кредиту

Виконав:

Студент 4 курсу, ФІСІТ,

6101, групи

Прасад А.Н.

                                                           Перевірив:

                                                                                   к.т.н., доц. Іванченко Г.Ф.

 

 

Київ 2011

Задача:

Аналіз та облік надання кредиту.

Мета:

Так, як ми маємодані про відсоткову ставку, період надання , прописка, кредитна історія необхідно визначити, які особи можуть отримати  кредит.

 

Створений файл Roma.arff для роботи з визначення товарів, які необхідно закупити супермаркетом.

Файл поділяється на 2 часті заголовок і дані.

@relation systema_pogshennya.symbolic

@attribute процентная_ставка {высокая, средняя, низкая}

@attribute период_предоставления{десять_лет,двадцать_лет,тридцать_лет}

@attribute прописка {киевская, не_киевская}

@attribute история_клиента {позитивная,негативная,отсутствует}

@attribute ипотечный_кредит {давать,не_давать}   

 

Дані

@data

Высокая,десять_лет,не_киевская,негативная,не_давать

Высокая,двадцать_лет,киевская,негативная,не_давать

Высокая,тридцать_лет,киевская,позитивная,давать

Средняя,двадцать_лет, не_киевская,негативная,не_давать

Средняя,десять_лет,не_киевская,отсутствует,не_давать

Средняя,тридцать_лет,киевская,позитивная,давать

Низкая,тридцать_лет,киевская,позитивная,давать

Низкая,двадцать_лет,не_киевская,негативная,не_давать

Низкая,десять_лет,не_киевская,негативная,не_давать

Высокая,десять_лет,киевская,позитивная,давать

Высокая,двадцать_лет,киевская,позитивная,давать

Средняя,тридцать_лет,киевская,позитивная,давать

Средняя,тридцать_лет,не_киевская,отсутствует,не_давать

Низкая,десять_лет,не_киевская,негативная,не_давать

 

  1. Результат завантаження даних з файлу Roma.arff в Xelopes:

Рис. Відображення даних з файлу Ro,a.arff при використанні Display Data Grid в табличному вигляді

  1. Інформація про атрибути даних

Рис. Інформація категоріальному атрибуті

  1. Статистична інформація про дані:

 

  1. Побудова моделі модель Association Rules Mining Model.

 




Рис. Налаштування для побудови моделі - Association Rules Mining Model


                                           Рис. Association Rules Mining Model      

Представлення моделі в PMML форматі:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE PMML PUBLIC "pmml20.dtd" "pmml20.dtd">

<PMML version="2.0">

<Header copyright="Copyright (c) 2003 prudsys AG" description="Xelopes mining model. See www.zsoft.ru or www.prudsys.com">

   <Application version="1.1" name="Xelopes" />

   <Timestamp>2011-11-29 10:20:15 GMT</Timestamp>

</Header>

<DataDictionary numberOfFields="5">

   <DataField displayName="процентная_ставка" name="процентная_ставка" isCyclic="0" optype="categorical">

       <Value displayValue="высокая" property="valid" value="высокая" />

       <Value displayValue="средняя" property="valid" value="средняя" />

       <Value displayValue="низкая" property="valid" value="низкая" />

   </DataField>

   <DataField displayName="период_предоставления" name="период_предоставления" isCyclic="0" optype="categorical">

       <Value displayValue="десять_лет" property="valid" value="десять_лет" />

       <Value displayValue="двадцать_лет" property="valid" value="двадцать_лет" />

       <Value displayValue="тридцать_лет" property="valid" value="тридцать_лет" />

   </DataField>

    <DataField displayName="прописка" name="прописка" isCyclic="0" optype="categorical">

       <Value displayValue="киевская" property="valid" value="киевская" />

       <Value displayValue="не_киевская" property="valid" value="не_киевская" />

   </DataField>

   <DataField displayName="история_клиента" name="история_клиента" isCyclic="0" optype="categorical">

       <Value displayValue="позитивная" property="valid" value="позитивная" />

       <Value displayValue="негативная" property="valid" value="негативная" />

       <Value displayValue="отсутствует" property="valid" value="отсутствует" />

   </DataField>

   <DataField displayName="ипотечный_кредит" name="ипотечный_кредит" isCyclic="0" optype="categorical">

       <Value displayValue="давать" property="valid" value="давать" />

       <Value displayValue="не_давать" property="valid" value="не_давать" />

   </DataField>

</DataDictionary>

<AssociationModel minimumConfidence="0.0" numberOfRules="12" minimumSupport="0.0" itemIdName="период_предоставления" numberOfTransactions="3" algorithmName="associationRules" numberOfItemsets="7" modelName="Association rules" functionName="associationRules" transactIdName="процентная_ставка" numberOfItems="3">

   <MiningSchema>

       <MiningField missingValueTreatment="asIs" name="процентная_ставка" outliers="asIs" usageType="active" />

       <MiningField missingValueTreatment="asIs" name="период_предоставления" outliers="asIs" usageType="active" />

       <MiningField missingValueTreatment="asIs" name="прописка" outliers="asIs" usageType="supplementary" />

       <MiningField missingValueTreatment="asIs" name="история_клиента" outliers="asIs" usageType="supplementary" />

       <MiningField missingValueTreatment="asIs" name="ипотечный_кредит" outliers="asIs" usageType="supplementary" />

   </MiningSchema>

   <Item value="десять_лет" id="0" />

   <Item value="двадцать_лет" id="1" />

   <Item value="тридцать_лет" id="2" />

   <Itemset numberOfItems="1" support="1.0" id="id1">

       <ItemRef itemRef="0" />

   </Itemset>

   <Itemset numberOfItems="2" support="1.0" id="id2">

       <ItemRef itemRef="0" />

       <ItemRef itemRef="1" />

   </Itemset>

   <Itemset numberOfItems="3" support="1.0" id="id3">

       <ItemRef itemRef="0" />

       <ItemRef itemRef="1" />

       <ItemRef itemRef="2" />

   </Itemset>

   <Itemset numberOfItems="2" support="1.0" id="id4">

       <ItemRef itemRef="0" />

       <ItemRef itemRef="2" />

   </Itemset>

   <Itemset numberOfItems="1" support="1.0" id="id5">

       <ItemRef itemRef="1" />

   </Itemset>

   <Itemset numberOfItems="2" support="1.0" id="id6">

       <ItemRef itemRef="1" />

       <ItemRef itemRef="2" />

   </Itemset>

   <Itemset numberOfItems="1" support="1.0" id="id7">

       <ItemRef itemRef="2" />

   </Itemset>

   <AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id5" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id1" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id6" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id2" antecedent="id7" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id4" antecedent="id5" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id4" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id6" antecedent="id1" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id2" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id1" antecedent="id7" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id1" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id5" antecedent="id7" />

   <AssociationRule confidence="1.0" support="1.0" consequent="id7" antecedent="id5" />

</AssociationModel>

  1. Побудова моделі Decision Tree Mining Model:



Рис. Налаштування для побудови дерев рішень



Рис. Візуалізація моделі дерева рішень

  1. Побудова моделі Hierarchical Clustering Mining Model






Рис. Налаштування для побудови моделі Hierarchical Clustering Mining Model



Рис. Налаштування для побудови моделі Hierarchical Clustering Mining Model





Рис. модель Hierarchical Clustering Mining Model

 

 

Висновок:

При виконанні цієї практичної роботи було отримані навички роботи з бібліотекою data mining алгоритмів Xelopes та прийшов до висновку що при роботі з цією бібліотекою дуже зручно працювати при інтелектуальному аналізі данних.

В цій практичній роботі я вивчив основни побудови Vector Machine Model.

Також при виконанні цієї роботи було вивчено та практично застосовано різні види алгоритмів, виконано застосування різних параметрів налаштування для різних моделей.

 

 

Контрольні питання

Які проблеми виникають з вхідними даними.

Процес підготовки передбачає збір даних для аналізу з різних джерел даних і подання їх у форматі придатному для застосування алгоритмів data mining. Але для цього потрібно слідкувати за правильністю введення данних так, як при некоректному їх введенні відбуваються помилки, що не дають змогу працювати у середовищі Xelopes.










Последнее изменение этой страницы: 2018-04-12; просмотров: 518.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...