Отчет о лабораторной работе data Mining по теме




Скачать 251.73 Kb.
НазваниеОтчет о лабораторной работе data Mining по теме
страница1/6
Дата конвертации02.01.2013
Размер251.73 Kb.
ТипОтчет
  1   2   3   4   5   6
Министерство образования и науки Российской Федерации


МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

ЭЛЕКТРОНИКИ И МАТЕМАТИКИ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)


ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ


Data Mining


по теме:

Система анализа данных Weka


______________ И.Игнатьев

подпись, дата


______________ А.Грунау

подпись, дата


Москва 2008

СПИСОК ИСПОЛНИТЕЛЕЙ


Исполнители темы ___________________ Ф.А. Грязьнев

подпись, дата

РЕФЕРАТ

Отчет 33 страниц, 9 рисунка, 1 таблиц.

Объектом исследования является система анализа данных Weka

Цель работы — анализ данных.

В процессе работы проводилась начальная подготовка исходных данных, классификация данных в системе Weka, и поиск ассоциативных правил в исходных данных.

Классификация методом Naive Bayes. 8

Классификация методом ID3. 11

Классификация методом J4.8 (модификация С4.5). 19

Классификация методом SVM. 23

Классификация методом 1R (в системе Weka называется OneRule). 27

Выводы: 29

Суть метода: 30


ЗАДАНИЯ


Задание №1

Модифицировать исходный файл таблицы. Сохранить его в формате .arff


Первоначальным этапом выполнения задания является подготовка данных. Стандартным источником данных является формат ARFF. Поэтому необходимо исходные данные перевести в формат ARFF и модифицировать их.

Модификация состоит в добавлении полей метаданных: в начало файла на отдельных строчках названия зависимости @relation имя, описания атрибутов @attribute имя тип и @data перед началом самих данных. Типы данных следующие: численные (numeric, real, integer), перечислимые(nominal) (задаются перечислением вида {i1, ..., in}), строковые (string), дата (date [date format]).

Рис1.


На Рис.1 показан измененный файл, сохраненный в формате ARFF.


В нем, в начало файла, были добавлены следующие строки:

1.@relation Fedor – название зависимости;

2. Далее были перечислены все используемые атрибуты @attribute следующих типов: numeric – численные данные (например – атрибут age – возраст), nominal – перечислимые (например атрибут workclass, имеющий значения {Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked});

3. И перед началом самих данных – строка @data.


Задание №2

Классифицировать исходные данные наивным байесовским методом, методом J4.8 (модификация С4.5), методом ID3, методом 1R, методом SVM (в среде Weka он называется SMO). В случае невозможности применить метод к данным воспользоваться фильтрами. Описать полученные результаты.


Файл *.arff необходимо загрузить в систему. Это делается при помощи кнопки Open File вкладки Preprocess. На данной вкладке можно загрузить файл в систему, а затем редактировать загруженные данные. Редактирование может осуществляться как вручную, так и наложением на данные фильтра для их очищения и/или трансформации. Фильтры необходимы для модификации данных таким образом чтобы стало возможно применение различных методов. Так, например, некоторые методы могут работать только с перечислимым типом данных. Для этого при помощи фильтра RemoveType можно убрать из набора данные неподходящих типов.

Рис.2

На Рис.2 показано главное меню Weka Explorer.


Во складке Classify при помощи кнопки Choose выбирается метод классификации. После выбора метода классификации (классификатора, classifier) необходимо выбрать метод проверки. Основным методом является кросс-проверка (cross-validation), однако можно также проводить проверку результатов анализа на обучающем множестве(training set), на специальном тестовом множестве (supplied test set) и на тестовой части обучающего множества (Percentage Split).


В нашем случае методом проверки является кросс-проверка. Суть ее в том что исходный набор данных в какой-либо пропорции разбивается на обучающее и проверочное множества. Далее по обучающему множеству данные классифицируются, а по проверочному проверяются. Таким образом и вычисляется ошибка.


После этого нажимается кнопка Start. По завершении анализа заполнится окно Output и добавится новая запись в окно Result.


  1   2   3   4   5   6

Добавить в свой блог или на сайт

Похожие:

Отчет о лабораторной работе data Mining по теме iconМетодические указания к лабораторной работе
Поиск литературных источников по теме курсового проектирования: Методические указания к лабораторной работе / О. Е. Александров...

Отчет о лабораторной работе data Mining по теме iconThe Application of Data Mining Technologies

Отчет о лабораторной работе data Mining по теме iconData Mining: Digging For Answers

Отчет о лабораторной работе data Mining по теме iconState-of-the-Art Geographical Data Mining

Отчет о лабораторной работе data Mining по теме iconAn Evaluation of the Use of Data Mining in Counter-Terrorism

Отчет о лабораторной работе data Mining по теме iconОтчет по лабораторной работе № XX
Сокращённое изложение существа работы с применением стандартизированной терминологии. Отражается характер, цель, методика выполнения...

Отчет о лабораторной работе data Mining по теме iconМетодические указания к лабораторной работе №4 Новосибирск 2010 Лабораторная работа посвящена продолжению изучения цифро-аналоговых и аналого-цифровых преобразователей, начатых в «Лабораторной работе №8»
«Лабораторной работе №8» практикума рэл. В методических указаниях более подробно описываются основные типы цап и ацп, объясняется...

Отчет о лабораторной работе data Mining по теме icon52, 1017-1024. Agard, B. and Kusiak, A., (2004a). Data mining based methodology for the design of product families, Int. J. Production Research, 42

Отчет о лабораторной работе data Mining по теме icon2007 Zhang Y, & Patrick J. Extracting Semantics in a Clnical Scenario. Health Knowledge & Data Mining Workshop, Ballarat, Conferences in Research & Practice

Отчет о лабораторной работе data Mining по теме iconРуководство к лабораторной работе №4
Руководство к лабораторной работе №4 "Декодирование циклических кодов" по курсу "Теоретические основы информационно-измерительной...


Разместите кнопку на своём сайте:
lib.convdocs.org


База данных защищена авторским правом ©lib.convdocs.org 2012
обратиться к администрации
lib.convdocs.org
Главная страница