1. BÖLÜM: VERİ MADENCİLİĞİNE GİRİŞ
13
1.1. Veri Madenciliği ve Karar Destek Sistemi
15
1.2. Veri Madenciliğinde Verinin Büyüklüğü
16
1.3. Veri Madenciliğinin Önemi ve İlişkili Olduğu Alanlar
17
1.4. Veri Madenciliğinin Kullanım Alanları
18
1.5. Veri Madenciliği ile İstatistik Arasındaki İlişki
22
1.6. Veri Madenciliğinde Sıklıkla Karşılaşılan Sorular
25
2. BÖLÜM: VERİ MADENCİLİĞİ VE VERİ TABANI TEKNOLOJİSİ TARİHÇESİ VE İLİŞKİSİ
27
2.2. Veri Madenciliği ve Bilgi Keşif Süreci
28
2.3. Veri Tabanı Teknolojisinin Süreci
29
2.4. Veri Madenciliği Yazılımlarından Bazıları
30
3. BÖLÜM: VERİ MADENCİLİĞİNİN TEMEL GEREKSİNİMLERİ, BİLEŞENLERİ VE VERİ DEPOLARI
37
3.1. Veri Ambarları ve Tarihçesi
39
3.2. Veri Akışı ve Bileşenleri
44
3.3. Veri Ambarları ve Çevrimiçi Analitik İşleme (OLAP – On Line Analytical Processing)
47
3.4. Çok Boyutlu Çevrimiçi Analitik İşleme (MOLAP)
52
3.5. İlişkisel Çevrimiçi Analitik İşleme (ROLAP)
53
4. BÖLÜM: VERİ MADENCİLİĞİ AŞAMALARI
55
4.1. Problemin veya Projenin Tanımlanması
57
4.2. Verilerin Anlaşılması ve Hazırlanması
58
4.2.1. Verilerin Toplanması
58
4.2.2. Verilerin Temizlenmesi
58
4.2.3. Verilerin Bütünleştirilmesi
59
4.2.4. Verilerin Dönüştürülmesi
59
4.2.5. Verilerin İndirgenmesi
59
4.3. Modelin Kurulması
59
4.4. Modelin Değerlendirmesi
62
4.5. Model Sonuçlarının Karar Verici Tarafından Kullanılması
63
4.6. Modelin İzlenmesi
63
5. BÖLÜM: VERİ MADENCİLİĞİ MODELLERİ
65
5.1. Tahmin Edici Amaçlı Modeller
65
5.1.1. Bayes Sınıflandırma Algoritması
67
5.1.2. Genetik Algoritmalar
67
5.1.3. Çoklu Doğrusal Regresyon Analizi
68
5.1.4. Yapay Sinir Ağları
68
5.1.5.1. Karar Ağaçlarında Dallanma ve Budama Kriterleri
71
5.1.5.2. Karar Ağacı Algoritmaları
74
5.2. Kümeleme Amaçlı Modeller
77
5.2.1. Kümeleme Yöntemleri
79
5.2.2. Kümelemede Kullanılan Uzaklıkların Hesaplanması
80
5.2.3. K–Ortalamalar Kümeleme Metodu
83
5.2.4. İki Aşamalı Kümeleme
83
5.3. Birliktelik Kuralları
85
6. BÖLÜM: IBM SPSS MODELER VERİ MADENCİLİĞİ METODOLOJİSİ
87
6.1. IBM SPSS Modeler’de Görsel Programlama Arayüzü
87
6.2. IBM SPSS Modeler Programına Veri Kaynaklarının Bağlantıları
91
6.3. IBM SPSS Modeler Programı ile Veri Hazırlama
115
6.4. Verideki İlişkilerin Araştırılması
137
6.5. IBM SPSS Modeler Programında Kullanılan Modelleme Yöntemlerine İlişkin Örnek Uygulamalar
143
6.5.1. Sınıflayıcı (Öngörüsel) Modellemelere İlişkin Örnek Uygulamalar
143
6.5.1.1. Yapay Sinir Ağı (Neural Network) Uygulama Çalışması
143
6.5.1.2. C5.0 Algoritma Uygulaması
151
6.5.1.3. CRT Algoritması Uygulaması
158
6.5.2. Kümeleyici Yöntemlere İlişkin Örnek Uygulamalar
163
6.5.2.1. K–Means Kümeleme Yöntemine İlişkin Uygulama
163
6.5.2.2. Kohonen Kümeleme Yöntemine İlişkin Uygulama
168
6.5.2.3. İki Aşamalı Kümeleme Uygulaması
175
6.5.3. Birliktelik Kurallarına İlişkin Uygulama
182
6.5.4. APRIORI Algoritmasına İlişkin Uygulama
183
6.5.5. Sınıflayıcı, Kümeleyici ve Birliktelik Kurallarına İlişkin Örnek Uygulama
188
6.5.6. Kümeleyici Modeller, Birliktelik Kuralları ve Sınıflayıcı Modellere İlişkin Örnek Uygulama
205
7. BÖLÜM: WEKA İLE VERİ MADENCİLİĞİ
223
7.1. Weka ile Veri Madenciliği ve Algoritmaları
223
7.2. Weka ile Veri Dosyası Çağırımı
225
7.3. WEKA ile Veri tabanı Bağlantıları
226
7.3.1. WEKA Programından Excel Dosyalarının Okutulması
230
7.4. Weka Veri Madenciliği Arayüzü
234
7.4.1. Explorer Uygulaması
235
7.4.1.1. Verilerin Hazırlanması
236
7.4.1.2. Sınıflayıcı Algoritmaları
237
7.4.1.3. Kümeleyici Algoritmaları
240
7.4.1.4. Birliktelik Kuralları Algoritmaları
243
7.4.1.5. Öznitelik Seçimi
245
7.4.1.6. Görselleştirme
245
7.4.2. “Experimenter” Uygulaması
247
7.4.3. “Knowledge Flow” Uygulaması
248
7.4.4. Simple CLI (Komut Satırı)
249
7.5. WEKA Örnek Uygulama Çalışması–1
250
7.6. WEKA Örnek Uygulama Çalışması–2
263
7.7. WEKA Örnek Uygulama Çalışması–3
268
8. BÖLÜM: STATISTICA DATA MINER, MICROSOFT DATA MINING ADD–INS–EXCEL, RAPIDMINER, WEKA VE IBM SPSS MODELER VERİ MADENCİLİĞİ PROGRAMLARI İLE UYGULAMA
275
8.1. Microsoft Data Mining Add–ins Excel Uygulaması
276
8.2. Rapid–I RapidMiner Uygulaması
281
8.3. Statsoft Statistica Veri Madenciliği Uygulaması
285
8.5. IBM SPSS Modeler Uygulaması
292
9. BÖLÜM: VERİ MADENCİLİĞİNİN GENEL DEĞERLENDİRİLMESİ
297