Ders Detayı
Ders Tanımı
Ders | Kodu | Yarıyıl | T+U Saat | Kredi | AKTS |
---|---|---|---|---|---|
VERİ MADENCİLİĞİ VE BÜYÜK VERİ KULLANIMI | EPDD1213141 | Bahar Dönemi | 2+2 | 3 | 6 |
Ders Programı |
Ön Koşul Dersleri | |
Önerilen Seçmeli Dersler |
Dersin Dili | Türkçe |
Dersin Seviyesi | Doktora |
Dersin Türü | Zorunlu |
Dersin Koordinatörü | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersi Verenler | Dr.Öğr.Üye. İlker KÖSE |
Dersin Yardımcıları | |
Dersin Amacı | Öğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği modllerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir. |
Dersin İçeriği | Bu ders; Veri Madenciliğine Giriş ,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) ,Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) ,Birliktelik Analizi ,Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) ,Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) ,Regresyon ve Lojistik Regresyon ,Yapay sinir Ağları (çalışma prensibi, Hyperparameters) ,Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi,Proje Sunumları - Değerlendirme ; konularını içermektedir. |
Dersin Öğrenme Kazanımları | Öğretim Yöntemleri | Ölçme Yöntemleri |
1. Veri Tabanından veri ambarı üretebilecektir. | ||
1.1. Veri Madenciliğini açıklar. | ||
1.2. Veri Ambarını tanımlar. | ||
1.3. Designs the Star Data Warehouse Model. | ||
1.4. Ana tablolar birliği veri ambarı modelini tasarlar. | ||
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir. | ||
2.1. Veri Madenciliği Modellerini tanımlar. | ||
3. Sınıflandırma modelini uygulayabilecektir | ||
3.1. Denetimli öğrenmeyi tanımlar. | ||
3.2. Sınıf kavramını belirler. | ||
3.3. Karar ağacı algoritmalarını tanımlar. | ||
4. Kümeleme modelini uygulayabilecektir. | ||
4.1. Denetimsiz Öğrenmeyi tanımlar. | ||
4.2. Kümeleme kavramını açıklar. | ||
5. Bağlantı analizi modelini uygulayabilecektir. | ||
5.1. Bağlantı analizi kurallarını yorumlar. |
Öğretim Yöntemleri: | |
Ölçme Yöntemleri: |
Ders Akışı
Sıra | Konular | Ön Hazırlık |
---|---|---|
1 | Veri Madenciliğine Giriş | |
2 | Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar | |
3 | Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) | |
4 | Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) | |
5 | Birliktelik Analizi | |
6 | Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset) | Veri setini gözden geçir |
7 | Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) | |
8 | Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) | Veri setini gözden geçir |
9 | Regresyon ve Lojistik Regresyon | |
10 | Yapay sinir Ağları (çalışma prensibi, Hyperparameters) | |
11 | Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer) | |
12 | Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN) | |
13 | Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi | |
14 | Proje Sunumları - Değerlendirme |
Kaynak |
1. Data Mining Introductory and Advanced Topics, Margaret H. Dunham, Prentice Hall. Knime Application: https://docs.knime.com/ |
1. Data Mining Concepts and Techniques , J. Han & M. Kamber, Morgan Kaufman. 2. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results , Bernard Marr, Wiley, 2016 3. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, Cathy O'Neil ,2017 4. Naked Statistics: Stripping the Dread from the Data, Charles Wheelan, 2013 5. Kavram ve Algoritmalarıyla Temel Veri Madenciliği, Gökhan Silahtaroğlu, Papatya Yayıncılık. |
Dersin Program Yeterliliklerine Katkısı
Dersin Program Yeterliliklerine Katkısı | |||||||
No | Program Yeterliliği | Katkı Düzeyi | |||||
1 | 2 | 3 | 4 | 5 | |||
1 | Hedef popülasyonun, uygun kaynak ve çalışma popülasyonlarının, yeterli maruziyetin, sonuçların ve ortak değişken değerlendirmelerinin belirlenmesi de dahil olmak üzere bu sorunun yanıtlanmasına yardımcı olacak bir epidemiyolojik araştırma tasarlar | X | |||||
2 | Epidemiyoloji metodolojisinde kavramsal bir çerçeve geliştirir | ||||||
3 | Tasarım ve analiz aşamalarında karıştırıcılar ve bias gibi çalışmanın sonucunu etkileyen faktörleri ele alır | X | |||||
4 | Bias ve değişkenlik içeren karmaşık mekanizmaların etkilerini yorumlar. | ||||||
5 | Uygun olan temel istatistiksel kavramları ve yöntemleri uygular | X | |||||
6 | İstatistiksel verileri açıklar | X | |||||
7 | Klinik araştırma yürütmek için bir plan geliştirir | ||||||
8 | Randomize tasarımlarda nedensel etkileri tahmin etmeye yönelik yöntemleri ve randomizasyona alternatif tasarımları değerlendirir | ||||||
9 | Eşitsizliğin ölçülme yollarının ve bu ölçümlerin verilerin yorumlanmasını nasıl etkilediğinin kritiğini yapar | X | |||||
10 | Hastalık tarama yöntemlerini yorumlama becerisi geliştirir | ||||||
11 | Epidemiyoloji metodolojisine ilişkin olanlar da dahil olmak üzere araştırma önerilerinin yeterliliğini ve bilimsel değerini eleştirel bir şekilde değerlendirir. | ||||||
12 | İnsan hastalıklarının fizyolojisi ve patofizyolojisi hakkındaki bilgilerini epidemiyolojik çalışmalara uygular. | ||||||
13 | Belirli sağlık durumlarının nedenlerini araştırır | ||||||
14 | Hastalıkların gidişatını tahmin eder | X | |||||
15 | Araştırma bulgularını daha geniş bakış açısıyla, politika bağlamında yorumlar | X | |||||
16 | Halk sağlığı ve klinik sorunlara yönelik geçerli ve etkili protokoller tasarlamak için bir temel geliştirir. | X | |||||
17 | Bulaşıcı ve bulaşıcı olmayan hastalıkların epidemiyolojisi hakkında temel bilgi geliştirir |
Değerlendirme Sistemi
Katkı Düzeyi | Mutlak Değerlendirme | |
Ara Sınavın Başarıya Oranı | 50 | |
Genel Sınavın Başarıya Oranı | 50 | |
Toplam | 100 |
AKTS / İşyükü Tablosu | ||||||
Etkinlik | Sayı | Süresi (Saat) | Toplam İş Yükü (Saat) | |||
Ders Saati | 14 | 3 | 42 | |||
Rehberli Problem Çözme | 2 | 5 | 10 | |||
Problem Çözümü / Ödev / Proje / Rapor Tanzimi | 10 | 7 | 70 | |||
Okul Dışı Diğer Faaliyetler | 0 | 0 | 0 | |||
Proje Sunumu / Seminer | 2 | 5 | 10 | |||
Proje Sunumu / Seminer | 3 | 5 | 15 | |||
Kısa Sınav (QUİZ) ve Hazırlığı | 0 | 0 | 0 | |||
Ara Sınav ve Hazırlığı | 1 | 10 | 10 | |||
Genel Sınav ve Hazırlığı | 1 | 10 | 10 | |||
Performans Görevi, Bakım Planı | 0 | 0 | 0 | |||
Toplam İş Yükü (Saat) | 167 | |||||
Dersin AKTS Kredisi = Toplam İş Yükü (Saat)/30*=(167/30) | 6 | |||||
Dersin AKTS Kredisi: *30 saatlik çalışma 1 AKTS kredisi sayılmaktadır. |
Dersin Detaylı Bilgileri
Ders Tanımı
Ders | Kodu | Yarıyıl | T+U Saat | Kredi | AKTS |
---|---|---|---|---|---|
VERİ MADENCİLİĞİ VE BÜYÜK VERİ KULLANIMI | EPDD1213141 | Bahar Dönemi | 2+2 | 3 | 6 |
Ders Programı |
Ön Koşul Dersleri | |
Önerilen Seçmeli Dersler |
Dersin Dili | Türkçe |
Dersin Seviyesi | Doktora |
Dersin Türü | Zorunlu |
Dersin Koordinatörü | Prof.Dr. Gökhan SİLAHTAROĞLU |
Dersi Verenler | Dr.Öğr.Üye. İlker KÖSE |
Dersin Yardımcıları | |
Dersin Amacı | Öğrencilere veri tabanlarından veri ambarı yaratarak, bu veri ambarları üzerinde OLAP ve veri madenciliği modllerini kullanarak araştırma becerisi kazandırmak ve veri madenciliği algoritmalarını kod düzeyinde uygulayabilecek bilgi düzeyine getimektir. |
Dersin İçeriği | Bu ders; Veri Madenciliğine Giriş ,Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar,Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) ,Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) ,Birliktelik Analizi ,Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset),Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) ,Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) ,Regresyon ve Lojistik Regresyon ,Yapay sinir Ağları (çalışma prensibi, Hyperparameters) ,Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer),Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN),Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi,Proje Sunumları - Değerlendirme ; konularını içermektedir. |
Dersin Öğrenme Kazanımları | Öğretim Yöntemleri | Ölçme Yöntemleri |
1. Veri Tabanından veri ambarı üretebilecektir. | ||
1.1. Veri Madenciliğini açıklar. | ||
1.2. Veri Ambarını tanımlar. | ||
1.3. Designs the Star Data Warehouse Model. | ||
1.4. Ana tablolar birliği veri ambarı modelini tasarlar. | ||
2. Veri Madenciliği Modellerini birbirleriyle ilişkilendirebilecektir. | ||
2.1. Veri Madenciliği Modellerini tanımlar. | ||
3. Sınıflandırma modelini uygulayabilecektir | ||
3.1. Denetimli öğrenmeyi tanımlar. | ||
3.2. Sınıf kavramını belirler. | ||
3.3. Karar ağacı algoritmalarını tanımlar. | ||
4. Kümeleme modelini uygulayabilecektir. | ||
4.1. Denetimsiz Öğrenmeyi tanımlar. | ||
4.2. Kümeleme kavramını açıklar. | ||
5. Bağlantı analizi modelini uygulayabilecektir. | ||
5.1. Bağlantı analizi kurallarını yorumlar. |
Öğretim Yöntemleri: | |
Ölçme Yöntemleri: |
Ders Akışı
Sıra | Konular | Ön Hazırlık |
---|---|---|
1 | Veri Madenciliğine Giriş | |
2 | Veri Ambarı –OLAP – ETL süreci – Veri Ambarı ve Veri Tabanı arasında farklılıklar | |
3 | Veri Madenciliğinde Kullanılan Araçlar: Python, R, KNIME, pivoting.(KNIME Kurulumu, Arayüz, Veri okuma ve görüntüleme) | |
4 | Veri önişlemleri (Uc veriler, Kayıp veriler, Normalizasyon, Değişken Dönüşümü, Binning Histogram) | |
5 | Birliktelik Analizi | |
6 | Denetimli Öğrenme, Sınıflandırma (Classification) Ve Karar Ağaçları, Gini / Entropy Kısa tanıtım (Uygulama: acute Inflammation Dataset) | Veri setini gözden geçir |
7 | Karar Ağaçları (Devam) (İLAC ve Wine uygulamaları :, Java Snippet, filtreleme, , train-test, validation, accuracy, Color Manager) | |
8 | Random Forest, Booststrapping, Ensemble Learning (Parfüm Uygulaması + akut pankreatit Uygulaması) | Veri setini gözden geçir |
9 | Regresyon ve Lojistik Regresyon | |
10 | Yapay sinir Ağları (çalışma prensibi, Hyperparameters) | |
11 | Denetimsiz Öğrenme / Kümeleme (Uygulama: Wholesale Customer Data, fuzzy c-means ve kalite ölçümleri, Entropy Scorer) | |
12 | Boyut İndirgeme, Sentetik Veri üretimi , PCA, Scatter Plot ile kümeleme (DBSCAN) | |
13 | Büyük Veri Konseptleri –CNN ve Sağlıkta İmaj ile Veri Analizi | |
14 | Proje Sunumları - Değerlendirme |
Kaynak |
1. Data Mining Introductory and Advanced Topics, Margaret H. Dunham, Prentice Hall. Knime Application: https://docs.knime.com/ |
1. Data Mining Concepts and Techniques , J. Han & M. Kamber, Morgan Kaufman. 2. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results , Bernard Marr, Wiley, 2016 3. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, Cathy O'Neil ,2017 4. Naked Statistics: Stripping the Dread from the Data, Charles Wheelan, 2013 5. Kavram ve Algoritmalarıyla Temel Veri Madenciliği, Gökhan Silahtaroğlu, Papatya Yayıncılık. |
Dersin Program Yeterliliklerine Katkısı
Dersin Program Yeterliliklerine Katkısı | |||||||
No | Program Yeterliliği | Katkı Düzeyi | |||||
1 | 2 | 3 | 4 | 5 | |||
1 | Hedef popülasyonun, uygun kaynak ve çalışma popülasyonlarının, yeterli maruziyetin, sonuçların ve ortak değişken değerlendirmelerinin belirlenmesi de dahil olmak üzere bu sorunun yanıtlanmasına yardımcı olacak bir epidemiyolojik araştırma tasarlar | X | |||||
2 | Epidemiyoloji metodolojisinde kavramsal bir çerçeve geliştirir | ||||||
3 | Tasarım ve analiz aşamalarında karıştırıcılar ve bias gibi çalışmanın sonucunu etkileyen faktörleri ele alır | X | |||||
4 | Bias ve değişkenlik içeren karmaşık mekanizmaların etkilerini yorumlar. | ||||||
5 | Uygun olan temel istatistiksel kavramları ve yöntemleri uygular | X | |||||
6 | İstatistiksel verileri açıklar | X | |||||
7 | Klinik araştırma yürütmek için bir plan geliştirir | ||||||
8 | Randomize tasarımlarda nedensel etkileri tahmin etmeye yönelik yöntemleri ve randomizasyona alternatif tasarımları değerlendirir | ||||||
9 | Eşitsizliğin ölçülme yollarının ve bu ölçümlerin verilerin yorumlanmasını nasıl etkilediğinin kritiğini yapar | X | |||||
10 | Hastalık tarama yöntemlerini yorumlama becerisi geliştirir | ||||||
11 | Epidemiyoloji metodolojisine ilişkin olanlar da dahil olmak üzere araştırma önerilerinin yeterliliğini ve bilimsel değerini eleştirel bir şekilde değerlendirir. | ||||||
12 | İnsan hastalıklarının fizyolojisi ve patofizyolojisi hakkındaki bilgilerini epidemiyolojik çalışmalara uygular. | ||||||
13 | Belirli sağlık durumlarının nedenlerini araştırır | ||||||
14 | Hastalıkların gidişatını tahmin eder | X | |||||
15 | Araştırma bulgularını daha geniş bakış açısıyla, politika bağlamında yorumlar | X | |||||
16 | Halk sağlığı ve klinik sorunlara yönelik geçerli ve etkili protokoller tasarlamak için bir temel geliştirir. | X | |||||
17 | Bulaşıcı ve bulaşıcı olmayan hastalıkların epidemiyolojisi hakkında temel bilgi geliştirir |
Değerlendirme Sistemi
Katkı Düzeyi | Mutlak Değerlendirme | |
Ara Sınavın Başarıya Oranı | 50 | |
Genel Sınavın Başarıya Oranı | 50 | |
Toplam | 100 |