Επιστήμη των Δεδομένων
Περιγραφή

Περιγραφή δεδομένων με γραφήματα και πίνακες. Παρου­σίαση των βασικών στατιστικών μέτρων για τη περιγραφή δεδομένων. Προετοιμασία Δεδομένων. Η σημασία του ελέγχου και «ξεκαθαρίσματος» των δεδομένων (data cleaning). Εισα­γωγή στις Βάσεις Δεδομένων. SQL Εισαγωγή στην επιβλεπό­μενη μάθηση: δέντρα απόφασης, λογιστική παλινδρόμηση. Εισαγωγή στην παλινδρόμηση: Πολλαπλή γραμμική παλιν­δρόμηση. Προβλέψεις. Βελτίωση ενός μοντέλου. Τα προβλή­ματα της υπερ-παραμετροποίησης (over-parametrization). Έλεγ­χος απόδοσης του μοντέλου. Μείωση Διαστάσεων (Dime­nsionality Reduction). Η διαδικασία επιλογής χαρακτηριστικών. Η μέθοδος των Κύριων Συνιστωσών (Principal Component Analysis) με SVD παραγοντοποιήση μητρώων. Μη-επιβλεπό­μενη μάθηση, Ανάλυση κατά συστάδες (Clustering). Εφαρμογές και αξιολόγηση k-means. Εφαρμογή μοντέλων Ιεραρχικού Clustering. Ημι-επιβλεπόμενη μάθηση. Εισαγωγή στα μετα­δεδομένα και στα Μεγάλα Δεδομένα (Big Data). Υπολογι­στικές Μέθοδοι για Ανάλυση Μεγάλων Δεδομένων (Hadoop και MapReduce).

Εργαστήριο: (i) Εισαγωγή στη γλώσσα R για την Επιστήμη των Δεδομένων. (ii) Δημιουργία, επιλογή και σύγκριση κατη­γορικών δεδομένων με τη χρήση Factors. Αποθήκευση πινάκων δεδομένων σε Data Frames. Επιλογή στοιχείων από ένα Data Frame και μετατροπή σε Πίνακα. (iii) Βασικά πακέτα γραφι­κών/οπτι­κοποίησης στην R. (iv) Συναρτήσεις - Βρόγχοι - Έλεγχος ροής. (v) Εισαγωγή στην SQL. Queries. Queries σε πολλαπλούς πίνακες με την εντολή JOIN. Τελεστές. Subqueries. (vi) Rattle. (vii) R Hadoop.

Τομέας: Υπολογιστικών Μαθηματικών και Πληροφορικής
Πρόγραμμα Σπουδών:
Προπτυχιακό Πρόγραμμα Σπουδών
Εξάμηνο: Ζ
Πιστωτικές Μονάδες (ECTS): 6
Ωρες Διδασκαλίας (Θ/Φ/Ε): 2/0/2
Κωδικός: IC469
Τύπος Μαθήματος: Επιλογής
Κατεύθυνση ΓΝΜ: Ελεύθερης Επιλογής
Κατεύθυνση ΘΡΜ: Ελεύθερης Επιλογής
Κατεύθυνση ΕΦΜ: Ελεύθερης Επιλογής
Κατεύθυνση ΠΛΗ: Ελεύθερης Επιλογής
Κατεύθυνση ΣΠΕ: Ελεύθερης Επιλογής
Φοιτητές Erasmus: Ναι




keyboard_arrow_up