Π.Μ.Σ. | Επιστήμη & Τεχνολογία Ηλεκτρολόγου Μηχανικού & Μηχανικού Υπολογιστών |
---|---|
Γνωστικός Τομέας | Ομάδα Σημάτων, Τηλεπικοινωνιών και Δικτύων (ΣΤ) |
Εξάμηνο | Εαρινό |
Τύπος Μαθήματος | Επιλογής |
Μονάδες ECTS | 7,5 |
Εβδομαδιαίες Ώρες Διδασκαλίας | 3 |
Συνιστώμενα |
|
Σελίδα Μαθήματος | https://eclass.uth.gr/courses/E-CE_P_118/ |
Συγγράμματα |
|
Το μάθημα καλύπτει τις βασικές ιδέες, σχετικούς αλγορίθμους, και υπολογιστικά εργαλεία στο πεδίο της όρασης υπολογιστών. Πιο λεπτομερώς, το μάθημα καλύπτει τα παρακάτω:
- Θεμελιακά στοιχεία δυσδιάστατης και τρισδιάστατης γεωμετρίας και γεωμετρικούς μετασχηματισμούς.
- Βασικές ιδέες σχηματισμού εικόνων και λειτουργίας ψηφιακών καμερών.
- Βασικούς αλγόριθμους επεξεργασίας εικόνων, όπως γραμμικό φιλτράρισμα και άλλες πράξεις γειτονικών εικονοστοιχείων, μετασχηματισμό Fourier, και αναπαράσταση εικόνας σε πολλαπλές κλίμακες με χρήση Γκαουσιανών και Λαπλασιανών πυραμίδων.
- Ανίχνευση χαρακτηριστικών και αντιστοίχησή τους μεταξύ εικόνων, χρησιμοποιώντας αλγορίθμους όπως αυτόν του Harris και τον περιγραφέα SIFT, την ανίχνευση ακμών του Canny, τον μετασχηματισμό του Hough, όπως και αποτελεσματικές και ανθεκτικές μεθόδους για αντιστοίχηση χαρακτηριστικών και τον αλγόριθμο RANSAC.
- Εκτίμηση κίνησης και οπτικής ροής σε βίντεο, όπως και μεθόδους παρακολούθησης αντικειμένων όπως ο αλγόριθμος μετατόπισης του μέσου ή της κάμερας, φίλτρο Kalman, και φίλτρα σωματιδίων.
- Στερεοσκοπική όραση, βαθμονόμηση κάμερας (εγγενών και εξωτερικών παραμέτρων), χάρτες ανομοιότητας βάθους, επιπολικούς περιορισμούς, τριγωνισμό, διόρθωση εικόνας, και δομή από κίνηση.
- Αναγνώριση αντικειμένων και κατανόηση σκηνής, χρησιμοποιώντας διάφορους αλγορίθμους ταξινόμησης και ομαδοποίησης, εφαρμοσμένους σε διάφορα προβλήματα όπως η ανίχνευση προσώπου, κατηγορίας αντικειμένου, και κατάτμηση εικόνων.
- Βασικά υπολογιστικά εργαλεία σε Matlab και OpenCV που υλοποιούν στα παραπάνω.
Το μάθημα εισάγει τους φοιτητές στις βασικές έννοιες και αλγορίθμους που εφαρμόζονται σε μοντέρνα συστήματα υπολογιστικής όρασης, παρέχοντας ταυτόχρονα πληθώρα παραδειγμάτων που επιτρέπουν την εξοικείωση των φοιτητών με αυτά, όπως επίσης και πρακτικά υπολογιστικά εργαλεία σε Matlab και OpenCV, επιδεικνύοντας περαιτέρω τα παραπάνω.
Οι φοιτητές που έχουν ολοκληρώσει επιτυχώς το μάθημα θα έχουν αποκτήσει καλή κατανόηση και γνώσεις των κύριων ιδεών, αλγορίθμων, και εργαλείων στην περιοχή της όρασης υπολογιστών. Για παράδειγμα, θα είναι σε θέση να:
- Περιγράψουν σε μαθηματική μορφή τα θεμελιακά στοιχεία δυσδιάστατης και τρισδιάστατης γεωμετρίας και γεωμετρικούς μετασχηματισμούς
- Περιγράψουν τη διαδικασία σχηματισμού εικόνων και λειτουργίας ψηφιακών καμερών.
- Σχεδιάσουν αλγόριθμους επεξεργασίας εικόνων με φιλτράρισμα και αναπαράστασή τους σε πολλαπλές κλίμακες με χρήση Γκαουσιανών και Λαπλασιανών πυραμίδων.
- Ανιχνεύσουν και αναπαραστήσουν σημασιολογικά σημαντικά χαρακτηριστικά εικόνων, χρησιμοποιώντας για παράδειγμα αλγορίθμους όπως αυτόν του ανιχνευτή Harris, περιγραφές SIFT, ανιχνευτές ακμών, μετασχηματισμό Hough, όπως επίσης και να αντιστοιχήσουν χαρακτηριστικά μεταξύ εικόνων, χρησιμοποιώντας αλγορίθμους όπως ελάχιστων τετραγώνων ή τον RANSAC.
- Εκτιμήσουν κίνηση παρακολουθήσουν αντικειμένων σε βίντεο, χρησιμοποιώντας κατάλληλους αλγορίθμους όπως οπτική ροή, μετατόπιση μέσου, και άλλους.
- Περιγράψουν τις βασικές ιδέες στερεοσκοπικής όρασης, εκτιμήσουν παραμέτρους βαθμονόμησης κάμερας, υπολογίσουν χάρτες ανομοιότητας βάθους, και εφαρμόσουν διόρθωση εικόνας και τριγωνισμό.
- Χρησιμοποιήσουν κατάλληλους αλγόριθμους ταξινόμησης και ομαδοποίησης με σκοπό την ανίχνευση αντικειμένων και κατανόηση της σκηνής, με ιδιαίτερη εξοικείωση στα προβλήματα ανίχνευσης προσώπου, κατηγοριοποίησης αντικειμένων, και κατάτμησης εικόνων.
- Υλοποιήσουν κώδικα στα υπολογιστικά περιβάλλοντα του Matlab και OpenCV για την επίτευξη των παραπάνω.
- Παρουσίαση επιστημονικού άρθρου από τα προτεινόμενα περιοδικά βιβλιογραφίας (ατομική εργασία, 25%).
- Υπολογιστική εργασία υλοποίησης αλγορίθμων επεξεργασίας φωνής και λόγου με χρήση κατάλληλων εργαλείων, όπως OpenCV (ομαδική εργασία, 75%).
Τα κριτήρια αξιολόγησης αναρτώνται στην ιστοσελίδα του μαθήματος και είναι, από την αρχή κάθε εξαμήνου, διαθέσιμα στους φοιτητές
Το μάθημα καλύπτει τις βασικές ιδέες, σχετικούς αλγορίθμους, και υπολογιστικά εργαλεία στο πεδίο της όρασης υπολογιστών. Πιο λεπτομερώς, το μάθημα καλύπτει τα παρακάτω:
- Θεμελιακά στοιχεία δυσδιάστατης και τρισδιάστατης γεωμετρίας και γεωμετρικούς μετασχηματισμούς.
- Βασικές ιδέες σχηματισμού εικόνων και λειτουργίας ψηφιακών καμερών.
- Βασικούς αλγόριθμους επεξεργασίας εικόνων, όπως γραμμικό φιλτράρισμα και άλλες πράξεις γειτονικών εικονοστοιχείων, μετασχηματισμό Fourier, και αναπαράσταση εικόνας σε πολλαπλές κλίμακες με χρήση Γκαουσιανών και Λαπλασιανών πυραμίδων.
- Ανίχνευση χαρακτηριστικών και αντιστοίχησή τους μεταξύ εικόνων, χρησιμοποιώντας αλγορίθμους όπως αυτόν του Harris και τον περιγραφέα SIFT, την ανίχνευση ακμών του Canny, τον μετασχηματισμό του Hough, όπως και αποτελεσματικές και ανθεκτικές μεθόδους για αντιστοίχηση χαρακτηριστικών και τον αλγόριθμο RANSAC.
- Εκτίμηση κίνησης και οπτικής ροής σε βίντεο, όπως και μεθόδους παρακολούθησης αντικειμένων όπως ο αλγόριθμος μετατόπισης του μέσου ή της κάμερας, φίλτρο Kalman, και φίλτρα σωματιδίων.
- Στερεοσκοπική όραση, βαθμονόμηση κάμερας (εγγενών και εξωτερικών παραμέτρων), χάρτες ανομοιότητας βάθους, επιπολικούς περιορισμούς, τριγωνισμό, διόρθωση εικόνας, και δομή από κίνηση.
- Αναγνώριση αντικειμένων και κατανόηση σκηνής, χρησιμοποιώντας διάφορους αλγορίθμους ταξινόμησης και ομαδοποίησης, εφαρμοσμένους σε διάφορα προβλήματα όπως η ανίχνευση προσώπου, κατηγορίας αντικειμένου, και κατάτμηση εικόνων.
- Βασικά υπολογιστικά εργαλεία σε Matlab και OpenCV που υλοποιούν στα παραπάνω.
Πρόσφατες Ανακοινώσεις
- 29/04/2025 Volos Summer School of Human Genetics 2025 (VSS 2025)
- 28/04/2025 Καινοτομία με Λύσεις Εμπνευσμένες από το Φύση στην Επαγγελματική Κατάρτιση
- 28/04/2025 1st Scientific Workshop – Fault Modeling and Techniques for Fault Tolerance Analysis
- 24/04/2025 Πρόσκληση στο 1ο Advanced training courses του COIN-3D