Submit to FacebookSubmit to Google PlusSubmit to TwitterSubmit to LinkedIn

ΣΕ ΑΝΑΖΗΤΗΣΗ ΑΛΓΟΡΙΘΜΟΥ ΠΟΥ ΘΑ ΠΡΟΒΛΕΠΕΙ ΠΟΙΕΣ ΤΑΙΝΙΕΣ ΠΡΟΤΙΜΟΥΝ ΟΙ ΠΕΛΑΤΕΣ

H NETFLIX είναι ο μεγαλύτερος online παροχέας ενοικίασης ταινιών DVD στις ΗΠΑ. Ο χρήστης μπορεί να επιλέξει την ταινία που θέλει να δει μέσω του υπολογιστή του και να την παραλάβει στο σπίτι του με κούριερ.

Η εταιρεία θέλησε να βοηθήσει τους πελάτες τις να επιλέγουν ταινίες της αρεσκείας τους, ανάμεσα στις χιλιάδες που διαθέτει, στηριζόμενη στο ιστορικό προηγούμενων ενοικιάσεων. Για το σκοπό αυτό, προκήρυξε διαγωνισμό, δίνοντας τη δυνατότητα επεξεργασίας της τεράστιας βάσης δεδομένων της (με 100.000.000 αξιολογήσεις, 500.000 πελάτες και 18.000 ταινίες) στους επιστήμονες που θα προσπαθούσαν να βελτιώσουν την ακρίβεια του συστήματος υπόδειξης ταινιών κατά 10% και άνω.

Η ερευνητική ομάδα του Επίκουρου Καθηγητή Πληροφορικής του Πανεπιστημίου Αιγαίου, κ. Νικόλαου Αμπαζή, σε συνεργασία με άλλες δύο υψηλόβαθμες ομάδες, κατέλαβε το 2009 τη 2η θέση στον παγκόσμιο διαγωνισμό ανάλυσης δεδομένων.

Εφαρμογή αναλυτικών τεχνικών και μηχανικής μάθησης για την επίλυση προβλημάτων εξόρυξης δεδομένων μεγάλης κλίμακας

ΑΠΟΚΤΩΝΤΑΣ ΠΡΟΗΓΜΕΝΗ ΤΕΧΝΟΓΝΩΣΙΑ

O διαγωνισμός για το βραβείο Netflix υπήρξε εξαιρετικά σημαντικός για την έρευνα στον τομέα της Πληροφορικής, καθώς το σύνολο των δεδομένων που έγινε δημοσίως διαθέσιμο ξεπέρασε κατά πολύ όλα τα υπόλοιπα σύνολα που είχε ως τώρα στη διάθεσή της η επιστημονική κοινότητα. Η αντιμετώπιση της πρόκλησης αυτής απαιτούσε τεχνογνωσία στη διαχείριση δεδομένων, τη χρήση προηγμένων προσαρμοστικών και μη-γραμμικών μοντέλων μηχανικής μάθησης, αλλά και σημαντικές καινοτομίες στον "ευφυή" συνδυασμό διαφορετικών μοντέλων.

Ο πίνακας των πελατών της εταιρείας ήταν ιδιαίτερα αραιός (μόνο στο 1% του συνόλου του περιείχε αξιολογήσεις καθώς οι περισσότεροι πελάτες είχαν αξιολογήσει ελάχιστες ταινίες). Οι αξιολογήσεις έπρεπε να θεωρηθούν τόσο ως μεταβλητές πρόβλεψης όσο και ως εξαρτημένες μεταβλητές. Η υπέρβαση του φράγματος του 10% σήμαινε την ανάγκη διεύρυνσης των ορίων των υφιστάμενων τεχνικών μοντελοποίησης σε σημαντικό βαθμό.

Η ομάδα του κ. Αμπαζή, αποτελούμενη μόνο από τον ίδιο και τον συνεργάτη του Γεώργιο Τσάγκα, ερευνητή, κατά τα 2,5 χρόνια που ασχολήθηκε ως αυτόνομη ομάδα ("Feeds2") με επίκεντρο το πρόβλημα, είχε αναπτύξει πολλές πρωτοποριακές τεχνικές και μοντέλα συνδυασμού τους. Σε συνεργασία με άλλες δύο υψηλόβαθμες ομάδες δημιούργησαν την ομάδα "The Ensemble", όπου διαπιστώθηκε πως η μοντελοποίηση τους μπορεί να συμβάλλει σημαντικά στην κατανόηση των προβλημάτων των επιχειρήσεων, τη δυναμική των αγορών, και την πρόβλεψη της συμπεριφοράς.

Διάκριση για το βραβείο ανάλυσης δεδομένων Netflix Prize, 2009

Η ομάδα του κ. Αμπαζή ως ιδρυτικό μέλος της ομάδας “ The Ensemble”, κατέλαβε την 2η θέση, αν και ισόβαθμη με την ομάδα που κατέκτησε την 1η θέση με ποσοστό 10.06%, γιατί κατέθεσε τα αποτελέσματα 20 λεπτά αργότερα. Ως αυτόνομη ομάδα, "Feeds2", κατετάγη τελικώς στην 3η θέση του διαγωνισμού.

Ο διαγωνισμός για το βραβείο Netflix , με χρηματικό έπαθλο $1 εκατομμύριο δολάρια, διήρκεσε για περισσότερο από 2,5 χρόνια, προσέλκυσε περισσότερες από 50.000 εγγεγραμμένες ομάδες αποτελούμενες από επιστήμονες πληροφορικής και μαθηματικούς από περισσότερες από 186 διαφορετικές χώρες.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

Νικόλαος Αμπαζής, Επίκουρος Καθηγητής, Εργαστήριο Ευφυούς Εξερεύνησης και Ανάλυσης Δεδομένων - IDEAL, στο Τμήμα Μηχανικών Οικονομίας και Διοίκησης

Γιώργος Τσάγκας, Ερευνητής

http://the-ensemble.com/ http://www.netflixprize.com/leaderboard http://labs.fme.aegean.gr/ideal/