Διάκριση ερευνητών του ΙΤΕ για την ανάπτυξη του συστήματος επεξεργασίας ήχου: SSDRC που βελτιώνει την αντίληψη λόγου σε θορυβώδη περιβάλλοντα. | Νέα

Press Releases

31.05.2013

Διάκριση ερευνητών του ΙΤΕ για την ανάπτυξη του συστήματος επεξεργασίας ήχου: SSDRC που βελτιώνει την αντίληψη λόγου σε θορυβώδη περιβάλλοντα.

Ας χαμηλώσουμε τις εντάσεις...

Σύμφωνα με τον Παγκόσμιο Οργανισμό Υγείας[1], ο περιβαλλοντικός θόρυβος που υπάρχει καθημερινά τριγύρω μας υποβαθμίζει σημαντικά την ποιότητα της ζωής μας. Η ανθρώπινη φωνή συγκαταλέγεται στους θορυβοποιούς παράγοντες, όταν στην προσπάθειά της να «ακουστεί», να γίνει αντιληπτός ο λόγος, αυξάνει δραματικά την έντασή της. Τέτοια παραδείγματα είναι οι εκκωφαντικές ανακοινώσεις σε δημόσιους χώρους (σταθμοί τρένων, αεροδρόμια, κτλ.).

Είναι όμως η αύξηση έντασης η μόνη λύση για την αντιμετώπιση αυτού του προβλήματος; Ερευνητές του Ινστιτούτου Πληροφορικής του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ), στο Ηράκλειο της Κρήτης, απέδειξαν ότι αρκεί να γίνει κατάλληλη επεξεργασία του σήματος της φωνής, έτσι ώστε οι «ευάλωτες» στον θόρυβο περιοχές της να προστατευθούν ανάλογα .

Πιο συγκεκριμένα, προτείνουν πρωτοποριακές τεχνικές ανακατανομής της ενέργειας της φωνής στο χρόνο και στη συχνότητα: Στον χώρο του χρόνου, τα τμήματα της φωνής με τη χαμηλή ενέργεια ενισχύονται, ενώ τα αντίστοιχα με υψηλή ενέργεια αποδυναμώνονται. Έτσι, στις περισσότερες περιπτώσεις το επίπεδο του σήματος της φωνής είναι πάνω από το επίπεδο του θορύβου. Επιπλέον, μια δεύτερη ανακατανομή της ενέργειας του σήματος στο χώρο των συχνοτήτων εφαρμόζεται, η οποία μιμείται την τακτική που οι άνθρωποι χρησιμοποιούν ώστε να γίνονται καταληπτοί από τους συνομιλητές τους σε θορυβώδη περιβάλλοντα. Οι ιδέες αυτές υλοποιήθηκαν σε ένα σύστημα: το SSRDC (Spectral Shaping Dynamic Range Compression), χρησιμοποιώντας ηχογραφήσεις ομιλητών σε θορυβώδη περιβάλλοντα.

Σε πρόσφατη αξιολόγηση συστημάτων επεξεργασίας σημάτων φωνής σε θορυβώδη περιβάλλοντα, το SSRDCδιακρίθηκε και κατέλαβε την πρώτη θέση ανάμεσα σε είκοσι επτά άλλα συστήματα ιδίου σκοπού, και κρίθηκε άριστο για τις περισσότερες περιπτώσεις θορύβου που εξετάστηκε.


[1]World Health Organisation (2011). Burden of disease from environmental noise. Quantification of healthy life years lost in Europe.

Τα αποτελέσματα χρήσης του δείχνουν ότι η κατανόηση λόγου μπορεί να αυξηθεί σημαντικά (πάνω από 35%), χωρίς να χρειαστεί να μεγαλώσει αντίστοιχα η ένταση της φωνής για να καλυφτεί ο περιβαλλοντικός θόρυβος. Τα επίσημα αποτελέσματα των αξιολογήσεων θα ανακοινωθούν στο διεθνές συνέδριο Interspeech2013, τον Αύγουστο του 2013, στη Λιόν της Γαλλίας. (Δείγματα επεξεργασμένης φωνής από τα παραπάνω συστήματα υπάρχουν στην ιστοσελίδα: http://listening-talker.org/showcase/).

Το σύστημα SSRDC ήδη χρησιμοποιείται ερευνητικά και εξετάζεται η χρησιμότητά του σε ειδικές κατηγορίες πολιτών, όπως είναι οι περιπτώσεις ατόμων με προβλήματα ακοής. Το SSDRC αναμένεται να χρησιμοποιηθεί σε μια σειρά από τεχνολογίες (συστήματα πλοήγησης αυτοκινήτου  –GPS–, τηλέφωνο, τηλεόραση, βιντεοπαιχνίδια), καθώς και σε δημόσιους χώρους (αεροδρόμια, σιδηροδρομικούς σταθμούς κλπ.).

Η υλοποίηση του SSDRCέγινε  κατά την εκτέλεση του ερευνητικού προγράμματος: «TheListeningTalker», το οποίο χρηματοδοτήθηκε από την Ευρωπαϊκή Ένωση, κατά την τριετία 2010-2013, και στο οποίο συμμετείχαν ερευνητικοί οργανισμοί από την Ισπανία, την Αγγλία, τη Σουηδία και την Ελλάδα.