Στο Pro News Σεβόμαστε την ιδιωτικότητά σας

Εμείς και οι συνεργάτες μας αποθηκεύουμε ή/και έχουμε πρόσβαση σε πληροφορίες σε μια συσκευή, όπως cookies και επεξεργαζόμαστε προσωπικά δεδομένα, όπως μοναδικά αναγνωριστικά και τυπικές πληροφορίες που αποστέλλονται από μια συσκευή για εξατομικευμένες διαφημίσεις και περιεχόμενο, μέτρηση διαφημίσεων και περιεχομένου, καθώς και απόψεις του κοινού για την ανάπτυξη και βελτίωση προϊόντων.

Με την άδειά σας, εμείς και οι συνεργάτες μας ενδέχεται να χρησιμοποιήσουμε ακριβή δεδομένα γεωγραφικής τοποθεσίας και ταυτοποίησης μέσω σάρωσης συσκευών. Μπορείτε να κάνετε κλικ για να συναινέσετε στην επεξεργασία από εμάς και τους συνεργάτες μας όπως περιγράφεται παραπάνω. Εναλλακτικά, μπορείτε να αποκτήσετε πρόσβαση σε πιο λεπτομερείς πληροφορίες και να αλλάξετε τις προτιμήσεις σας πριν συναινέσετε ή να αρνηθείτε να συναινέσετε. Λάβετε υπόψη ότι κάποια επεξεργασία των προσωπικών σας δεδομένων ενδέχεται να μην απαιτεί τη συγκατάθεσή σας, αλλά έχετε το δικαίωμα να αρνηθείτε αυτήν την επεξεργασία. Οι προτιμήσεις σας θα ισχύουν μόνο για αυτόν τον ιστότοπο. Μπορείτε πάντα να αλλάξετε τις προτιμήσεις σας επιστρέφοντας σε αυτόν τον ιστότοπο ή επισκεπτόμενοι την πολιτική απορρήτου μας.

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας.Δες περισσότερα εδώ.
Επιστήμες

Σύνθεση ομιλίας της Google μιμείται τέλεια την ανθρώπινη φωνή

Επιστημονικό άρθρο που δημοσίευσε η Google, το οποίο πάντως δεν έχει αξιολογηθεί από άλλους επιστήμονες, περιγράφει ένα σύστημα εκφώνησης κειμένου που διεκδικεί σχεδόν απόλυτη ομοιότητα με την ανθρώπινη φωνή.

Το σύστημα ονομάζεται Tacotron 2 και αποτελεί τη δεύτερη επίσημη "γενιά" της συγκεκριμένης τεχνολογίας, η οποία βασίζεται σε δύο νευρωνικά δίκτυα. Το πρώτο δίκτυο "μεταφράζει" το κείμενο σε φασματογράφημα, οπτικοποιώντας έτσι την εξέλιξη των ακουστικών συχνοτήτων συναρτήσει του χρόνου.

Στη συνέχεια, το φασματογράφημα "φορτώνεται" στο WaveNet, ένα σύστημα από το ερευνητικό εργαστήριο DeepMind της Alphabet, το οποίο "διαβάζει" το γράφημα και αναπαράγει τα αντίστοιχα ηχητικά στοιχεία.

Το σύστημα τα καταφέρνει εξίσου καλά με ονόματα και λέξεις που προφέρονται, όπως επίσης και να προσαρμόζει τη χροιά του ανάλογα με τα σημεία στίξης. Μάλιστα, είναι άμεσα αξιοποιήσιμο από την Google, αφού το Google Assistant "χρωστά" τη φωνή του στο WaveNet, το οποίο πρωτοανακοινώθηκε το 2016. Επομένως, όταν είναι εντελώς έτοιμο για χρήση, το Tacotron 2 θα βελτιώσει κατακόρυφα τις δυνατότητες της υπηρεσίας.

Tags
Back to top button