Les raisons d’un succès annoncé
L’interfaçage vocal n’est pas une idée entièrement nouvelle. Il y a 7 ans, Apple lançait Siri, son assistant destiné à simplifier et à humaniser l’expérience iPhone. À l’époque seuls 30% des possesseurs de l’iPhone 4s déclaraient l'utiliser. Plus anciennement, les répondeurs téléphoniques constituaient déjà une première approche d’interaction par la voix. « Pour parler à un téléconseiller dites Conseiller. »
Souvent moquées pour leur manque de naturel, ces expériences ne nous ont pas laissé un souvenir impérissable. Qu’est-ce qui a changé ? Pourquoi cet emballement soudain pour un concept vieux comme le métier d’ergonome ? Pour l’expliquer, il nous faut revenir sur 3 facteurs qui semblent tous converger pour faire de 2018 l’année des assistants personnels dirigés par la voix.
Une interface qui offre l’illusion de la déconnexion
Vous avez sûrement déjà entendu cette petite musique. Un projet qui, ces derniers temps-ci, tourne en boucle de manière entêtante. Nous rêvons de « déconnexion », de nous « débrancher », de réinvestir « le vrai monde ». Cependant, inutile de vous lancer le défi de vivre une semaine en laissant smartphones, tablettes, montres, ordinateurs au placard. Autant vous faire faire l’économie de cette épreuve : vous allez craquer au bout de 2 jours.
Derrière cet énoncé de « déconnexion » pourrait se cacher une toute autre aspiration : celle d’une connexion digitale qui ne se ferait pas au prix d’une déconnexion avec son environnement. Pour faire simple, nous voulons être connectés, mais en relevant la tête de nos smartphones. Nous voulons apprendre toujours plus, tout en faisant moins d’écrans. Cette dissonance cognitive, les interfaces vocales sont en passe de la régler. Interagir avec sa voix va non seulement libérer nos 2 mains, mais également nos 2 yeux.
L’avènement des objets connectés
Ampoule, thermostat, machine à laver, serrure. Tout semble se connecter autour de nous. Comment contrôler tous ses objets ? Nos smartphones sont saturés d’applications et nos salons collectionnent déjà les télécommandes. La réponse ? L’interaction par la voix bien sûr. Ce mode de communication qui peut paraître comme contre-intuitif au premier abord (pourquoi parler à sa lampe ?) se révèlent d’une efficacité redoutable. Nous pouvons désormais communiquer sans intermédiaire avec nos objets du quotidien. Tout du moins, nous avons l’illusion d’une désintermédiation. Car si nous sommes les télécommandes, un nouvel intermédiaire s’impose et se propose de les gouverner tous…
Le bond de géant de l’intelligence artificielle
Dans une interface vocale, la pièce maitresse du dispositif est l’oreille. Sans un micro pour réceptionner et analyser vos commandes, l’interfaçage par la voix ne peut exister. Pour être efficace, cette « oreille » doit comprendre votre commande et disposer d’un écosystème assez attrayant pour que les éditeurs utilisent votre protocole. Google revendique un taux de réussite de traitement des requêtes de 90%. Le deep et le machine learning - qui représentent aujourd’hui les meilleures avancées en terme d’intelligence artificielle - sont arrivés à un niveau de maturité leur permettant de beaucoup mieux analyser les schémas d’expression complexes de l’être humain. La machine comprend l’homme et se comporte en semblable. On connaît désormais l’étendue des promesses que pourraient nous offrir les capacités cognitives des machines et c’est justement ici que commence la guerre commerciale sans merci que se livrent les 4 géants américains : Siri pour Apple, Google Assistant pour Google, Alexa pour Amazon, Cortana pour Microsoft.