Interface vocale : une oreille pour les gouverner tous

 

Alors que l’écran apparaissait comme l’horizon indépassable des interfaces hommes-machine, telle une fin de l’histoire pour UX designer hégélien, voilà qu’apparaît - ou plutôt réapparaît - une tendance de fond : interagir avec sa voix. Depuis peu, les assistants conversationnels fleurissent dans les salons et proposent aux particuliers une nouvelle façon de naviguer sur Internet, d’interagir avec des objets et bientôt de commander son repas du soir.

Les raisons d’un succès annoncé

L’interfaçage vocal n’est pas une idée entièrement nouvelle. Il y a 7 ans, Apple lançait Siri, son assistant destiné à simplifier et à humaniser l’expérience iPhone. À l’époque seuls 30% des possesseurs de l’iPhone 4s déclaraient l'utiliser.  Plus anciennement, les répondeurs téléphoniques constituaient déjà une première approche d’interaction par la voix. « Pour parler à un téléconseiller dites Conseiller. »

Souvent moquées pour leur manque de naturel, ces expériences ne nous ont pas laissé un souvenir impérissable. Qu’est-ce qui a changé ? Pourquoi cet emballement soudain pour un concept vieux comme le métier d’ergonome ? Pour l’expliquer, il nous faut revenir sur 3 facteurs qui semblent tous converger pour faire de 2018 l’année des assistants personnels dirigés par la voix.

 

Pour faire simple, nous voulons être connectés, mais en relevant la tête de nos smartphones.

Une interface qui offre l’illusion de la déconnexion

Vous avez sûrement déjà entendu cette petite musique. Un projet qui, ces derniers temps-ci, tourne en boucle de manière entêtante. Nous rêvons de « déconnexion », de nous « débrancher », de réinvestir « le vrai monde ». Cependant, inutile de vous lancer le défi de vivre une semaine en laissant smartphones, tablettes, montres, ordinateurs au placard. Autant vous faire faire l’économie de cette épreuve : vous allez craquer au bout de 2 jours.

Derrière cet énoncé de « déconnexion » pourrait se cacher une toute autre aspiration : celle d’une connexion digitale qui ne se ferait pas au prix d’une déconnexion avec son environnement. Pour faire simple, nous voulons être connectés, mais en relevant la tête de nos smartphones. Nous voulons apprendre toujours plus, tout en faisant moins d’écrans. Cette dissonance cognitive, les interfaces vocales sont en passe de la régler. Interagir avec sa voix va non seulement libérer nos 2 mains, mais également nos 2 yeux.

L’avènement des objets connectés

Ampoule, thermostat, machine à laver, serrure. Tout semble se connecter autour de nous. Comment contrôler tous ses objets ? Nos smartphones sont saturés d’applications et nos salons collectionnent déjà les télécommandes. La réponse ? L’interaction par la voix bien sûr. Ce mode de communication qui peut paraître comme contre-intuitif au premier abord (pourquoi parler à sa lampe ?) se révèlent d’une efficacité redoutable. Nous pouvons désormais communiquer sans intermédiaire avec nos objets du quotidien. Tout du moins, nous avons l’illusion d’une désintermédiation. Car si nous sommes les télécommandes, un nouvel intermédiaire s’impose et se propose de les gouverner tous… 

 

Le bond de géant de l’intelligence artificielle

Dans une interface vocale, la pièce maitresse du dispositif est l’oreille. Sans un micro pour réceptionner et analyser vos commandes, l’interfaçage par la voix ne peut exister. Pour être efficace, cette « oreille » doit comprendre votre commande et disposer d’un écosystème assez attrayant pour que les éditeurs utilisent votre protocole. Google revendique un taux de réussite de traitement des requêtes de 90%. Le deep et le machine learning - qui représentent aujourd’hui les meilleures avancées en terme d’intelligence artificielle - sont arrivés à un niveau de maturité leur permettant de beaucoup mieux analyser les schémas d’expression complexes de l’être humain. La machine comprend l’homme et se comporte en semblable. On connaît désormais l’étendue des promesses que pourraient nous offrir les capacités cognitives des machines et c’est justement ici que commence la guerre commerciale sans merci que se livrent les 4 géants américains : Siri pour Apple, Google Assistant pour Google, Alexa pour Amazon, Cortana pour Microsoft.

Quelle stratégie pour les marques ?

L’entreprise de conseil Gartner prédit que dans deux ans, 1/3 des recherches sur le web seront réalisées par le biais d’une interface vocale. Les leviers de transformation des marques s’en verront forcément impactés et il y a fort à parier que Google (qui est en France le système en passe de dominer le marché) réitère le modèle de son moteur de recherche éponyme. C’est pourquoi il sera nécessaire d’axer, encore plus, sa stratégie autour du contenu et d’en adapter sa sémantique afin d’assurer une pertinence pour le référencement vocal. Les spécialistes du SEO se préparent. L’acquisition vocale représentera des volumes de recherches toujours plus importants et dans un monde d’interaction par la voix, seule la première position compte. Cela a déjà un nom : le “Vocal first”.