Quand on parle d’UX, on pense à des interfaces : site web, application mobile, outil métier, borne de commande, tableau de bord… Bref, des écrans. Pourtant, si l’audio est depuis longtemps dans nos alarmes – celle de notre réveil, de notre micro-onde, de notre lave-linge, de notre réservoir d’essence… – il s’est aussi imposé comme un indispensable de l’expérience utilisateur.
L’expérience utilisateur audio c’est l’IHM, mais c’est aussi la communication sonore d’humain·e à humain·e, et le brand content. Ainsi, nous sommes quotidiennement soumis à un blindtest élaboré : des sons identifiés, reconnaissables et indélébiles comme l’annonce SNCF, le jingle de Netflix ou la sonnerie Apple.
Nos notifications sont personnalisées au point de non seulement connaître nos interlocuteur·rice·s sans avoir à regarder, mais surtout d’identifier le canal de provenance de nos messages : textos, mails, mais aussi les différentes applications de messagerie comme WhatsApp, Messenger, Signal, etc.
Les marques ont fait leur entrée dans l’économie de l’attention auditive : elles nous laissent leurs empreintes sonores et nous les assimilons très naturellement, sans avoir besoin de les apprendre.
L’audio diversifie aussi nos possibilités d’information, de divertissement et d’évasion, ce qui était particulièrement bienvenu pendant les confinements, mais perdure pour déjouer les écrans.
Il nous permet une plus grande portabilité (courir et écouter un podcast) et la simultanéité (faire des recherches vocales sur Internet en gardant les mains dans la pâte à pain).
On a donc décidé de se pencher sur les succès de l’audio, sur ses formats innovants, immersifs, inclusifs, ainsi que sur son impact sur nos usages.
Les médias et l’audio
Le contexte sanitaire attise la production et la diffusion des fake news, l’OMS a même un terme pour désigner le phénomène : l’infodemic. Dans la confusion engendrée, la radio reste la source d’information la plus crédible pour 50% des Français. L’audio constituerait ainsi un témoignage plus tangible que l’écrit, un lien direct et plus authentique.
Le secteur de l’actualité s’y met donc, avec un New York Times particulièrement précurseur : rachat de l’application Audm (qui permet de convertir des articles en audio) et de la société de production Serial, partenariat avec le programme This American Life, multiplication des formats audios et mixtes (Election Distractor, Enquête QAnon). En France, Kantar a signé un partenariat avec ETX Studio pour développer son offre de revue de presse audio, une démarche qui complète son Baromètre de l’Audio Digital.
L’audio se fait à la fois format et contenu, une évolution retracée dans le Voice Lab du Guardian. Les sections audios ont fleuri dans toutes les rédactions (Slate Audio, Listen de Tortoise, L’Express Audio, Quartz audio) ainsi que les formats “citations directes” (comme les témoignages When Women Run de femmes politiques américaines par FiveThirtyEight), les podcasts et les plateformes audios.
Ces contenus dynamisent l’information et sont plus immersifs pour les usagers. L’âge des voix artificielles est révolu : les auditeur·trice·s souhaitent maintenant une lecture et des intonations humaines, un contenu vivant. Chez Tortoise, le rédacteur en chef lui-même enregistre l’Editor’s Voicemail chaque semaine, une initiative qui engendre une véritable proximité et un contact direct avec son audience.
Le phénomène des podcasts
Un podcast natif c’est un contenu audio accessible et conçu pour le web, sans passage à l’antenne. Un tiers des adultes français en consomme et 80 % d’entre eux incluent cet usage dans leur quotidien. Les plateformes audios développent leur offre de podcasts, d’autres leurs sont exclusivement réservées comme Rephonic ou encore Podmust (curation).
Spotify, qui a récemment lancé sa campagne française Écouter ça change tout, a mené une étude auprès des jeunes (Millenials et Z) sur leur rapport aux contenus audios. Il en ressort que 30% d’entre eux placent les podcasts dans le Top 3 des médias dans lesquels ils placent leur confiance.
Cette même étude révèle que 52% des Millennials ont parfois l’impression que l’animateur de podcast est leur ami. Le podcast est aujourd’hui le média qui a le plus haut taux d’engagement (81% des podcasts téléchargés sont écoutés). Son format plus intimiste et privé favorise la création d’une multitude de sujets et de genres.
Des sujets engagés
Les podcasts permettent le dévoilement de soi et la libération de la parole, revendiquant des récits du quotidien comme objets culturels, sociaux, politiques. Des sujets jusque-là ignorés par les médias traditionnels sont maintenant abordés sans tabou.
On y parle amour, sexualité, famille, violence (C’est compliqué de Slate, L’envers du récit du journal La Croix, Et si on parlait d’Andréa Bescont, Hotline, un Spotify original) mais également féminisme (La Poudre animé par Lauren Bastide ou Un podcast à soi, animé par Charlotte Bienaimé pour ARTE Radio) et LGBTQAI+ (La Fabuleuse, animé par Bilal Hassani, Coming In, d’ARTE Radio ou encore Afroqueer).
Des formats originaux
La portabilité des podcasts amène aussi de nouveaux formats comme le podcast-tutoriel (Sound Chef avec Cyril Lignac, Gudden Appetit ou encore La Famille Cuisine) : plus besoin de mettre en pause la vidéo le temps de vérifier que la recette avance bien, les mains et les yeux sont libres de suivre les instructions sans interruption.
On peut aussi mentionner les podcasts de storytelling où les animateurs-trices racontent des histoires fictives ou même des faits réels. C’est le cas des fameux true crime podcasts (récit d’affaires résolues ou non de meurtres, enlèvements, etc) ou encore des podcasts d’histoire, parfois très pointus (comme Passion médiéviste).
Les marques et l’audio
Brand content
Colgate a récemment dévoilé sa nouvelle sonic brand ou “identité sonore.” Les marques sont de plus en plus nombreuses à investir le brand content audio.
D’ailleurs, celles qui proposent des podcasts sont perçues comme plus proches par 85% des usagers, plus intéressantes (82%), plus responsables (81%) et même plus crédibles (80%) ! Dior propose par exemple des séries de podcasts autour de l’histoire et des coulisses de la marque. Estée Lauder va plus loin pour promouvoir son dernier parfum et lui consacre une campagne publicitaire composée de quatre histoires d’amour à découvrir 100% en audio.
Voice commerce
Qui dit formats sonores dit aussi développement de la commande vocale. McDonald’s, qui a acquis la start-up de reconnaissance vocale Apprente dès 2019, a continué de déployer la commande vocale dans ses « drives » aux États-Unis et prévoit même de remplacer les préposés humains par l’intelligence artificielle.
L’avènement du voice commerce (utilisation la recherche vocale pour faire ses achats en ligne) gagne aussi la France, avec des paniers de courses de plus en plus vocaux (Leclerc, Carrefour et Oui.SNCF via Google Assistant) et des expérimentations sur le paiement vocal à la pompe à essence.
20% des recherches sur Google se font déjà par le biais de la voix, une tendance en croissance, surtout chez les mobinautes, qui nécessite notamment que les marques adaptent leur fiche produit pour le vocal.
Réseaux sociaux, plateformisation & messageries
Certains acteurs comme The Pudding l’ont compris : la plateformisation de l’audio va bien au-delà de la curation de contenus musicaux et culturels.
Les auditeurs de podcasts sont même particulièrement à la pointe des réseaux sociaux. Pour conserver leur intérêt, il faut leur proposer des contenus inédits, partageables, interactifs (comme une IA qui juge la qualité de votre Spotify, une cartographie musicale ou des jeux audio immersifs : The Inspection Chamber de la BBC, World of Lovecraft de Just AI).
Le social media se fait audio et vocal : le succès des débuts de Clubhouse n’a échappé à personne. Les géants des réseaux sociaux l’ont rejoint sur le secteur de l’audio en direct avec Spaces de Twitter, Live Audio de Facebook désormais disponible partout dans le monde et Reddit Talk. Spotify a de son côté fait l’acquisition de Betty Labs, l’entreprise derrière l’application Locker Room (concurrent de Clubhouse dédié au lives sportifs). Spoon propose d’enregistrer une biographie vocale pour se présenter.
D’ailleurs le vocal est aussi largement entré dans les pratiques des messageries instantanées (et parfois c’est interminable…). Vecteur de proximité et d’intimité, l’audio est la continuité naturelle des usages de communication. On y discute et on y partage plus librement,en se sentant moins exposé·e que devant une caméra.
Accessoires sonores et vie privée
Les usages d’écoute ont évolué et sont aujourd’hui majoritairement individuels: ça ne se fait plus de se réunir dans un silence religieux autour d’un poste de radio. Et avec des accessoires de plus en plus innovants, le vocal s’invite dans des sphères de plus en plus privées de nos vies.
Les objets du son et autres enceintes intelligentes investissent la sphère domestique: ils portent des prénoms, possèdent des informations sur nous, nos proches, nos habitudes et nous répondent.
Ces assistants vocaux permettent d’écouter des contenus à la carte (dont la radio) mais aussi de faciliter nos quotidiens. De Google Home au HomePod mini d’Apple en passant par Alexa et Echo d’Amazon, toutes les grandes marques s’y mettent. IKEAxSonos ont d’ailleurs lancé une deuxième génération de leur lampe Symfonisk.
Les wearables (objets connectés pouvant être portés) leur permettent un accès direct à nos oreilles, avec une qualité de son toujours accrue, un isolement phonique de plus efficace et des prix parfois imbattables (comme le casque audio à moins de 7 euros de Lidl).Mais l’audio s’incruste dans d’autres sphères, plus inattendues, de la vie privée, comme la vie amoureuse (VoxLov, l’appli de rencontre uniquement par la voix) ou encore la santé (expérimentation d’intelligences artificielles permettant des diagnostics vocaux).
Accessibilité et voice UX
Rendre l’audio accessible est au cœur des préoccupations de conception (l’art de l’alt-text : réussir à faire lire “photo de chat” au lecteur d’écran plutôt qu’un nom de fichier indigeste comme “IMG_07890.jpg ».
Le progrès reste cependant à deux vitesses car l’accessibilité des assistants vocaux décolle mais les lecteurs d’écran gardent des voix encore très artificielles et sont développés surtout pour l’anglais. Les expériences utilisateur “les yeux fermés” n’ont par contre rien à envier aux images à haute définition et autres effets spéciaux).
L’audio est aussi un pas dans la direction du no-touch: ASMR, musique 3D, 8D, etc. On découvre de nouvelles dimensions au son (sensorielles, étonnantes, intimes, attractives). La conception pour la voix est complètement différente de la conception pour un écran et offre une infinité de perspectives créatives.
La transition entre UX design et voice UX est un défi pour les voice ux designers : il s’agit d’indiquer les options d’interactions et les fonctionnalités de l’interface sans (ou quasiment sans) supports visuels, avec une interaction qui s’affranchit de la vue mais aussi du toucher.
Brand content
Colgate a récemment dévoilé sa nouvelle sonic brand ou “identité sonore.” Les marques sont de plus en plus nombreuses à investir le brand content audio.
D’ailleurs, celles qui proposent des podcasts sont perçues comme plus proches par 85% des usagers, plus intéressantes (82%), plus responsables (81%) et même plus crédibles (80%) ! Dior propose par exemple des séries de podcasts autour de l’histoire et des coulisses de la marque. Estée Lauder va plus loin pour promouvoir son dernier parfum et lui consacre une campagne publicitaire composée de quatre histoires d’amour à découvrir 100% en audio.
Voice commerce
Qui dit formats sonores dit aussi développement de la commande vocale. McDonald’s, qui a acquis la start-up de reconnaissance vocale Apprente dès 2019, a continué de déployer la commande vocale dans ses « drives » aux États-Unis et prévoit même de remplacer les préposés humains par l’intelligence artificielle.
L’avènement du voice commerce (utilisation la recherche vocale pour faire ses achats en ligne) gagne aussi la France, avec des paniers de courses de plus en plus vocaux (Leclerc, Carrefour et Oui.SNCF via Google Assistant) et des expérimentations sur le paiement vocal à la pompe à essence.
20% des recherches sur Google se font déjà par le biais de la voix, une tendance en croissance, surtout chez les mobinautes, qui nécessite notamment que les marques adaptent leur fiche produit pour le vocal.
Réseaux sociaux, plateformisation & messageries
Certains acteurs comme The Pudding l’ont compris : la plateformisation de l’audio va bien au-delà de la curation de contenus musicaux et culturels.
Les auditeurs de podcasts sont même particulièrement à la pointe des réseaux sociaux. Pour conserver leur intérêt, il faut leur proposer des contenus inédits, partageables, interactifs (comme une IA qui juge la qualité de votre Spotify, une cartographie musicale ou des jeux audio immersifs : The Inspection Chamber de la BBC, World of Lovecraft de Just AI).
Le social media se fait audio et vocal : le succès des débuts de Clubhouse n’a échappé à personne. Les géants des réseaux sociaux l’ont rejoint sur le secteur de l’audio en direct avec Spaces de Twitter, Live Audio de Facebook désormais disponible partout dans le monde et Reddit Talk. Spotify a de son côté fait l’acquisition de Betty Labs, l’entreprise derrière l’application Locker Room (concurrent de Clubhouse dédié au lives sportifs). Spoon propose d’enregistrer une biographie vocale pour se présenter.
D’ailleurs le vocal est aussi largement entré dans les pratiques des messageries instantanées (et parfois c’est interminable…). Vecteur de proximité et d’intimité, l’audio est la continuité naturelle des usages de communication. On y discute et on y partage plus librement,en se sentant moins exposé·e que devant une caméra.
Accessoires sonores et vie privée
Les usages d’écoute ont évolué et sont aujourd’hui majoritairement individuels: ça ne se fait plus de se réunir dans un silence religieux autour d’un poste de radio. Et avec des accessoires de plus en plus innovants, le vocal s’invite dans des sphères de plus en plus privées de nos vies.
Les objets du son et autres enceintes intelligentes investissent la sphère domestique: ils portent des prénoms, possèdent des informations sur nous, nos proches, nos habitudes et nous répondent.
Ces assistants vocaux permettent d’écouter des contenus à la carte (dont la radio) mais aussi de faciliter nos quotidiens. De Google Home au HomePod mini d’Apple en passant par Alexa et Echo d’Amazon, toutes les grandes marques s’y mettent. IKEAxSonos ont d’ailleurs lancé une deuxième génération de leur lampe Symfonisk.
Les wearables (objets connectés pouvant être portés) leur permettent un accès direct à nos oreilles, avec une qualité de son toujours accrue, un isolement phonique de plus efficace et des prix parfois imbattables (comme le casque audio à moins de 7 euros de Lidl).Mais l’audio s’incruste dans d’autres sphères, plus inattendues, de la vie privée, comme la vie amoureuse (VoxLov, l’appli de rencontre uniquement par la voix) ou encore la santé (expérimentation d’intelligences artificielles permettant des diagnostics vocaux).
Accessibilité et voice UX
Rendre l’audio accessible est au cœur des préoccupations de conception (l’art de l’alt-text : réussir à faire lire “photo de chat” au lecteur d’écran plutôt qu’un nom de fichier indigeste comme “IMG_07890.jpg ».
Le progrès reste cependant à deux vitesses car l’accessibilité des assistants vocaux décolle mais les lecteurs d’écran gardent des voix encore très artificielles et sont développés surtout pour l’anglais. Les expériences utilisateur “les yeux fermés” n’ont par contre rien à envier aux images à haute définition et autres effets spéciaux).
L’audio est aussi un pas dans la direction du no-touch: ASMR, musique 3D, 8D, etc. On découvre de nouvelles dimensions au son (sensorielles, étonnantes, intimes, attractives). La conception pour la voix est complètement différente de la conception pour un écran et offre une infinité de perspectives créatives.
La transition entre UX design et voice UX est un défi pour les voice ux designers : il s’agit d’indiquer les options d’interactions et les fonctionnalités de l’interface sans (ou quasiment sans) supports visuels, avec une interaction qui s’affranchit de la vue mais aussi du toucher.
Le mot de l’UX researcher
par Timothée Mourier
Certains d’entre nous sont sensibles à ce qu’ils ont sous les yeux, quand d’autres le sont à ce qu’ils ont dans les oreilles. Quoiqu’il en soit, le son, la musique, les bruits, ont une forte incidence chez nous autres, êtres humains.
Pourquoi n’accorde-t-on pas la même place au son qu’au visuel dans une expérience utilisateur ?
La digitalisation globale des entreprises a naturellement conduit à se pencher sur des écrans : repenser son tunnel d’achat en ligne ou sa homepage, ajouter une feature à son application, redesigner un outil métier.
Les problématiques d’UX au sens digital sont nombreuses. Mais peu à peu, les organisations, les marques, prennent conscience que l’expérience utilisateur va au-delà de ça. Qu’elle constitue un tout.
Nous sommes confrontés tous les jours à des objets ou des lieux qui génèrent du son : smartphones, ordinateurs et tablettes, maison connectée, gares et aéroports, supermarchés. Notre cerveau a appris à distinguer un son de validation d’un son d’erreur. Et nous avons tous notre préférence en termes de sonnerie ou de réveil (sonneries que nous viendrons éventuellement à détester).
En clair, le son, les bruits, la musique, jouent un rôle clé dans l’expérience que nous faisons d’un produit ou d’un service. Par l’univers qu’il nous inspire, l’émotion qu’il nous procure, ou la réponse que nous attendons, le son permet d’augmenter une expérience et de délivrer une information claire et instantanée.