MustntMiss & NewsStoriesHeadlines : comment Google identifie les news qui comptent ?
En mai 2024, le leak de l'API Google Content Warehouse a révélé deux signaux internes que personne n'aurait dû voir : MustntMiss et NewsStoriesHeadlines. Ils décident, en coulisse, quelles news sont jugées « incontournables » et propulsées dans Discover et Top Stories.
En mai 2024, plus de 14 000 fichiers internes ont fuité de l'API Google Content Warehouse. Parmi eux, deux noms reviennent en boucle dans les analyses des SEO qui ont décortiqué le leak : MustntMiss et NewsStoriesHeadlines. Ces deux signaux n'ont jamais été documentés publiquement par Google. Ils répondent à une question simple — quelles news Google considère comme suffisamment importantes pour qu'on ne les rate pas ? — et leur fonctionnement explique pourquoi certains articles atterrissent en haut de Discover ou de Top Stories pendant que d'autres, parfaitement écrits, restent invisibles.
Cet article décortique la mécanique : ce que sont précisément ces deux signaux, comment ils s'articulent, quels critères Google utilise pour activer MustntMiss, et surtout ce qu'un éditeur peut faire concrètement pour maximiser ses chances de passer le filtre.
Le contexte : qu'est-ce qui a fuité au juste ?
Le 5 mai 2024, un dépôt GitHub privé contenant la documentation interne de l'API Google Content Warehouse a été temporairement rendu public, puis archivé par plusieurs chercheurs avant d'être refermé. Dans ce dépôt : la définition de 2 596 modules et 14 014 attributs qui composent le pipeline de classement de Google Search, Discover et News.
Google n'a jamais reconnu publiquement le leak — la communication officielle s'est limitée à un porte-parole indiquant qu'il « ne fallait pas faire de suppositions hors contexte ». Mais le dépôt n'a pas été retiré du domaine public ni les fichiers détruits par DMCA, ce qui est interprété par la communauté comme une reconnaissance tacite. Notre guide ultime sur ce que Search ne dit pas détaille les principaux signaux exposés par le leak.
NewsStoriesHeadlines : la liste, avant la priorité
Pour comprendre MustntMiss, il faut d'abord comprendre où il s'applique. NewsStoriesHeadlines est une structure de données qui regroupe, pour une requête ou une thématique donnée, l'ensemble des titres candidats à être affichés dans les blocs « news » que Google peut générer (Top Stories, carousel news en SERP, carte « À la une » de Discover, etc.).
Ce que cette structure contient pour chaque candidat :
- Le titre éditorial (
title) - Le timestamp de publication (
publication_time) - L'éditeur source identifié comme entité (
source.entity_id) - Le score d'autorité éditoriale sur le sujet (
topical_authority) - Une métrique de fraîcheur dynamique (
recency_score) - Et le drapeau qui nous intéresse :
mustnt_miss(true/false)
Concrètement : si votre article n'apparaît même pas dans NewsStoriesHeadlines, il n'est pas un candidat. Pas de candidat, pas de MustntMiss à activer. C'est l'étape de pré-sélection, conditionnée par la fraîcheur de publication et la reconnaissance de votre domaine comme source légitime sur le sujet.
MustntMiss : le drapeau qui change tout
MustntMiss est un flag binaire : un article l'a, ou ne l'a pas. Quand il vaut true, Google considère que l'article est « tellement important pour cet utilisateur, sur cette thématique, à ce moment-là, qu'il faut le lui montrer ». Cela débloque trois comportements observables en production :
- Promotion en tête de Discover, parfois sur plusieurs jours pour les sujets durables (élections, catastrophes, sorties produits majeures)
- Inclusion dans le carousel Top Stories de la SERP même pour des requêtes secondaires liées au sujet
- Notification push dans l'app Google pour les utilisateurs qui ont activé les alertes sur le thème
Le flag est recalculé en continu : un article peut le gagner 30 minutes après publication, le perdre 6 heures plus tard quand un autre éditeur publie un meilleur traitement, le regagner si vous mettez à jour avec des informations exclusives. Ce n'est pas une décision figée, c'est un signal vivant.
Les 3 conditions pour décrocher MustntMiss
Le leak ne donne pas la formule exacte (les coefficients restent privés), mais les attributs lus par le module MustntMissScorer sont nommés. Ils tournent autour de trois familles de signaux qui doivent toutes les trois être au vert.
1. Fraîcheur stricte
Les sujets éligibles à MustntMiss sont presque tous des nouveautés ou réactions à un événement. Le module lit recency_score, qui décroît rapidement après la publication : très haut dans les 2 premières heures, encore élevé jusqu'à 6 h, puis chute brutalement. Au-delà de 24 h, l'éligibilité MustntMiss tombe à zéro pour la plupart des sujets « hot ».
Conséquence pratique : si vous traitez un sujet d'actualité, publiez vite. La rédaction qui poste une réaction propre 90 minutes après l'événement bat la rédaction qui poste un dossier ultra-fouillé 8 heures plus tard, même si le second est meilleur sur le fond.
2. Autorité éditoriale sur le sujet (entité reconnue)
Google ne distribue pas une news en se demandant « est-ce un bon article ? » d'abord. Il se demande « cette source est-elle reconnue comme légitime sur ce sujet précis ? ». Le signal lu, topical_authority, dépend du Web Profile de votre entité éditrice et de votre historique de publication sur le cluster thématique.
Sans entité validée, peu importe la qualité de la news : MustntMiss reste à false. C'est ce qui explique que des articles bien écrits de petits sites passent à côté pendant que des dépêches courtes de gros médias historiques décrochent le drapeau. Le Profiler teste cette éligibilité d'entité en une seconde.
3. Engagement précoce intense
Les 30 premières minutes après publication sont une fenêtre de test. Le module observe le early_engagement_burst — un agrégat de CTR, dwell time, partages et complétions de lecture sur un échantillon d'utilisateurs. Si la métrique dépasse un seuil (variable par thématique, mais aux alentours du 75e percentile de votre cluster), le drapeau MustntMiss bascule à true.
Ce signal est auto-renforçant : un article qui obtient le flag est promu, donc reçoit plus de trafic, donc maintient un fort engagement, donc garde le flag plus longtemps. Inversement, un article qui rate la fenêtre des 30 premières minutes a peu de chances de la récupérer.
Ce que les éditeurs peuvent faire concrètement
On ne « force » pas MustntMiss. Mais on peut maximiser la probabilité qu'il s'active, en agissant sur les trois leviers qui le pilotent :
- Cadence de publication ultra-rapide sur les sujets chauds : viser une mise en ligne dans les 60-120 minutes après l'événement, quitte à enrichir l'article par mises à jour successives (Google revalorise les
article:modified_time). - Entité solidifiée avant le scoop : la reconnaissance se construit sur des semaines (publications régulières, citations entrantes, Knowledge Panel propre). Le moment de l'événement est trop tard pour bâtir cette autorité — elle doit déjà être là. Le guide sur le fonctionnement de Discover détaille la construction d'une entité.
- Hero éditorial au lieu de stock : le CTR initial dépend massivement de l'image. Image stock générique = CTR bas = pas de bascule
MustntMiss. Photo originale ou illustration éditoriale unique = CTR 2-3× supérieur. - Pas de friction au-dessus du scroll : zéro pop-up newsletter, zéro paywall déguisé, zéro overlay cookie qui couvre le contenu. Le dwell time sur les 30 premières secondes décide.
- H1 émotionnel et précis : un titre comme « Ce que change vraiment l'annonce de la BCE pour vos économies » bat « BCE : nouvelle annonce de politique monétaire ». Le premier déclenche un clic ; le second informe sans donner envie.
Le leak vaut-il encore en 2026 ?
Question légitime, deux ans après. Réponse courte : oui. Les noms de variables (MustntMiss, NewsStoriesHeadlines, relatedSourcesGoodWithType, etc.) sont restés stables dans les références indirectes que Google publie (documentation Schema.org, propres research papers, etc.). Le mécanisme observable en production — sites établis avec entité solide qui décrochent durablement Discover, sites jeunes qui peinent malgré du bon contenu — colle exactement à la mécanique décrite par le leak.
Tant que Google ne refera pas son pipeline de A à Z (ce qui demanderait des années), les signaux nommés en 2024 restent les bons leviers à activer en 2026.
Le bon réflexe avant la prochaine news
La prochaine fois que vous publiez sur un sujet d'actualité, posez-vous trois questions, dans cet ordre :
- Suis-je reconnu comme entité sur ce sujet par Google ? Si non, l'article ne sera même pas listé dans
NewsStoriesHeadlines. - Vais-je publier dans la fenêtre de 2 heures qui suit l'événement ? Si non,
recency_scoresera trop bas pour basculerMustntMiss. - Le hero, le H1 et le premier paragraphe vont-ils générer un fort engagement initial ? Si non, la fenêtre des 30 premières minutes sera ratée.
Trois oui = chance réelle de décrocher MustntMiss. Deux oui = essayer reste justifié. Un oui = la news ne percera pas, autant la traiter en format evergreen et viser le SEO classique. La première question — l'éligibilité d'entité — est celle qu'il faut avoir réglée en amont, pas le jour de la news.
Questions fréquentes
C'est quoi MustntMiss exactement ?
C'est un flag binaire interne du système Google Content Warehouse, révélé par le leak de mai 2024. Il marque un article comme "must-not-miss" — autrement dit comme une news que Google estime tellement importante que l'utilisateur ne devrait pas la rater. Quand le flag est positif, l'article devient un candidat prioritaire pour Discover, Top Stories et la carte d'actualités sur la page d'accueil mobile.
Et NewsStoriesHeadlines, c'est quoi la différence ?
NewsStoriesHeadlines est la structure de données qui regroupe les titres candidats pour les blocs "news" dans les résultats Google. C'est l'inventaire ; MustntMiss est l'étiquette de priorité posée dessus. Sans NewsStoriesHeadlines populé, pas de sélection ; sans MustntMiss activé, pas de mise en avant prioritaire.
Comment Google décide-t-il qu'un article mérite MustntMiss ?
Trois familles de signaux ressortent du leak : la fraîcheur (publié dans les 6 dernières heures pour les sujets chauds), l'autorité éditoriale sur le sujet (entité reconnue, publication régulière), et l'intensité d'engagement précoce (CTR, dwell time, partages des 30 premières minutes). Aucun n'est suffisant seul ; les trois doivent s'aligner.
Est-ce qu'on peut "forcer" MustntMiss sur un article ?
Non, c'est un calcul interne — pas un meta tag à ajouter. Mais on peut maximiser la probabilité : publier sous 1-2 h après l'événement, avoir un Web Profile validé sur le sujet, soigner le hero/H1 pour générer du CTR rapide, et éviter les frictions (pop-up, paywall) qui flinguent le dwell time. Le Profiler vérifie le premier prérequis en une seconde.
Le leak est-il toujours d'actualité en 2026 ?
Les noms de variables (MustntMiss, NewsStoriesHeadlines, relatedSourcesGoodWithType, etc.) sont stables depuis 2 ans : Google n'a pas reconnu publiquement le leak mais n'a pas non plus dépublié l'API. Les mécanismes documentés en 2024 sont toujours observables en production — c'est ce qui rend ces signaux exploitables aujourd'hui pour optimiser Discover.
Votre site a-t-il un Google Web Profile actif ?
Aucune technique Discover ne fonctionne si Google ne vous reconnaît pas comme entité. 1 seconde pour vérifier, gratuitement.
Lancer le Profiler →


