Données de recherche - mai 2026 Search Data - May 2026 Forschungsdaten - Mai 2026 Datos de investigación - mayo 2026

Google Preferred Sources

Classement des top Preferred Sources selon Google aux US, UK, Australie, France, Espagne et Allemagne Ranking of the top Google Preferred Sources in the US, UK, Australia, France, Spain and Germany Ranking der Top-Preferred-Sources laut Google in den USA, UK, Australien, Frankreich, Spanien und Deutschland Clasificación de las principales Preferred Sources según Google en EE.UU., Reino Unido, Australia, Francia, España y Alemania

6
pays testés countries tested getestete Länder países probados
60K
suggests scrappés suggests scraped Suggests gescrapt suggests scrapeados
~55K
noms de domaines domain names Domainnamen nombres de dominio

Nous avons créé un indicateur de popularité pour chaque domaine, permettant de détecter la prédominance de chacun sur son marché. Nous présentons le top 10 000 domaines par pays.

We created a popularity indicator for each domain, enabling us to detect the predominance of each one in its market. We present the top 10,000 domains per country.

Wir haben einen Popularitätsindikator für jede Domain erstellt, der es ermöglicht, die Dominanz jeder einzelnen auf ihrem Markt zu erkennen. Wir präsentieren die Top 10.000 Domains pro Land.

Hemos creado un indicador de popularidad para cada dominio, que permite detectar la predominancia de cada uno en su mercado. Presentamos el top 10.000 dominios por país.

Powered by RESONEO

Le 30 avril 2026, Google a déployé "Preferred Sources" à l'échelle mondiale. Cette fonctionnalité suggère des domaines via un mécanisme d'autocomplétion. Or, ces suggestions ne sont pas universelles : chaque pays reçoit un jeu de domaines quasi-unique. Cette étude compare les datasets de six marchés - États-Unis, Royaume-Uni, Allemagne, Espagne, France et Australie - et met en évidence des catalogues de sources profondément distincts.

On April 30, 2026, Google rolled out "Preferred Sources" globally. This feature suggests domains through an autocomplete mechanism. However, these suggestions are not universal: each country receives a nearly unique set of domains. This study compares the datasets of six markets - the United States, the United Kingdom, Germany, Spain, France and Australia - and reveals profoundly distinct source catalogs.

Am 30. April 2026 hat Google "Preferred Sources" weltweit eingeführt. Diese Funktion schlägt Domains über einen Autocomplete-Mechanismus vor. Diese Vorschläge sind jedoch nicht universell: Jedes Land erhält einen nahezu einzigartigen Satz von Domains. Diese Studie vergleicht die Datasets von sechs Märkten - USA, Vereinigtes Königreich, Deutschland, Spanien, Frankreich und Australien - und zeigt grundlegend unterschiedliche Quellkataloge auf.

El 30 de abril de 2026, Google desplegó "Preferred Sources" a nivel mundial. Esta función sugiere dominios mediante un mecanismo de autocompletado. Sin embargo, estas sugerencias no son universales: cada país recibe un conjunto de dominios casi único. Este estudio compara los conjuntos de datos de seis mercados - Estados Unidos, Reino Unido, Alemania, España, Francia y Australia - y revela catálogos de fuentes profundamente distintos.

Sommaire Table of Contents Inhaltsverzeichnis Índice

1 Sources suggérées par pays Suggested sources by country Vorgeschlagene Quellen pro Land Fuentes sugeridas por país 2 La fonctionnalité "Preferred Sources" The "Preferred Sources" feature Die Funktion "Preferred Sources" La función "Preferred Sources" 3 uvSitechunk et le leak de 2024 uvSitechunk and the 2024 leak uvSitechunk und das Leak von 2024 uvSitechunk y la filtración de 2024 4 Méthodologie de scoring Scoring methodology Scoring-Methodik Metodología de puntuación
1

Sources suggérées par pays Suggested sources by country Vorgeschlagene Quellen pro Land Fuentes sugeridas por país

Parcourez et recherchez les domaines suggérés par Google dans chaque marché Browse and search the domains Google suggests in each market Durchsuchen Sie die von Google in jedem Markt vorgeschlagenen Domains Explore y busque los dominios que Google sugiere en cada mercado

Domain Analysis - United States Analyse des domaines - États-Unis Domain-Analyse - Vereinigte Staaten Análisis de dominios - Estados Unidos
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Domain Analysis - United Kingdom Analyse des domaines - Royaume-Uni Domain-Analyse - Vereinigtes Königreich Análisis de dominios - Reino Unido
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Domain Analysis - Germany Analyse des domaines - Allemagne Domain-Analyse - Deutschland Análisis de dominios - Alemania
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Domain Analysis - Spain Analyse des domaines - Espagne Domain-Analyse - Spanien Análisis de dominios - España
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Domain Analysis - France Analyse des domaines - France Domain-Analyse - Frankreich Análisis de dominios - Francia
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Domain Analysis - Australia Analyse des domaines - Australie Domain-Analyse - Australien Análisis de dominios - Australia
Extension Extension Erweiterung Extensión Count Nombre Anzahl Cantidad %
Set your Google Preferred Sources Configurer vos sources préférées Google Google Preferred Sources einstellen Configurar tus fuentes preferidas de Google
2

La fonctionnalité "Preferred Sources" The "Preferred Sources" feature Die Funktion "Preferred Sources" La función "Preferred Sources"

Un nouveau levier de personnalisation des résultats Google A new way for users to customize their Google Search results Eine neue Möglichkeit zur Personalisierung der Google-Suchergebnisse Una nueva forma de personalizar los resultados de búsqueda de Google

Le 30 avril 2026, Google a annoncé le déploiement mondial de "Preferred Sources". Cette fonctionnalité permet aux utilisateurs d'indiquer les sites qu'ils souhaitent voir plus ou moins fréquemment dans leurs résultats de recherche. En pratique, lorsqu'un utilisateur active cette option, Google lui propose des domaines via un mécanisme d'autocomplétion : l'utilisateur commence à taper un nom et Google suggère des sites correspondants depuis une base interne.

On April 30, 2026, Google announced the global rollout of "Preferred Sources." This feature allows users to indicate which websites they want to see more or less frequently in their search results. In practice, when a user activates this option, Google suggests domains through an autocomplete mechanism: the user starts typing a name and Google suggests matching sites from an internal database.

Am 30. April 2026 kündigte Google die weltweite Einführung von "Preferred Sources" an. Diese Funktion ermöglicht es Nutzern anzugeben, welche Websites sie häufiger oder seltener in ihren Suchergebnissen sehen möchten. In der Praxis schlägt Google dem Nutzer Domains über einen Autocomplete-Mechanismus vor: Der Nutzer beginnt einen Namen einzutippen und Google schlägt passende Seiten aus einer internen Datenbank vor.

El 30 de abril de 2026, Google anunció el despliegue global de "Preferred Sources". Esta función permite a los usuarios indicar qué sitios web desean ver con más o menos frecuencia en sus resultados de búsqueda. En la práctica, cuando un usuario activa esta opción, Google sugiere dominios mediante un mecanismo de autocompletado: el usuario empieza a escribir un nombre y Google sugiere sitios correspondientes de una base de datos interna.

Ce que cela révèle

What this reveals

Was das offenbart

Lo que esto revela

La composition de cette base de suggestions est en soi une information. Les domaines que Google choisit de proposer reflètent son propre référentiel de sources suffisamment notables pour être suggérées aux utilisateurs. La question qui se pose : cette base est-elle identique partout dans le monde, ou varie-t-elle selon le pays de l'utilisateur ?

The composition of this suggestion database is itself informative. The domains Google chooses to suggest reflect its own reference set of sources notable enough to be offered to users. The question then arises: is this database the same everywhere, or does it vary by the user's country?

Die Zusammensetzung dieser Vorschlagsdatenbank ist an sich informativ. Die Domains, die Google zur Suggestion auswählt, spiegeln sein eigenes Referenzsystem von Quellen wider, die als bemerkenswert genug erachtet werden, um den Nutzern vorgeschlagen zu werden. Die Frage lautet: Ist diese Datenbank überall gleich, oder variiert sie je nach Land des Nutzers?

La composición de esta base de sugerencias es en sí misma informativa. Los dominios que Google elige sugerir reflejan su propio referencial de fuentes suficientemente notables para ser propuestas a los usuarios. La pregunta es: esta base de datos es la misma en todas partes, o varía según el país del usuario?

Périmètre de l'étude Scope of this study Umfang der Studie Alcance del estudio

Cette analyse porte sur six marchés : États-Unis (US), Royaume-Uni (GB), Allemagne (DE), Espagne (ES), France (FR) et Australie (AU). Pour chaque pays, nous avons collecté environ le top 10 000 des sites suggérés par Google le plus fréquemment, ce qui donne une idée des top sites par marché.

This analysis covers six markets: the United States (US), the United Kingdom (GB), Germany (DE), Spain (ES), France (FR) and Australia (AU). For each country, we collected approximately the top 10,000 sites most frequently suggested by Google, providing an overview of the top sites per market.

Diese Analyse umfasst sechs Märkte: die USA (US), das Vereinigte Königreich (GB), Deutschland (DE), Spanien (ES), Frankreich (FR) und Australien (AU). Für jedes Land haben wir etwa die Top 10.000 der am häufigsten von Google vorgeschlagenen Websites gesammelt, was einen Überblick über die Top-Websites pro Markt gibt.

Este análisis abarca seis mercados: Estados Unidos (US), Reino Unido (GB), Alemania (DE), España (ES), Francia (FR) y Australia (AU). Para cada país, recopilamos aproximadamente el top 10.000 de los sitios sugeridos con más frecuencia por Google, lo que da una idea de los principales sitios por mercado.

3

uvSitechunk : le concept du leak refait surface uvSitechunk: the leaked concept resurfaces uvSitechunk: Das geleakte Konzept taucht wieder auf uvSitechunk: el concepto filtrado reaparece

Le payload de suggest confirme un concept interne de Google documenté dans le leak de 2024 The suggest payload confirms an internal Google concept documented in the 2024 leak Die Suggest-Payload bestätigt ein internes Google-Konzept, das im Leak von 2024 dokumentiert wurde El payload de suggest confirma un concepto interno de Google documentado en la filtración de 2024

Un champ révélateur dans la réponse JSON

A revealing field in the JSON response

Ein aufschlussreiches Feld in der JSON-Antwort

Un campo revelador en la respuesta JSON

Chaque suggestion retournée par l'endpoint d'autocomplétion de Preferred Sources contient un champ uvSitechunk. Ce champ opère au niveau du domaine ou du sous-domaine : cnn.com et cnnespanol.cnn.com sont deux sitechunks distincts dans la même réponse.

Each suggestion returned by the Preferred Sources autocomplete endpoint contains a uvSitechunk field. This field operates at the domain or subdomain level: cnn.com and cnnespanol.cnn.com are two distinct sitechunks in the same response.

Jeder Vorschlag, der vom Preferred-Sources-Autocomplete-Endpunkt zurückgegeben wird, enthält ein Feld uvSitechunk. Dieses Feld operiert auf Domain- oder Subdomain-Ebene: cnn.com und cnnespanol.cnn.com sind zwei verschiedene Sitechunks in derselben Antwort.

Cada sugerencia devuelta por el endpoint de autocompletado de Preferred Sources contiene un campo uvSitechunk. Este campo opera a nivel de dominio o subdominio: cnn.com y cnnespanol.cnn.com son dos sitechunks distintos en la misma respuesta.

Réponse JSON de l'endpoint suggest JSON response from the suggest endpoint JSON-Antwort des Suggest-Endpunkts Respuesta JSON del endpoint suggest news-source-selection
["cnn", [
  ["CNN", 0, [], {
    "faviconUrl": "https://...favicons?domain=cnn.com",
    "uvSitechunk": "cnn.com"
  }],
  ["CNN en Español", 0, [], {
    "faviconUrl": "https://...favicons?domain=cnnespanol.cnn.com",
    "uvSitechunk": "cnnespanol.cnn.com"
  }]
], {"q": "..."}]

Le lien avec le leak Google de 2024

The connection to the 2024 Google leak

Die Verbindung zum Google-Leak von 2024

La conexión con la filtración de Google de 2024

Le terme "sitechunk" n'est pas nouveau. Il apparaît dans la documentation interne de Google exposée lors du leak de l'API Content Warehouse en 2024. Dans la structure QualityNsrNsrData, on retrouve un attribut siteChunk défini comme le "Primary NSR sitechunk", correspondant dans la plupart des cas à l'URL canonique sitechunkée au niveau HOST_LEVEL_V3. Un secondarySiteChunk fournit une granularité plus fine quand elle existe.

The term "sitechunk" is not new. It appears in Google's internal documentation exposed during the 2024 Content Warehouse API leak. In the QualityNsrNsrData structure, there is a siteChunk attribute defined as the "Primary NSR sitechunk," which in most cases corresponds to the HOST_LEVEL_V3 sitechunked canonical URL. A secondarySiteChunk provides finer granularity when available.

Der Begriff „sitechunk" ist nicht neu. Er erscheint in Googles interner Dokumentation, die beim Leak der Content Warehouse API 2024 offengelegt wurde. In der Struktur QualityNsrNsrData findet sich ein Attribut siteChunk, definiert als „Primary NSR sitechunk", das in den meisten Fällen der sitechunk-kanonischen URL auf HOST_LEVEL_V3-Ebene entspricht. Ein secondarySiteChunk bietet eine feinere Granularität, wenn verfügbar.

El término „sitechunk" no es nuevo. Aparece en la documentación interna de Google expuesta durante la filtración de la API Content Warehouse en 2024. En la estructura QualityNsrNsrData, se encuentra un atributo siteChunk definido como el „Primary NSR sitechunk", que en la mayoría de los casos corresponde a la URL canónica sitechunkeada a nivel HOST_LEVEL_V3. Un secondarySiteChunk proporciona una granularidad más fina cuando está disponible.

QualityNsrNsrData Google Content Warehouse API (leak 2024)
// From the leaked Google API Content Warehouse documentation

siteChunk: String
  // "Primary NSR sitechunk. In most cases same as
  //  HOST_LEVEL_V3 sitechunked canonical url"

secondarySiteChunk: String
  // "More granular chunking than primary sitechunks"

site2vecEmbedding: [Embedding]
  // "Site2vec embeddings"

site2vecEmbeddingEncoded: [EncodedEmbedding]
  // "Encoded site2vec embedding (for superroot)"

siteChunkSource: String
  // "Annotated in the Goldmine NSR annotator"

site2vec : des embeddings au niveau du site entier

site2vec: embeddings at the whole-site level

site2vec: Embeddings auf Gesamtsite-Ebene

site2vec: embeddings a nivel de sitio completo

Le leak révèle que le système NSR (probablement Normalized Site Rank) utilise une technologie d'embedding vectoriel appelée site2vec. Ce système génère des scores de qualité à plusieurs niveaux de granularité : site entier, chunk et article. Il intègre des données provenant d'au moins deux pipelines d'annotation propriétaires (Goldmine et Raffia), avec des catégories de signaux aux noms culinaires : Keto, Rhubarb, Tofu, et un score nommé ChardScore. Le fait que le payload de Preferred Sources utilise le terme uvSitechunk confirme que la représentation interne des sources chez Google fonctionne bien à cette granularité : domaine ou sous-domaine, pas page individuelle.

The leak reveals that the NSR system (probably Normalized Site Rank) leverages a vector embedding technology called site2vec. This system generates quality scores at multiple levels of granularity: site-wide, chunk-level, and article-specific. It integrates data from at least two proprietary annotation pipelines (Goldmine and Raffia), using signal categories with culinary-themed names: Keto, Rhubarb, Tofu, and a metric called ChardScore. The fact that the Preferred Sources payload uses the term uvSitechunk confirms that Google's internal representation of sources operates at this granularity: domain or subdomain, not individual page.

Das Leak zeigt, dass das NSR-System (wahrscheinlich Normalized Site Rank) eine vektorielle Embedding-Technologie namens site2vec nutzt. Dieses System generiert Qualitätsbewertungen auf mehreren Granularitätsebenen: gesamte Site, Chunk und Artikel. Es integriert Daten aus mindestens zwei proprietären Annotations-Pipelines (Goldmine und Raffia), mit kulinarisch benannten Signalkategorien: Keto, Rhubarb, Tofu und einer Metrik namens ChardScore. Die Tatsache, dass der Preferred-Sources-Payload den Begriff uvSitechunk verwendet, bestätigt, dass Googles interne Darstellung von Quellen auf dieser Granularitätsebene operiert: Domain oder Subdomain, nicht einzelne Seite.

La filtración revela que el sistema NSR (probablemente Normalized Site Rank) utiliza una tecnología de embedding vectorial llamada site2vec. Este sistema genera puntuaciones de calidad en múltiples niveles de granularidad: sitio completo, chunk y artículo. Integra datos de al menos dos pipelines de anotación propietarios (Goldmine y Raffia), con categorías de señales de nombres culinarios: Keto, Rhubarb, Tofu y una métrica llamada ChardScore. El hecho de que el payload de Preferred Sources utilice el término uvSitechunk confirma que la representación interna de fuentes de Google opera a esta granularidad: dominio o subdominio, no página individual.

Pour approfondir Further reading Weiterführende Lektüre Lectura adicional

L'analyse complète du système NSR, site2vec et des pipelines Goldmine/Raffia est disponible dans notre article Google Leak Part 3: From Words to Meaning.

The full analysis of the NSR system, site2vec, and the Goldmine/Raffia pipelines is available in our article Google Leak Part 3: From Words to Meaning.

Die vollständige Analyse des NSR-Systems, site2vec und der Goldmine/Raffia-Pipelines finden Sie in unserem Artikel Google Leak Part 3: From Words to Meaning.

El análisis completo del sistema NSR, site2vec y los pipelines Goldmine/Raffia está disponible en nuestro artículo Google Leak Part 3: From Words to Meaning.

4

Méthodologie de scoring Scoring methodology Scoring-Methodik Metodología de puntuación

Comment nous avons classé les domaines par popularité How we ranked domains by popularity Wie wir die Domains nach Popularität eingestuft haben Cómo clasificamos los dominios por popularidad

Nous avons mis en place un système de scoring qui tient compte de la langue de chaque pays. Pour chaque marché, nous avons testé les débuts de mots les plus fréquents dans la langue correspondante, sur trois niveaux de profondeur : 1 lettre, 2 lettres et 3 lettres. Le score de chaque domaine dépend de trois facteurs : le niveau de profondeur auquel il apparaît (un domaine visible dès la première lettre est plus proéminent), le ranking - c'est-à-dire sa position dans la liste des suggestions retournées par Google - et la fréquence d'apparition, car un domaine qui apparaît dans plusieurs requêtes différentes accumule plus de points qu'un domaine apparu une seule fois.

We built a scoring system that accounts for each country's language. For each market, we tested the most frequent word beginnings in the corresponding language, at three depth levels: 1 letter, 2 letters and 3 letters. Each domain's score depends on three factors: the depth level at which it appears (a domain visible from the first letter is more prominent), the ranking - its position in the list of suggestions returned by Google - and the frequency of appearance, since a domain that shows up across multiple different queries accumulates more points than one that appeared only once.

Wir haben ein Scoring-System entwickelt, das die Sprache jedes Landes berücksichtigt. Für jeden Markt haben wir die häufigsten Wortanfänge in der entsprechenden Sprache getestet, auf drei Tiefenebenen: 1 Buchstabe, 2 Buchstaben und 3 Buchstaben. Der Score jeder Domain hängt von drei Faktoren ab: der Tiefenebene, auf der sie erscheint (eine Domain, die schon beim ersten Buchstaben sichtbar ist, ist prominenter), dem Ranking - ihrer Position in der von Google zurückgegebenen Vorschlagsliste - und der Erscheinungshäufigkeit, da eine Domain, die in mehreren verschiedenen Anfragen auftaucht, mehr Punkte sammelt als eine, die nur einmal erschien.

Hemos implementado un sistema de puntuación que tiene en cuenta el idioma de cada país. Para cada mercado, probamos los inicios de palabra más frecuentes en el idioma correspondiente, en tres niveles de profundidad: 1 letra, 2 letras y 3 letras. La puntuación de cada dominio depende de tres factores: el nivel de profundidad en el que aparece (un dominio visible desde la primera letra es más prominente), el ranking - su posición en la lista de sugerencias devueltas por Google - y la frecuencia de aparición, ya que un dominio que aparece en varias consultas diferentes acumula más puntos que uno que apareció una sola vez.