Classement des top Preferred Sources selon Google aux US, UK, Australie, France, Espagne et Allemagne Ranking of the top Google Preferred Sources in the US, UK, Australia, France, Spain and Germany Ranking der Top-Preferred-Sources laut Google in den USA, UK, Australien, Frankreich, Spanien und Deutschland Clasificación de las principales Preferred Sources según Google en EE.UU., Reino Unido, Australia, Francia, España y Alemania
Le 30 avril 2026, Google a déployé "Preferred Sources" à l'échelle mondiale. Cette fonctionnalité suggère des domaines via un mécanisme d'autocomplétion. Or, ces suggestions ne sont pas universelles : chaque pays reçoit un jeu de domaines quasi-unique. Cette étude compare les datasets de six marchés - États-Unis, Royaume-Uni, Allemagne, Espagne, France et Australie - et met en évidence des catalogues de sources profondément distincts.
On April 30, 2026, Google rolled out "Preferred Sources" globally. This feature suggests domains through an autocomplete mechanism. However, these suggestions are not universal: each country receives a nearly unique set of domains. This study compares the datasets of six markets - the United States, the United Kingdom, Germany, Spain, France and Australia - and reveals profoundly distinct source catalogs.
Am 30. April 2026 hat Google "Preferred Sources" weltweit eingeführt. Diese Funktion schlägt Domains über einen Autocomplete-Mechanismus vor. Diese Vorschläge sind jedoch nicht universell: Jedes Land erhält einen nahezu einzigartigen Satz von Domains. Diese Studie vergleicht die Datasets von sechs Märkten - USA, Vereinigtes Königreich, Deutschland, Spanien, Frankreich und Australien - und zeigt grundlegend unterschiedliche Quellkataloge auf.
El 30 de abril de 2026, Google desplegó "Preferred Sources" a nivel mundial. Esta función sugiere dominios mediante un mecanismo de autocompletado. Sin embargo, estas sugerencias no son universales: cada país recibe un conjunto de dominios casi único. Este estudio compara los conjuntos de datos de seis mercados - Estados Unidos, Reino Unido, Alemania, España, Francia y Australia - y revela catálogos de fuentes profundamente distintos.
Parcourez et recherchez les domaines suggérés par Google dans chaque marché Browse and search the domains Google suggests in each market Durchsuchen Sie die von Google in jedem Markt vorgeschlagenen Domains Explore y busque los dominios que Google sugiere en cada mercado
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
| Extension Extension Erweiterung Extensión | Count Nombre Anzahl Cantidad | % |
|---|
Un nouveau levier de personnalisation des résultats Google A new way for users to customize their Google Search results Eine neue Möglichkeit zur Personalisierung der Google-Suchergebnisse Una nueva forma de personalizar los resultados de búsqueda de Google
Le 30 avril 2026, Google a annoncé le déploiement mondial de "Preferred Sources". Cette fonctionnalité permet aux utilisateurs d'indiquer les sites qu'ils souhaitent voir plus ou moins fréquemment dans leurs résultats de recherche. En pratique, lorsqu'un utilisateur active cette option, Google lui propose des domaines via un mécanisme d'autocomplétion : l'utilisateur commence à taper un nom et Google suggère des sites correspondants depuis une base interne.
On April 30, 2026, Google announced the global rollout of "Preferred Sources." This feature allows users to indicate which websites they want to see more or less frequently in their search results. In practice, when a user activates this option, Google suggests domains through an autocomplete mechanism: the user starts typing a name and Google suggests matching sites from an internal database.
Am 30. April 2026 kündigte Google die weltweite Einführung von "Preferred Sources" an. Diese Funktion ermöglicht es Nutzern anzugeben, welche Websites sie häufiger oder seltener in ihren Suchergebnissen sehen möchten. In der Praxis schlägt Google dem Nutzer Domains über einen Autocomplete-Mechanismus vor: Der Nutzer beginnt einen Namen einzutippen und Google schlägt passende Seiten aus einer internen Datenbank vor.
El 30 de abril de 2026, Google anunció el despliegue global de "Preferred Sources". Esta función permite a los usuarios indicar qué sitios web desean ver con más o menos frecuencia en sus resultados de búsqueda. En la práctica, cuando un usuario activa esta opción, Google sugiere dominios mediante un mecanismo de autocompletado: el usuario empieza a escribir un nombre y Google sugiere sitios correspondientes de una base de datos interna.
La composition de cette base de suggestions est en soi une information. Les domaines que Google choisit de proposer reflètent son propre référentiel de sources suffisamment notables pour être suggérées aux utilisateurs. La question qui se pose : cette base est-elle identique partout dans le monde, ou varie-t-elle selon le pays de l'utilisateur ?
The composition of this suggestion database is itself informative. The domains Google chooses to suggest reflect its own reference set of sources notable enough to be offered to users. The question then arises: is this database the same everywhere, or does it vary by the user's country?
Die Zusammensetzung dieser Vorschlagsdatenbank ist an sich informativ. Die Domains, die Google zur Suggestion auswählt, spiegeln sein eigenes Referenzsystem von Quellen wider, die als bemerkenswert genug erachtet werden, um den Nutzern vorgeschlagen zu werden. Die Frage lautet: Ist diese Datenbank überall gleich, oder variiert sie je nach Land des Nutzers?
La composición de esta base de sugerencias es en sí misma informativa. Los dominios que Google elige sugerir reflejan su propio referencial de fuentes suficientemente notables para ser propuestas a los usuarios. La pregunta es: esta base de datos es la misma en todas partes, o varía según el país del usuario?
Cette analyse porte sur six marchés : États-Unis (US), Royaume-Uni (GB), Allemagne (DE), Espagne (ES), France (FR) et Australie (AU). Pour chaque pays, nous avons collecté environ le top 10 000 des sites suggérés par Google le plus fréquemment, ce qui donne une idée des top sites par marché.
This analysis covers six markets: the United States (US), the United Kingdom (GB), Germany (DE), Spain (ES), France (FR) and Australia (AU). For each country, we collected approximately the top 10,000 sites most frequently suggested by Google, providing an overview of the top sites per market.
Diese Analyse umfasst sechs Märkte: die USA (US), das Vereinigte Königreich (GB), Deutschland (DE), Spanien (ES), Frankreich (FR) und Australien (AU). Für jedes Land haben wir etwa die Top 10.000 der am häufigsten von Google vorgeschlagenen Websites gesammelt, was einen Überblick über die Top-Websites pro Markt gibt.
Este análisis abarca seis mercados: Estados Unidos (US), Reino Unido (GB), Alemania (DE), España (ES), Francia (FR) y Australia (AU). Para cada país, recopilamos aproximadamente el top 10.000 de los sitios sugeridos con más frecuencia por Google, lo que da una idea de los principales sitios por mercado.
Le payload de suggest confirme un concept interne de Google documenté dans le leak de 2024 The suggest payload confirms an internal Google concept documented in the 2024 leak Die Suggest-Payload bestätigt ein internes Google-Konzept, das im Leak von 2024 dokumentiert wurde El payload de suggest confirma un concepto interno de Google documentado en la filtración de 2024
Chaque suggestion retournée par l'endpoint d'autocomplétion de Preferred Sources contient un champ uvSitechunk. Ce champ opère au niveau du domaine ou du sous-domaine : cnn.com et cnnespanol.cnn.com sont deux sitechunks distincts dans la même réponse.
Each suggestion returned by the Preferred Sources autocomplete endpoint contains a uvSitechunk field. This field operates at the domain or subdomain level: cnn.com and cnnespanol.cnn.com are two distinct sitechunks in the same response.
Jeder Vorschlag, der vom Preferred-Sources-Autocomplete-Endpunkt zurückgegeben wird, enthält ein Feld uvSitechunk. Dieses Feld operiert auf Domain- oder Subdomain-Ebene: cnn.com und cnnespanol.cnn.com sind zwei verschiedene Sitechunks in derselben Antwort.
Cada sugerencia devuelta por el endpoint de autocompletado de Preferred Sources contiene un campo uvSitechunk. Este campo opera a nivel de dominio o subdominio: cnn.com y cnnespanol.cnn.com son dos sitechunks distintos en la misma respuesta.
["cnn", [ ["CNN", 0, [], { "faviconUrl": "https://...favicons?domain=cnn.com", "uvSitechunk": "cnn.com" }], ["CNN en Español", 0, [], { "faviconUrl": "https://...favicons?domain=cnnespanol.cnn.com", "uvSitechunk": "cnnespanol.cnn.com" }] ], {"q": "..."}]
Le terme "sitechunk" n'est pas nouveau. Il apparaît dans la documentation interne de Google exposée lors du leak de l'API Content Warehouse en 2024. Dans la structure QualityNsrNsrData, on retrouve un attribut siteChunk défini comme le "Primary NSR sitechunk", correspondant dans la plupart des cas à l'URL canonique sitechunkée au niveau HOST_LEVEL_V3. Un secondarySiteChunk fournit une granularité plus fine quand elle existe.
The term "sitechunk" is not new. It appears in Google's internal documentation exposed during the 2024 Content Warehouse API leak. In the QualityNsrNsrData structure, there is a siteChunk attribute defined as the "Primary NSR sitechunk," which in most cases corresponds to the HOST_LEVEL_V3 sitechunked canonical URL. A secondarySiteChunk provides finer granularity when available.
Der Begriff „sitechunk" ist nicht neu. Er erscheint in Googles interner Dokumentation, die beim Leak der Content Warehouse API 2024 offengelegt wurde. In der Struktur QualityNsrNsrData findet sich ein Attribut siteChunk, definiert als „Primary NSR sitechunk", das in den meisten Fällen der sitechunk-kanonischen URL auf HOST_LEVEL_V3-Ebene entspricht. Ein secondarySiteChunk bietet eine feinere Granularität, wenn verfügbar.
El término „sitechunk" no es nuevo. Aparece en la documentación interna de Google expuesta durante la filtración de la API Content Warehouse en 2024. En la estructura QualityNsrNsrData, se encuentra un atributo siteChunk definido como el „Primary NSR sitechunk", que en la mayoría de los casos corresponde a la URL canónica sitechunkeada a nivel HOST_LEVEL_V3. Un secondarySiteChunk proporciona una granularidad más fina cuando está disponible.
// From the leaked Google API Content Warehouse documentation siteChunk: String // "Primary NSR sitechunk. In most cases same as // HOST_LEVEL_V3 sitechunked canonical url" secondarySiteChunk: String // "More granular chunking than primary sitechunks" site2vecEmbedding: [Embedding] // "Site2vec embeddings" site2vecEmbeddingEncoded: [EncodedEmbedding] // "Encoded site2vec embedding (for superroot)" siteChunkSource: String // "Annotated in the Goldmine NSR annotator"
Le leak révèle que le système NSR (probablement Normalized Site Rank) utilise une technologie d'embedding vectoriel appelée site2vec. Ce système génère des scores de qualité à plusieurs niveaux de granularité : site entier, chunk et article. Il intègre des données provenant d'au moins deux pipelines d'annotation propriétaires (Goldmine et Raffia), avec des catégories de signaux aux noms culinaires : Keto, Rhubarb, Tofu, et un score nommé ChardScore. Le fait que le payload de Preferred Sources utilise le terme uvSitechunk confirme que la représentation interne des sources chez Google fonctionne bien à cette granularité : domaine ou sous-domaine, pas page individuelle.
The leak reveals that the NSR system (probably Normalized Site Rank) leverages a vector embedding technology called site2vec. This system generates quality scores at multiple levels of granularity: site-wide, chunk-level, and article-specific. It integrates data from at least two proprietary annotation pipelines (Goldmine and Raffia), using signal categories with culinary-themed names: Keto, Rhubarb, Tofu, and a metric called ChardScore. The fact that the Preferred Sources payload uses the term uvSitechunk confirms that Google's internal representation of sources operates at this granularity: domain or subdomain, not individual page.
Das Leak zeigt, dass das NSR-System (wahrscheinlich Normalized Site Rank) eine vektorielle Embedding-Technologie namens site2vec nutzt. Dieses System generiert Qualitätsbewertungen auf mehreren Granularitätsebenen: gesamte Site, Chunk und Artikel. Es integriert Daten aus mindestens zwei proprietären Annotations-Pipelines (Goldmine und Raffia), mit kulinarisch benannten Signalkategorien: Keto, Rhubarb, Tofu und einer Metrik namens ChardScore. Die Tatsache, dass der Preferred-Sources-Payload den Begriff uvSitechunk verwendet, bestätigt, dass Googles interne Darstellung von Quellen auf dieser Granularitätsebene operiert: Domain oder Subdomain, nicht einzelne Seite.
La filtración revela que el sistema NSR (probablemente Normalized Site Rank) utiliza una tecnología de embedding vectorial llamada site2vec. Este sistema genera puntuaciones de calidad en múltiples niveles de granularidad: sitio completo, chunk y artículo. Integra datos de al menos dos pipelines de anotación propietarios (Goldmine y Raffia), con categorías de señales de nombres culinarios: Keto, Rhubarb, Tofu y una métrica llamada ChardScore. El hecho de que el payload de Preferred Sources utilice el término uvSitechunk confirma que la representación interna de fuentes de Google opera a esta granularidad: dominio o subdominio, no página individual.
L'analyse complète du système NSR, site2vec et des pipelines Goldmine/Raffia est disponible dans notre article Google Leak Part 3: From Words to Meaning.
The full analysis of the NSR system, site2vec, and the Goldmine/Raffia pipelines is available in our article Google Leak Part 3: From Words to Meaning.
Die vollständige Analyse des NSR-Systems, site2vec und der Goldmine/Raffia-Pipelines finden Sie in unserem Artikel Google Leak Part 3: From Words to Meaning.
El análisis completo del sistema NSR, site2vec y los pipelines Goldmine/Raffia está disponible en nuestro artículo Google Leak Part 3: From Words to Meaning.
Comment nous avons classé les domaines par popularité How we ranked domains by popularity Wie wir die Domains nach Popularität eingestuft haben Cómo clasificamos los dominios por popularidad
Nous avons mis en place un système de scoring qui tient compte de la langue de chaque pays. Pour chaque marché, nous avons testé les débuts de mots les plus fréquents dans la langue correspondante, sur trois niveaux de profondeur : 1 lettre, 2 lettres et 3 lettres. Le score de chaque domaine dépend de trois facteurs : le niveau de profondeur auquel il apparaît (un domaine visible dès la première lettre est plus proéminent), le ranking - c'est-à-dire sa position dans la liste des suggestions retournées par Google - et la fréquence d'apparition, car un domaine qui apparaît dans plusieurs requêtes différentes accumule plus de points qu'un domaine apparu une seule fois.
We built a scoring system that accounts for each country's language. For each market, we tested the most frequent word beginnings in the corresponding language, at three depth levels: 1 letter, 2 letters and 3 letters. Each domain's score depends on three factors: the depth level at which it appears (a domain visible from the first letter is more prominent), the ranking - its position in the list of suggestions returned by Google - and the frequency of appearance, since a domain that shows up across multiple different queries accumulates more points than one that appeared only once.
Wir haben ein Scoring-System entwickelt, das die Sprache jedes Landes berücksichtigt. Für jeden Markt haben wir die häufigsten Wortanfänge in der entsprechenden Sprache getestet, auf drei Tiefenebenen: 1 Buchstabe, 2 Buchstaben und 3 Buchstaben. Der Score jeder Domain hängt von drei Faktoren ab: der Tiefenebene, auf der sie erscheint (eine Domain, die schon beim ersten Buchstaben sichtbar ist, ist prominenter), dem Ranking - ihrer Position in der von Google zurückgegebenen Vorschlagsliste - und der Erscheinungshäufigkeit, da eine Domain, die in mehreren verschiedenen Anfragen auftaucht, mehr Punkte sammelt als eine, die nur einmal erschien.
Hemos implementado un sistema de puntuación que tiene en cuenta el idioma de cada país. Para cada mercado, probamos los inicios de palabra más frecuentes en el idioma correspondiente, en tres niveles de profundidad: 1 letra, 2 letras y 3 letras. La puntuación de cada dominio depende de tres factores: el nivel de profundidad en el que aparece (un dominio visible desde la primera letra es más prominente), el ranking - su posición en la lista de sugerencias devueltas por Google - y la frecuencia de aparición, ya que un dominio que aparece en varias consultas diferentes acumula más puntos que uno que apareció una sola vez.