На 13 март 2024 г. Google случайно публикува вътрешната си документация за Content Warehouse API в публично GitHub хранилище, разкривайки най-големите тайни на алгоритъма за търсене в 25-годишната история на компанията.
Ключови факти за изтичането:
- 14,014 ранкинг атрибута в 2,596 модула
- 2,500+ страници вътрешна документация на Google
- Потвърдено от Google на 29 май 2024
- NavBoost система използва данни от кликове въпреки публичните отричания
Изтичането беше открито от Erfan Azimi и анализирано от индустриални експерти като Rand Fishkin и Mike King, предоставя безпрецедентен поглед върху това как действително работи Google Search.
Източник: supple.com.au
Документацията разкрива систематични противоречия между публичните заявления на Google и техните действителни практики, потвърждавайки дългогодишни подозрения на SEO общността относно използването на данни от кликове, доменна авторитет и Chrome браузър данни за ранкиране.
Техническите детайли на изтичането: какво точно се случи
Изтичането се случи поради грешка в автоматизираните системи на Google. На 13 март 2024, роботът „yoshi-code-bot“ качи над 2,500 страници документация в публичното GitHub хранилище на Google, лицензирани под Apache 2.0, което предостави широки права за използване.
Хронология на събитията
| Дата | Събитие | Значение |
|---|---|---|
| 13 март 2024 | Документите случайно публикувани в GitHub | Началото на най-голямото изтичане в историята на Google |
| 27 март 2024 | Кодът пуснат с Apache 2.0 лиценз | Легални права за използване на документацията |
| 5 май 2024 | Erfan Azimi свързва с Rand Fishkin | Започва професионалния анализ |
| 7 май 2024 | Google опит за премахване | Потвърждение за автентичността |
| 27 май 2024 | Публично разкриване | SEO общността получава достъп |
| 29 май 2024 | Официално потвърждение от Google | Краят на спекулациите за достоверност |
Архитектурата на Google Search: разкритие на 14,014 ранкинг фактора
Изтеклата документация разкрива, че Google Search работи като серия от микросервиси, а не като единичен монолитен алгоритъм. Системата се състои от взаимосвързани модули, които обработват различни аспекти на търсенето и ранкирането.
Основни системи за ранкиране
Ключови компоненти на системата:
- Ascorer: Първичният алгоритъм за ранкиране, който обработва страниците преди пре-ранкиращите корекции
- SuperRoot: „Мозъкът“ който управлява пост-обработката и координира всички системи
- Alexandria: Основната система за индексиране на съдържание
- SegIndexer: Класифицира документите в нива на качество в индекса
- TeraGoogle: Вторична система за индексиране за дългосрочно съхранение
Категоризация на 14,014 атрибута
Анализът на изтеклата документация разкрива следните основни категории ранкинг фактори:
Разпределение по категории:
- Взаимодействие с потребители: 847 атрибута (NavBoost система)
- Качество на съдържанието: 1,203 атрибута
- Анализ на връзки: 756 атрибута
- Авторитет на сайт: 412 атрибута
- Технически фактори: 1,891 атрибута
- Други специализирани системи: 8,905 атрибута
NavBoost система: най-силният сигнал за ранкиране
NavBoost е описана като „един от най-силните сигнали за ранкиране в Google“ и е споменавана 84 пъти в изтеклата документация. Тази система използва данни от кликове за пре-ранкиране на резултатите, въпреки многократните публични отричания от Google.
Източник: www.buildersociety.com
Как работи NavBoost
NavBoost функционира като система за пре-ранкиране, която анализира поведението на потребителите и прилага корекции въз основа на:
Видове клик сигнали в NavBoost:
- goodClicks: Положителни кликове с дълго задържане
- badClicks: Негативни кликове с бързо връщане
- lastLongestClicks: Метрики за продължителност на сесията
- unsquashedClicks: Необработени клик данни преди нормализиране
- unicornClicks: Кликове от верифицирани висококачествени потребители
Техническите механизми на NavBoost
Системата използва 13-месечен подвижен прозорец от клик данни и прилага няколко ключови техники:
- Geo-сегментиране: Анализ на данни по държави и типове устройства
- „Squashing“ функции: Предотвратяване на манипулации чрез нормализиране
- Групиране на заявки: Свързване на подобни търсения въз основа на потребителски намерения
- Тренд детекция: Идентифициране на нарастващо търсене
Chrome данни в ранкирането
Документацията разкрива използването на данни от Chrome браузъра, включително атрибути като chromeInTotal и пълен clickstream анализ. Това противоречи на заявленията на Google, че не използват Chrome данни за ранкиране.
Panda алгоритъм: актуализирани технически детайли
Изтичането предоставя нови подробности за функционирането на Panda алгоритъма, включително неговата интеграция с NavBoost системата.
Техническо функциониране на Panda
Според изтеклата документация, Panda използва модификатор за скориране базиран на формулата:
Baby Panda версии
Документацията споменава две версии на „Baby Panda“:
- babyPandaDemotion: Основна версия за понижаване на качеството
- babyPandaV2Demotion: Подобрена версия работеща върху оригиналния Panda
Доменен авторитет: потвърждение въпреки отриченията
Едно от най-значимите откритията е съществуването на метрика наречена „siteAuthority“, въпреки многократните отричания от Google представители.

Противоречие с публичните заявления:
Публично заявление на Gary Illyes (Google): „Ние нямаме нищо като доменен авторитет“ Реалност от изтичането: Атрибутът siteAuthority е ясно документиран и се използва в Q* ранкиращата система

Как се измерва домейн авторитет
Системата използва няколко ключови компонента:
- Homepage PageRank: PageRank-ът на началната страница се прилага към всички страници на сайта
- Site Embeddings: Векторни представяния измерващи тематична последователност
- Host Age: Възрастта на домейна, използвана за „sandboxing“ на нови сайтове
Системи за качество и специализирано ранкиране
Twiddler framework
Google използва система наречена „Twiddlers“ за пре-ранкиране на резултатите след първичното скориране:
Примери за Twiddler системи:
- FreshnessTwiddler: Пре-ранкиране по актуалност на съдържанието
- QualityBoost: Корекции базирани на качеството
- RealTimeBoost: Обработка на real-time трендове
- WebImageBoost: Специализирано ранкиране за изображения
YMYL и специализирано съдържание
Документацията потвърждава съществуването на специални класификатори за Your Money Your Life (YMYL) съдържание:
- Здравни класификатори: Специализирани алгоритми за медицинско съдържание
- Финансови сигнали: Отделни метрики за финансови съвети
- Новинарски качество: Специфични измерения за новинарско съдържание
Реакции на SEO експертите и индустриални анализи
SEO общността реагира с комбинация от валидация и възмущение към разкритията в изтичането.
Ключови реакции от експерти
Rand Fishkin: „Това е най-голямото изтичане за останалите 25 години… никое изтичане с такава величина или подробност никога не е било докладвано от търсещия отдел на Google.“
Mike King (iPullRank): „Доказателството е достатъчно категорично – може да има малко съмнение, че Google използва кликове и пост-клик поведение като част от алгоритмите си за ранкиране.“
Barry Schwartz: „Вярвам, че това е истинско изтичане, но не мисля, че е било изтекло умишлено… от всичко което знам за Google, детайлите в изтичането изглеждат много реални.“
Промяна в доверието към Google
Анкета на Barry Schwartz показа, че само 10% от маркетърите вярват на Google след изтичането. Това представлява фундаментална промяна в отношенията между SEO общността и Google.
Практически препоръки за български SEO специалисти
Въз основа на разкритията от изтичането, ето конкретни препоръки за оптимизация:
Незабавни действия (следващите 30 дни)
1. Аудит на клик показатели
- Анализирайте CTR, bounce rate и engagement метрики в Google Analytics
- Идентифицирайте страници с ниски показатели за клик-через
- Тествайте различни заглавия и meta описания
2. Консистентност на датите
- Проверете съответствието на дати в structured data, URL-и и съдържание
- Внедрете правилно bylineDate маркиране
- Актуализирайте XML sitemaps с точни lastmod дати
Средносрочна стратегия (3-6 месеца)
Изграждане на брандова разпознаваемост
NavBoost системата анализира навигационни търсения, което прави брандовото разпознаване критично:
- Offline маркетинг: Рекламни табели и традиционна реклама стимулират брандови търсения
- PR кампании: Медийни спомени увеличават навигационните заявки
- Социални медии: Активност извън Google подпомага брандовото разпознаване
Програма за обновяване на съдържание
Google следи три типа дати за всяка страница:
| Тип дата | Описание | Как да оптимизирате |
|---|---|---|
| bylineDate | Изрична дата на страницата | Structured data markup с правилна дата |
| syntacticDate | Дата от URL или заглавие | Консистентност между URL и заглавие |
| semanticDate | Дата извлечена от съдържанието | Ясни времеви маркери в текста |
Дългосрочен подход (6-12 месеца)
Оптимизация за потребителско взаимодействие
Тъй като NavBoost анализира различни видове кликове, фокусирайте се върху:
Подобряване на „good clicks“:
- Създайте задълбочено, полезно съдържание което задържа потребителите
- Използвайте разказни техники и практически примери
- Внедрете интерактивни елементи като видеа и инфографики
- Подобрете вътрешното свързване за по-дълги сесии
Избягвайте „bad clicks“:
- Заблуждаващи заглавия които не отговарят на съдържанието
- Бавно зареждащи се страници
- трудно читаемо или нерелевантно съдържание
- Агресивни pop-up-и и реклами
Стратегия за качествени връзки
Изтичането разкрива, че Google класифицира връзките в три нива на качество:
- Високо качество: Fresh документи и високо-авторитетни източници във flash памет
- Средно качество: Умерено авторитетни източници на SSD дискове
- Ниско качество: Нискo авторитетни или игнорирани връзки
Технически SEO приоритети въз основа на изтичането
Мобилна оптимизация
Google специфично следи isSmartphoneOptimized сигнали:
Структурирани данни и entity markup
Документацията показва, че Google активно разпознава и съхранява автори и entities:
- Автор entities: Изградете профили на автори с E-E-A-T сигнали
- Organization markup: Структурирани данни за компании и организации
- Review entities: Proper markup за отзиви и рейтинги
Technical crawling оптимизация
Trawler системата управлява crawl честотата въз основа на:
- Актуалност на съдържанието: По-често актуализирани сайтове се crawl-ват повече
- Качество на сайта: Високо качество сайтове получават повече crawl budget
- User engagement: Сайтове с високо взаимодействие се обхождат по-често
YMYL съдържание и специализирани области
За българските YMYL сайтове (здраве, финанси, новини), изтичането предоставя конкретни насоки:
Здравни сайтове
Препоръки за медицински съдържание:
- Ясна атрибуция към лицензирани лекари
- Медицински справки и източници
- Регулярно актуализиране на медицинска информация
- Disclaimer-и за медицински съвети
Финансови сайтове
- Автор credentials: Финансови сертификати и квалификации
- Актуални данни: Регулярно актуализиране на финансови данни
- Регулаторни compliance: Спазване на финансови регулации
Новинарски сайтове
Google използва специализирани новинарски алгоритми:
Ключови фактори за новини:
- Автор авторитет: Репутация на журналисти
- Оригиналност: Първичен източник срещу копиране
- Актуалност: Времева релевантност на новините
- Географска релевантност: Местни новини за български потребители
Анализ на конкуренцията и възможности за български сайтове
Класификацията „малки лични сайтове“
Изтичането разкрива специална класификация за „small personal sites“ която може да бъде boost-вана или понижавана. Това създава възможности за български малки бизнеси:
Географски сигнали за България
NavBoost анализира данни по държави, което означава че:
- Българските потребителски поведения влияят на ранкирането в България
- Локалните търсене навици се отразяват в алгоритъма
- Качественото българско съдържание може да има предимство
Инструменти и метрики за измерване на успеха
Ключови показатели за наблюдение
| Метрика | Връзка с изтичането | Как да измерите |
|---|---|---|
| Органичен CTR | NavBoost „goodClicks“ | Google Search Console, положение срещу CTR |
| Dwell time | „lastLongestClicks“ | Google Analytics, средно време на страница |
| Bounce rate | „badClicks“ индикатор | Google Analytics, анализ по страници |
| Брандови търсения | Навигационни заявки в NavBoost | Google Trends, Search Console брандови заявки |
| Backlink качество | Три-нивова класификация на връзки | Ahrefs, Majestic, анализ на референтни домейни |
Тестване и експериментиране
Въз основа на изтичането, приоритизирайте тестовете в следния ред:
Приоритетни A/B тестове:
- Title tag оптимизация: Тествайте различни формати за подобряване на CTR
- Content freshness: Експериментирайте с честотата на актуализации
- Internal linking: Тествайте различни стратегии за задържане
- User engagement: Сравнете различни подходи за намаляване на bounce rate
Бъдещето на SEO в светлината на изтичането
Изтичането на Google алгоритъма променя фундаментално как трябва да мислим за SEO:
От тактически към стратегически подход
Традиционният подход на „оптимизация за алгоритми“ се заменя от „оптимизация за потребители“. NavBoost системата показва че Google измерва истинското потребителско поведение в реално време.
Интеграция на онлайн и офлайн маркетинг
Тъй като NavBoost анализира брандови търсения, офлайн маркетинговите активности директно влияят върху SEO резултатите:
- Традиционна реклама: TV, радио, и печатна реклама стимулират брандови търсения
- Събития и конференции: Физическо присъствие увеличава брандовото разпознаване
- PR и медийни спомени: Публикации в традиционни медии подпомагат SEO
Дългосрочно мислене за авторитет
Потвърждението на siteAuthority метриката означава че изграждането на доменов авторитет е дългосрочна инвестиция:
Заключение: новата ера на информирано SEO
Изтичането на Google алгоритъма от март 2024 представлява водораздел в историята на SEO. За първи път разполагаме с конкретни, технически доказателства за това как действително работи най-важният търсещ алгоритъм в света. Ключовите изводи за българските SEO специалисти са:
Основни изводи:
- Потребителското поведение е ключово: NavBoost системата прави кликовете и взаимодействието критични
- Брандът има значение: Навигационните търсения и разпознаваемостта влияят директно на ранкирането
- Качеството надделява: Многослойните системи за качество награждават истинската стойност
- Техническата прецизност е важна: Правилните дати, структура и markup подпомагат алгоритъма
- Дългосрочното мислене печели: Доменовият авторитет и последователността са ключови
За българския SEO пазар това изтичане предоставя уникална възможност да се фокусираме върху създаване на истинска стойност за потребителите, като използваме конкретни технически знания за оптимизация. Най-важното послание: Успешното SEO вече не е въпрос на техническо надхитряване, а на създаване на бранд и съдържание които потребителите искат да търсят, на които искат да кликват и с които искат да взаимодействат.
Следващи стъпки за български SEO специалисти:
- Аудитирайте текущите си метрики за потребителско взаимодействие
- Инвестирайте в стратегии за изграждане на брандова разпознаваемост
- Фокусирайте се върху създаване на съдържание което генерира „good clicks“
- Изградете дългосрочни стратегии за качество и авторитет
- Тествайте и измервайте всичко въз основа на новите знания
Изтичането на Google алгоритъма не само разкри тайните на търсенето – то промени правилата на играта към по-прозрачен, основан на стойност подход към SEO. За специалистите които адаптират стратегиите си съответно, възможностите са безгранични.
Този анализ е базиран на изтеклата документация на Google Content Warehouse API, експертен анализ от Rand Fishkin и Mike King, и реакции от водещи SEO специалисти в индустрията. Информацията е актуална към юли 2025.
Източници и допълнителна информация:
- iPullRank: „An Anonymous Source Shared Thousands of Leaked Google Search API Documents“
- SparkToro: „Google Search’s Guidance About AI Content Helpfulness is Hypocritical“
- Search Engine Land: „Google’s ranking systems leak analysis“
- The Verge: „Google confirms the leaked Search documents are real“
- Search Engine Roundtable: множество анализи и експертни мнения