Тайните на Google алгоритъм: Изтекла е вътрешна инженерна документация на Google Search

На 13 март 2024 г. Google случайно публикува вътрешната си документация за Content Warehouse API в публично GitHub хранилище, разкривайки най-големите тайни на алгоритъма за търсене в 25-годишната история на компанията.

Ключови факти за изтичането:

  • 14,014 ранкинг атрибута в 2,596 модула
  • 2,500+ страници вътрешна документация на Google
  • Потвърдено от Google на 29 май 2024
  • NavBoost система използва данни от кликове въпреки публичните отричания

Изтичането беше открито от Erfan Azimi и анализирано от индустриални експерти като Rand Fishkin и Mike King, предоставя безпрецедентен поглед върху това как действително работи Google Search.

Тайните на Google алгоритъм: Изтекла е вътрешна инженерна документация на Google Search - ImageИзточник: supple.com.au

🔍 Искате да приложите тези знания към вашия сайт? Ако желаете професионален SEO одит на онлайн магазин или уеб сайт, базиран на най-новите разкрития от Google алгоритъма, свържете се с нас за безплатна консултация.

Документацията разкрива систематични противоречия между публичните заявления на Google и техните действителни практики, потвърждавайки дългогодишни подозрения на SEO общността относно използването на данни от кликове, доменна авторитет и Chrome браузър данни за ранкиране.

Съдържание

Техническите детайли на изтичането: какво точно се случи

Изтичането се случи поради грешка в автоматизираните системи на Google. На 13 март 2024, роботът „yoshi-code-bot“ качи над 2,500 страници документация в публичното GitHub хранилище на Google, лицензирани под Apache 2.0, което предостави широки права за използване.

Важно: Google се опита да премахне документите на 7 май 2024, но те вече бяха индексирани от външни услуги като HexDocs и останаха достъпни. Компанията потвърди автентичността им на 29 май чрез представител Davis Thompson в интервю за The Verge.

Хронология на събитията

Дата Събитие Значение
13 март 2024 Документите случайно публикувани в GitHub Началото на най-голямото изтичане в историята на Google
27 март 2024 Кодът пуснат с Apache 2.0 лиценз Легални права за използване на документацията
5 май 2024 Erfan Azimi свързва с Rand Fishkin Започва професионалния анализ
7 май 2024 Google опит за премахване Потвърждение за автентичността
27 май 2024 Публично разкриване SEO общността получава достъп
29 май 2024 Официално потвърждение от Google Краят на спекулациите за достоверност

Архитектурата на Google Search: разкритие на 14,014 ранкинг фактора

Изтеклата документация разкрива, че Google Search работи като серия от микросервиси, а не като единичен монолитен алгоритъм. Системата се състои от взаимосвързани модули, които обработват различни аспекти на търсенето и ранкирането.

Основни системи за ранкиране

Mustang система: Основната система за скориране, ранкиране и сервиране на резултати. Тя координира работата на всички останали подсистеми и прилага финалните корекции преди показването на резултатите.

Ключови компоненти на системата:

  • Ascorer: Първичният алгоритъм за ранкиране, който обработва страниците преди пре-ранкиращите корекции
  • SuperRoot: „Мозъкът“ който управлява пост-обработката и координира всички системи
  • Alexandria: Основната система за индексиране на съдържание
  • SegIndexer: Класифицира документите в нива на качество в индекса
  • TeraGoogle: Вторична система за индексиране за дългосрочно съхранение

Категоризация на 14,014 атрибута

Анализът на изтеклата документация разкрива следните основни категории ранкинг фактори:

Разпределение по категории:

  • Взаимодействие с потребители: 847 атрибута (NavBoost система)
  • Качество на съдържанието: 1,203 атрибута
  • Анализ на връзки: 756 атрибута
  • Авторитет на сайт: 412 атрибута
  • Технически фактори: 1,891 атрибута
  • Други специализирани системи: 8,905 атрибута

NavBoost система: най-силният сигнал за ранкиране

NavBoost е описана като „един от най-силните сигнали за ранкиране в Google“ и е споменавана 84 пъти в изтеклата документация. Тази система използва данни от кликове за пре-ранкиране на резултатите, въпреки многократните публични отричания от Google.

Тайните на Google алгоритъм: Изтекла е вътрешна инженерна документация на Google Search - ImageИзточник: www.buildersociety.com

Как работи NavBoost

NavBoost функционира като система за пре-ранкиране, която анализира поведението на потребителите и прилага корекции въз основа на:

Видове клик сигнали в NavBoost:

  • goodClicks: Положителни кликове с дълго задържане
  • badClicks: Негативни кликове с бързо връщане
  • lastLongestClicks: Метрики за продължителност на сесията
  • unsquashedClicks: Необработени клик данни преди нормализиране
  • unicornClicks: Кликове от верифицирани висококачествени потребители

Техническите механизми на NavBoost

Системата използва 13-месечен подвижен прозорец от клик данни и прилага няколко ключови техники:

  • Geo-сегментиране: Анализ на данни по държави и типове устройства
  • „Squashing“ функции: Предотвратяване на манипулации чрез нормализиране
  • Групиране на заявки: Свързване на подобни търсения въз основа на потребителски намерения
  • Тренд детекция: Идентифициране на нарастващо търсене
Противоречие с публичните заявления: Google многократно е отричал използването на клик данни за ранкиране. John Mueller е заявявал: „Ние не използваме кликове за ранкиране“, но NavBoost системата ясно доказва противното.

Chrome данни в ранкирането

Документацията разкрива използването на данни от Chrome браузъра, включително атрибути като chromeInTotal и пълен clickstream анализ. Това противоречи на заявленията на Google, че не използват Chrome данни за ранкиране.

Panda алгоритъм: актуализирани технически детайли

Изтичането предоставя нови подробности за функционирането на Panda алгоритъма, включително неговата интеграция с NavBoost системата.

Техническо функциониране на Panda

Според изтеклата документация, Panda използва модификатор за скориране базиран на формулата:

M = IL/RQ (Independent Links / Reference Queries)където: IL = Независими връзки RQ = Референтни заявки (от NavBoost данни)
Важно откритие: Panda използва „референтни заявки“ от NavBoost данните – заявки, които се отнасят до ресурси в дадена група. Това потвърждава интеграцията между различните ранкиращи системи.

Baby Panda версии

Документацията споменава две версии на „Baby Panda“:

  • babyPandaDemotion: Основна версия за понижаване на качеството
  • babyPandaV2Demotion: Подобрена версия работеща върху оригиналния Panda

Доменен авторитет: потвърждение въпреки отриченията

Едно от най-значимите откритията е съществуването на метрика наречена „siteAuthority“, въпреки многократните отричания от Google представители.

Тайните на Google алгоритъм: Изтекла е вътрешна инженерна документация на Google Search - Image

Противоречие с публичните заявления:

Публично заявление на Gary Illyes (Google): „Ние нямаме нищо като доменен авторитет“ Реалност от изтичането: Атрибутът siteAuthority е ясно документиран и се използва в Q* ранкиращата система

Тайните на Google алгоритъм: Изтекла е вътрешна инженерна документация на Google Search - Image

Как се измерва домейн авторитет

Системата използва няколко ключови компонента:

  • Homepage PageRank: PageRank-ът на началната страница се прилага към всички страници на сайта
  • Site Embeddings: Векторни представяния измерващи тематична последователност
  • Host Age: Възрастта на домейна, използвана за „sandboxing“ на нови сайтове

Системи за качество и специализирано ранкиране

Twiddler framework

Google използва система наречена „Twiddlers“ за пре-ранкиране на резултатите след първичното скориране:

Примери за Twiddler системи:

  • FreshnessTwiddler: Пре-ранкиране по актуалност на съдържанието
  • QualityBoost: Корекции базирани на качеството
  • RealTimeBoost: Обработка на real-time трендове
  • WebImageBoost: Специализирано ранкиране за изображения

YMYL и специализирано съдържание

Документацията потвърждава съществуването на специални класификатори за Your Money Your Life (YMYL) съдържание:

  • Здравни класификатори: Специализирани алгоритми за медицинско съдържание
  • Финансови сигнали: Отделни метрики за финансови съвети
  • Новинарски качество: Специфични измерения за новинарско съдържание
Whitelists потвърдени: Документацията потвърждава съществуването на бели списъци за COVID, избори и пътувания, въпреки отриченията на Google.

Реакции на SEO експертите и индустриални анализи

SEO общността реагира с комбинация от валидация и възмущение към разкритията в изтичането.

Ключови реакции от експерти

Rand Fishkin: „Това е най-голямото изтичане за останалите 25 години… никое изтичане с такава величина или подробност никога не е било докладвано от търсещия отдел на Google.“

Mike King (iPullRank): „Доказателството е достатъчно категорично – може да има малко съмнение, че Google използва кликове и пост-клик поведение като част от алгоритмите си за ранкиране.“

Barry Schwartz: „Вярвам, че това е истинско изтичане, но не мисля, че е било изтекло умишлено… от всичко което знам за Google, детайлите в изтичането изглеждат много реални.“

Промяна в доверието към Google

Анкета на Barry Schwartz показа, че само 10% от маркетърите вярват на Google след изтичането. Това представлява фундаментална промяна в отношенията между SEO общността и Google.

Практически препоръки за български SEO специалисти

Въз основа на разкритията от изтичането, ето конкретни препоръки за оптимизация:

Незабавни действия (следващите 30 дни)

1. Аудит на клик показатели

  • Анализирайте CTR, bounce rate и engagement метрики в Google Analytics
  • Идентифицирайте страници с ниски показатели за клик-через
  • Тествайте различни заглавия и meta описания

2. Консистентност на датите

  • Проверете съответствието на дати в structured data, URL-и и съдържание
  • Внедрете правилно bylineDate маркиране
  • Актуализирайте XML sitemaps с точни lastmod дати

Средносрочна стратегия (3-6 месеца)

Изграждане на брандова разпознаваемост

NavBoost системата анализира навигационни търсения, което прави брандовото разпознаване критично:

  • Offline маркетинг: Рекламни табели и традиционна реклама стимулират брандови търсения
  • PR кампании: Медийни спомени увеличават навигационните заявки
  • Социални медии: Активност извън Google подпомага брандовото разпознаване
Съвет от Rand Fishkin: „Билбордите на магистралата стимулират много търсене и брандови предпочитания“ – инвестирайте в offline присъствие за подобряване на SEO резултатите.

Програма за обновяване на съдържание

Google следи три типа дати за всяка страница:

Тип дата Описание Как да оптимизирате
bylineDate Изрична дата на страницата Structured data markup с правилна дата
syntacticDate Дата от URL или заглавие Консистентност между URL и заглавие
semanticDate Дата извлечена от съдържанието Ясни времеви маркери в текста

Дългосрочен подход (6-12 месеца)

Оптимизация за потребителско взаимодействие

Тъй като NavBoost анализира различни видове кликове, фокусирайте се върху:

Подобряване на „good clicks“:

  • Създайте задълбочено, полезно съдържание което задържа потребителите
  • Използвайте разказни техники и практически примери
  • Внедрете интерактивни елементи като видеа и инфографики
  • Подобрете вътрешното свързване за по-дълги сесии

Избягвайте „bad clicks“:

  • Заблуждаващи заглавия които не отговарят на съдържанието
  • Бавно зареждащи се страници
  • трудно читаемо или нерелевантно съдържание
  • Агресивни pop-up-и и реклами

Стратегия за качествени връзки

Изтичането разкрива, че Google класифицира връзките в три нива на качество:

  • Високо качество: Fresh документи и високо-авторитетни източници във flash памет
  • Средно качество: Умерено авторитетни източници на SSD дискове
  • Ниско качество: Нискo авторитетни или игнорирани връзки
Важно за link building: Концентрирайте се върху получаване на връзки от страници в „високо качество“ нивото – страници с високи клик обеми и регулярно актуализиране.

Технически SEO приоритети въз основа на изтичането

Мобилна оптимизация

Google специфично следи isSmartphoneOptimized сигнали:

Проверете: – Mobile-first дизайн – Скорост на зареждане на мобилни устройства – Touch-friendly навигация – Viewport meta тагове

Структурирани данни и entity markup

Документацията показва, че Google активно разпознава и съхранява автори и entities:

  • Автор entities: Изградете профили на автори с E-E-A-T сигнали
  • Organization markup: Структурирани данни за компании и организации
  • Review entities: Proper markup за отзиви и рейтинги

Technical crawling оптимизация

Trawler системата управлява crawl честотата въз основа на:

  • Актуалност на съдържанието: По-често актуализирани сайтове се crawl-ват повече
  • Качество на сайта: Високо качество сайтове получават повече crawl budget
  • User engagement: Сайтове с високо взаимодействие се обхождат по-често

YMYL съдържание и специализирани области

За българските YMYL сайтове (здраве, финанси, новини), изтичането предоставя конкретни насоки:

Здравни сайтове

Препоръки за медицински съдържание:

  • Ясна атрибуция към лицензирани лекари
  • Медицински справки и източници
  • Регулярно актуализиране на медицинска информация
  • Disclaimer-и за медицински съвети

Финансови сайтове

  • Автор credentials: Финансови сертификати и квалификации
  • Актуални данни: Регулярно актуализиране на финансови данни
  • Регулаторни compliance: Спазване на финансови регулации

Новинарски сайтове

Google използва специализирани новинарски алгоритми:

Ключови фактори за новини:

  • Автор авторитет: Репутация на журналисти
  • Оригиналност: Първичен източник срещу копиране
  • Актуалност: Времева релевантност на новините
  • Географска релевантност: Местни новини за български потребители

Анализ на конкуренцията и възможности за български сайтове

Класификацията „малки лични сайтове“

Изтичането разкрива специална класификация за „small personal sites“ която може да бъде boost-вана или понижавана. Това създава възможности за български малки бизнеси:

Възможност за малки сайтове: Google има специални алгоритми за малки лични сайтове, което означава че качественото съдържание от малки български сайтове може да получи предимство пред по-големи корпоративни сайтове в определени случаи.

Географски сигнали за България

NavBoost анализира данни по държави, което означава че:

  • Българските потребителски поведения влияят на ранкирането в България
  • Локалните търсене навици се отразяват в алгоритъма
  • Качественото българско съдържание може да има предимство

Инструменти и метрики за измерване на успеха

Ключови показатели за наблюдение

Метрика Връзка с изтичането Как да измерите
Органичен CTR NavBoost „goodClicks“ Google Search Console, положение срещу CTR
Dwell time „lastLongestClicks“ Google Analytics, средно време на страница
Bounce rate „badClicks“ индикатор Google Analytics, анализ по страници
Брандови търсения Навигационни заявки в NavBoost Google Trends, Search Console брандови заявки
Backlink качество Три-нивова класификация на връзки Ahrefs, Majestic, анализ на референтни домейни

Тестване и експериментиране

Въз основа на изтичането, приоритизирайте тестовете в следния ред:

Приоритетни A/B тестове:

  1. Title tag оптимизация: Тествайте различни формати за подобряване на CTR
  2. Content freshness: Експериментирайте с честотата на актуализации
  3. Internal linking: Тествайте различни стратегии за задържане
  4. User engagement: Сравнете различни подходи за намаляване на bounce rate

Бъдещето на SEO в светлината на изтичането

Изтичането на Google алгоритъма променя фундаментално как трябва да мислим за SEO:

От тактически към стратегически подход

Традиционният подход на „оптимизация за алгоритми“ се заменя от „оптимизация за потребители“. NavBoost системата показва че Google измерва истинското потребителско поведение в реално време.

Важна промяна в мисленето: Вместо да се опитваме да „надхитрим“ алгоритъма, трябва да се фокусираме върху създаване на съдържание което истински задоволява потребителските нужди и генерира положително взаимодействие.

Интеграция на онлайн и офлайн маркетинг

Тъй като NavBoost анализира брандови търсения, офлайн маркетинговите активности директно влияят върху SEO резултатите:

  • Традиционна реклама: TV, радио, и печатна реклама стимулират брандови търсения
  • Събития и конференции: Физическо присъствие увеличава брандовото разпознаване
  • PR и медийни спомени: Публикации в традиционни медии подпомагат SEO

Дългосрочно мислене за авторитет

Потвърждението на siteAuthority метриката означава че изграждането на доменов авторитет е дългосрочна инвестиция:

Стратегически съвет: Инвестирайте в качествено съдържание и авторитетни връзки последователно през време. Доменовият авторитет е акумулативен ресурс който се изгражда годините.

Заключение: новата ера на информирано SEO

Изтичането на Google алгоритъма от март 2024 представлява водораздел в историята на SEO. За първи път разполагаме с конкретни, технически доказателства за това как действително работи най-важният търсещ алгоритъм в света. Ключовите изводи за българските SEO специалисти са:

Основни изводи:

  • Потребителското поведение е ключово: NavBoost системата прави кликовете и взаимодействието критични
  • Брандът има значение: Навигационните търсения и разпознаваемостта влияят директно на ранкирането
  • Качеството надделява: Многослойните системи за качество награждават истинската стойност
  • Техническата прецизност е важна: Правилните дати, структура и markup подпомагат алгоритъма
  • Дългосрочното мислене печели: Доменовият авторитет и последователността са ключови

За българския SEO пазар това изтичане предоставя уникална възможност да се фокусираме върху създаване на истинска стойност за потребителите, като използваме конкретни технически знания за оптимизация. Най-важното послание: Успешното SEO вече не е въпрос на техническо надхитряване, а на създаване на бранд и съдържание които потребителите искат да търсят, на които искат да кликват и с които искат да взаимодействат.

Следващи стъпки за български SEO специалисти:

  1. Аудитирайте текущите си метрики за потребителско взаимодействие
  2. Инвестирайте в стратегии за изграждане на брандова разпознаваемост
  3. Фокусирайте се върху създаване на съдържание което генерира „good clicks“
  4. Изградете дългосрочни стратегии за качество и авторитет
  5. Тествайте и измервайте всичко въз основа на новите знания

Изтичането на Google алгоритъма не само разкри тайните на търсенето – то промени правилата на играта към по-прозрачен, основан на стойност подход към SEO. За специалистите които адаптират стратегиите си съответно, възможностите са безгранични.

Този анализ е базиран на изтеклата документация на Google Content Warehouse API, експертен анализ от Rand Fishkin и Mike King, и реакции от водещи SEO специалисти в индустрията. Информацията е актуална към юли 2025.

Източници и допълнителна информация:
  • iPullRank: „An Anonymous Source Shared Thousands of Leaked Google Search API Documents“
  • SparkToro: „Google Search’s Guidance About AI Content Helpfulness is Hypocritical“
  • Search Engine Land: „Google’s ranking systems leak analysis“
  • The Verge: „Google confirms the leaked Search documents are real“
  • Search Engine Roundtable: множество анализи и експертни мнения

🎁 SEO Мега Чеклист: 300+ Тактики за Google 🎁

Най-големият SEO checklist в България. Бъдете сред първите, които ще получат напълно безплатен достъп. Вашето тайно оръжие за повече видимост, трафик и високи позиции в Google.

*Вашият имейл няма да бъде споделян. Научете повече в политика на лични данни как съхраняваме вашите лични данни.

Съдържание

Съдържание