Коротко и без иллюзий
Главный вывод из всех данных: попадание в выдачу нейросетей определяется в первую очередь содержательностью контента и упоминаемостью бренда в независимых источниках, а не техническими «волшебными файлами». Специальный файл llms.txt, который часто продают как ключ к AI-видимости, на практике почти не используется крупными нейросетями. А вот добавление статистики, цитат и ссылок на авторитетные источники даёт измеримый эффект, доказанный в рецензируемом исследовании. Разберём по слоям.
1. Как вообще устроены «нейросети-поисковики»
Системы вроде ChatGPT Search, Perplexity, Google AI Overviews и Gemini в исследовании Принстона объединяют под термином «генеративные движки» (generative engines). Они удовлетворяют запросы, синтезируя информацию из нескольких источников и резюмируя её с помощью LLM. Технически это конвейер из трёх стадий: извлечение релевантных документов (retrieval), сжатие нескольких источников (summarization) и генерация финального ответа со ссылками (response generation) — и сайт должен преуспеть на всех трёх стадиях, чтобы попасть в ответ.
Два следствия из этой архитектуры:
-
Запрос переписывается в несколько вариаций (query reformulation / fan-out), что расширяет «поверхность», на которой может быть найден ваш контент. «Лучшие занятия в Нью-Йорке» превращается в «топ-аттракционы NYC», «чем заняться в Нью-Йорке» и т.д.
-
Большинство систем используют passage-based retrieval — страница разбивается на фрагменты, и извлекается тот, что лучше отвечает на запрос. AI-системы разбивают веб-страницы на сегменты и определяют, какой именно сегмент лучше отвечает на запрос пользователя. Отсюда вся идея «чанкинга» (см. раздел 9).
Важная честная оговорка от практиков: как именно LLM решают, когда и какие источники цитировать, остаётся «чёрным ящиком»; ответы вероятностны, а не детерминированы, и стабильного ранжирования, сравнимого с Google, внутри LLM нет.
2. Фундамент: исследование GEO (Принстон, KDD 2024)
Это базовая академическая работа в области, на которую ссылаются почти все остальные. Aggarwal et al., «GEO: Generative Engine Optimization», arXiv:2311.09735, принята на ACM SIGKDD 2024 (Princeton, Georgia Tech, Allen AI, IIT Delhi). Авторы ввели сам термин GEO и бенчмарк GEO-bench, и через систематическую оценку показали, что GEO повышает видимость в ответах генеративных движков до 40%.
Они протестировали 9 методов на 10 000 запросов. Что сработало, а что нет (это самый ценный кусок):
Сработало (прирост видимости):
-
Добавление релевантной статистики (Statistics Addition), включение достоверных цитат (Quotation Addition) и ссылок на надёжные источники (Cite Sources) требуют минимальных изменений, но значительно повышают видимость, усиливая доверие и насыщенность контента. Эффект — статистика дала +30–40%, цитаты из авторитетных источников — сопоставимый прирост.
-
Стилистические изменения — улучшение беглости и читаемости (Fluency Optimization и Easy-to-Understand) — тоже дали значимый прирост в 15–30%, что говорит о том, что генеративные движки ценят не только контент, но и подачу информации.
-
Базовый неоптимизированный контент набирал 19,3 балла видимости; добавление авторитетных ссылок, статистики и улучшение беглости поднимало балл выше 40 — прирост более 100%.
Не сработало:
-
Наполнение ключевыми словами (keyword stuffing) показало результат на \~10% хуже базового, а авторитетный тон сам по себе — без добавления сути — почти не дал эффекта. Это критично: находка про keyword stuffing — важнейшая для классических SEO-специалистов, потому что доказывает, что тактики плотности ключевиков не переносятся на генеративные движки.
Нюансы, которые часто теряют:
-
Эффект зависит от тематики. Например, домены вроде «Право и госуправление» и типы вопросов вроде «Мнение» значительно выигрывают от добавления релевантной статистики.
-
Комбинации сильнее одиночных методов: сочетание оптимизации беглости и добавления статистики превзошло одиночные методы на 5,5% в тестах.
-
На реальном движке: эффективность GEO продемонстрирована на Perplexity.ai с приростом видимости до 37%.
И самое честное замечание от критиков (Citation Lab / Medium), которое стоит держать в голове: три сработавших метода объединяет добавление содержательной информации, а провалившиеся были стилистическими изменениями, не менявшими суть — нельзя добавить релевантную статистику, если вы не провели исследование, и нельзя сослаться на авторитетные источники, если у ваших утверждений их нет.
3. Что показывают крупные эмпирические исследования
Здесь самый сильный сигнал из всех данных — и он про off-page, а не про техничку.
Ahrefs, 75 000 брендов (Spearman-корреляция):
-
Упоминания бренда в вебе показали сильнейшую корреляцию (0,664) с видимостью в AI Overviews; веб-упоминания коррелируют намного сильнее, чем обратные ссылки (0,218); три топовых фактора — все off-site: веб-упоминания (0,664), брендовые анкоры (0,527) и брендовый поисковый объём (0,392).
-
В обновлении Q1 2026 на первое место вышел новый фактор: упоминания на YouTube (в заголовке, транскрипте или описании видео) показали корреляцию \~0,737 — сильнее любого другого фактора по ChatGPT, Google AI Mode и AI Overviews; это объяснимо, ведь и Google, и OpenAI обучали модели на транскриптах YouTube.
-
Обязательная оговорка самих авторов: корреляция не равна причинности — все изученные факторы показали от умеренной до очень слабой корреляции по шкале Spearman.
ChatGPT и привязка к Bing (Seer Interactive, 500+ цитирований):
-
87% цитирований SearchGPT совпадают с топ-10 органики Bing, и лишь 56% коррелируют с результатами Google.
-
При этом 28,3% наиболее цитируемых ChatGPT страниц имеют нулевую органическую видимость в традиционном поиске.
Google AI Overviews (масштабные данные):
-
По 146 млн страниц выдачи AI Overviews появлялись для 21% всех ключевых слов: для 9,5% однословных запросов, но для 46,4% запросов из семи и более слов.
-
Связь с органикой слабеет: в середине 2025 года 76% цитирований AI Overview приходили из топ-10 органики, а к началу 2026 эта доля упала до 38% по данным Ahrefs и до 17% по данным BrightEdge. При этом анализ 432 000 ключевых слов от seoClarity показал, что 97% AI Overviews цитируют хотя бы один источник из топ-20 органики (не топ-10). А Moz прогнал 40 000 запросов через Google AI Mode и обнаружил, что 88% цитирований пришли со страниц вне органического топ-10.
Вывод по этому блоку: ранжироваться в обычном поиске по-прежнему полезно, но уже недостаточно; решают упоминаемость и содержательность.
4. Различия между платформами
Оптимизация «вообще» неэффективна — движки ведут себя по-разному.
-
ChatGPT. Работает в двух режимах. Без веб-браузинга ответы строятся исключительно на «параметрических» знаниях из обучающих данных; при включённом браузинге ChatGPT запрашивает Bing и выбирает 3–10 источников. Wikipedia встречается в 47,9% его топ-цитирований. Любит консенсус и энциклопедичность.
-
Perplexity. Это recency-движок: цитирует больше источников, быстрее всех реагирует на структурные изменения (2–7 дней) и сильно опирается на Reddit — 46,7% цитирований Perplexity идут с Reddit; влияние schema-разметки минимально.
-
Google AI Overviews / AI Mode. Заметно взвешивает schema-разметку и умеренно — обратные ссылки. Сильно цитирует YouTube (тот же владелец).
-
Claude. Делает упор на названных экспертов с указанием квалификации и академические источники; появление в цитированиях занимает 14–30 дней; Anthropic наименее прозрачна в механике цитирования, поэтому большинство сигналов под Claude — выведенные, а не задокументированные.
Практический итог: «ранжирование» в смысле фиксированных позиций к AI-поиску не применимо — измерять нужно долю голоса (share of voice): процент релевантных AI-ответов, где упомянут ваш бренд.
5. Техничка №1: краулеры и robots.txt (это работает по-настоящему)
В отличие от llms.txt, robots.txt — реальный рычаг управления. Ключевая карта user-agent’ов на 2026 год:
-
OpenAI:
GPTBot(обучение),OAI-SearchBot(цитирование в ChatGPT Search),ChatGPT-User(запрос по требованию пользователя). OpenAI разделяет обучение и поиск на два user-agent’а: можно блокировать GPTBot (обучение), но разрешать OAI-SearchBot (цитирование в ChatGPT). -
Anthropic:
ClaudeBot,Claude-User,Claude-SearchBot. Anthropic использует ClaudeBot и для обучения, и для продуктовых функций — разделения нет, поэтому нельзя заблокировать обучение, не заблокировав цитирование. -
Perplexity:
PerplexityBot,Perplexity-User. -
Google:
Googlebot(поиск) и отдельныйGoogle-Extended. Блокировка Google-Extended останавливает обучение Gemini и Vertex AI, оставляя Googlebot для поиска нетронутым; блокировка AI-краулеров не влияет на обычные ранги Google. -
Apple:
Applebot-Extended. Common Crawl:CCBot.
Две критичные ошибки, которые реально стоят видимости:
-
Блокировка OAI-SearchBot означает, что ваш контент не появится в результатах ChatGPT-поиска, даже если GPTBot уже скачал его для обучения — это две независимые системы; по документации OpenAI сайты, отказавшиеся от OAI-SearchBot, не показываются в ответах ChatGPT search.
-
По данным ziptie.dev, около 27% B2B SaaS и e-commerce сайтов случайно блокируют крупные LLM-краулеры на уровне CDN. Проверьте настройки Cloudflare/CDN.
И про недобросовестных ботов: HAProxy в 2024 году сообщил, что почти 90% трафика AI-краулеров шло от одного Bytespider, во многом игнорировавшего правила disallow — поэтому одного robots.txt недостаточно, нужны правила на уровне сервера. Отдельно: 4 августа 2025 года Cloudflare опубликовала отчёт о том, что Perplexity использует незадекларированные краулеры, ротирующие user-agent, IP и ASN, чтобы обходить запреты.
Базовый «разрешительный» шаблон для сайта, который хочет AI-видимости, выглядит так (комбинированный из источников): разрешить GPTBot, OAI-SearchBot, ChatGPT-User, ClaudeBot, Claude-User, Claude-SearchBot, PerplexityBot, Perplexity-User, Googlebot, Bingbot, Google-Extended; при желании заблокировать CCBot и Bytespider.
6. Техничка №2: llms.txt — честная картина (а не маркетинг)
Это тот самый «специальный файл», о котором вы спрашивали. Разберу подробно, потому что вокруг него больше всего мифов.
Что это. Markdown-файл в корне домена (/llms.txt) с курируемым списком ссылок на самый ценный контент; предложен Джереми Ховардом (Answer.AI / FastAI) 3 сентября 2024 года. Официальная спецификация — на llmstxt.org. Мотив: контекстные окна LLM слишком малы, чтобы обработать сайт целиком, а превращение сложного HTML с навигацией, рекламой и JavaScript в понятный LLM текст трудоёмко и неточно.
Формат (по официальной спецификации): H1 с названием проекта (единственная обязательная секция), блокквота с кратким резюме, ноль или больше markdown-секций с деталями, и секции под H2-заголовками со списками ссылок вида [name](url) с необязательным описанием после двоеточия. Также предлагается отдавать чистую markdown-версию страниц по тому же URL с добавлением .md. Важная деталь именования: файл должен называться именно llms.txt (не llm.txt).
А теперь реальность — и она отрезвляющая:
-
В июле 2025 Гэри Иллиес из Google подтвердил, что Google не поддерживает llms.txt и не планирует, а Джон Мюллер сравнил файл с дискредитировавшим себя мета-тегом keywords.
-
Ни один крупный провайдер LLM — OpenAI, Anthropic, Google, Meta, Mistral — публично не подтвердил использование llms.txt как сигнала в боевых поисковых/ответных системах.
-
Эмпирика по логам: анализ более 500 млн событий трафика AI-ботов показал, что AI-поисковые краулеры почти никогда не запрашивают /llms.txt; GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot и Google-Extended подавляющим образом пропускают файл и краулят HTML напрямую — из 500M+ визитов лишь 408 обращений напрямую к llms.txt.
-
Корреляция с цитированием: исследование SE Ranking на 300 000 доменов (ноябрь 2025) показало \~10% распространённости llms.txt, причём почти одинаково во всех тиерах трафика, а модель XGBoost улучшалась при удалении переменной llms.txt — то есть файл добавлял шум, а не предсказательный сигнал.
Где llms.txt всё-таки полезен (честный плюс): сильнейший реальный сценарий — инструменты для разработчиков: AI-кодинг-ассистенты вроде Cursor, GitHub Copilot и Claude забирают документацию в реальном времени, и llms.txt помогает им получить нужные страницы с меньшим расходом токенов. И есть аргумент «дешёвой страховки»: крупные LLM-краулеры могут начать его уважать, а сам процесс курирования одного абзаца-резюме и 30 ссылок заставляет ответить на вопрос «что бы я хотел, чтобы модель цитировала», на который большинство контент-команд не отвечали. Кто его уже публикует: Anthropic, Stripe, Cursor, Cloudflare, Vercel, Mintlify, Supabase, LangGraph и около 10% сайтов в целом.
Итог: ставить можно (вреда нет, плюс для dev-аудитории и на будущее), но не считайте его рычагом AI-видимости — это не так.
7. Техничка №3: Schema / структурированные данные (спорно)
Тоже не «волшебная кнопка», как продают. Картина смешанная:
-
Джон Мюллер на вопрос, помогает ли schema-разметка LLM лучше понимать сущность, ответил «да, нет и зависит» — оговорив, что это его точка зрения, а не официальное руководство; для одних функций (цены, наличие в Shopping) структурированные данные критичны, для других — лишь обогащают выдачу.
-
На стороне Microsoft сигнал более прямой: Фабрис Канель из Bing подтвердил в марте 2025 (SMX Munich), что schema-разметка помогает LLM Microsoft понимать контент для Copilot, а команда Google Search в апреле 2025 заявила, что структурированные данные дают преимущество в выдаче.
-
Но скепсис обоснован: практик из Practical Ecommerce пишет, что не видел заслуживающих доверия кейсов, где структурированные данные улучшали бы AI-упоминания напрямую — и относит schema к низкому приоритету (хотя внедрить её легко и дёшево).
-
Механизм, почему она всё же помогает косвенно: февральское исследование 2024 в Nature Communications показало, что LLM извлекают информацию точнее, когда им дают структурированные подсказки с определёнными полями, а не инструкцию «извлеки, что важно» — schema на странице работает как такая «форма для заполнения».
Приоритетные типы (по гайдансу платформ): Organization, Person (авторство и квалификация), Product, FAQPage, Article. Вердикт: делайте качественно, но не ждите чуда — это «семантическая инфраструктура», а не источник цитирований сам по себе.
8. Практические on-page методики (проверенные)
Здесь — конкретика «как», собранная из практических гайдов и согласующаяся с механикой passage-retrieval:
-
Answer capsule (капсула ответа). Открывайте каждую секцию прямым ответом в 40–60 слов на вопрос, заложенный в заголовке, — именно этот текст AI-системы извлекают и цитируют.
-
Заголовки как самостоятельные ответы. Вместо «Введение в солнечные панели» — «Солнечные панели преобразуют свет в электричество через фотоэлементы». Ведите с выводов: первое предложение должно быть полным ответом, как вводный абзац Wikipedia.
-
Чанкинг / самодостаточные секции. Структурируйте контент как самодостаточные, «ответ-в-начале» чанки, чтобы LLM могли находить, извлекать и цитировать точную информацию: используйте H2/H3 для логических подтем, каждая секция закрывает отдельный аспект. Важная честная оговорка: Google заявил, что чанкинг не нужен для появления в его собственных AI-системах — но ясность на уровне фрагментов всё равно важна для общей GEO/AEO-стратегии. По сути это просто хорошее форматирование: чёткие заголовки, короткие абзацы с одной мыслью, списки.
-
Плотность фактов. Держите одну гиперссылочную статистику на каждые 150–200 слов и FAQ-секции с 5–7 самодостаточными ответами.
-
Формат «вопрос-ответ». Один вопрос — один ответ на чанк: эксперименты, имитирующие AI-семантический поиск, показали, что Q&A-формат (по сути предварительно нарезанный контент) последовательно выигрывает.
-
Неназойливый тон. Промо-тон имеет отрицательную корреляцию с цитированием (−26,19%), а AI-цитируемый контент в среднем на 25,7% свежее органических результатов Google — свежесть имеет вес.
9. Off-page: бренд, упоминания, площадки (главный рычаг)
Если коротко: станьте сущностью, которую модель «знает».
-
Бэклинк говорит AI-системам, куда идти; упоминание бренда говорит им, чему доверять — а в парадигме AI-цитирования доверие важнее навигации. Механизм: Google строит результаты из индекса, затем прогоняет LLM поверх них — если LLM постоянно видит ваше имя бренда, она с большей вероятностью вернёт его в выводе.
-
Конкретные действия от директора по контенту Ahrefs: определить отраслевые домены, которые часто цитируются в AI-поиске по вашим темам, и постараться получить упоминания там, а также на UGC-площадках вроде Reddit и Quora.
-
Площадки, которые системно цитируются: Reddit, Quora, YouTube, Stack Exchange, а также сравнительные ресурсы. Сайты вроде PCMag, Capterra, TechRadar и G2 регулярно появляются в выводах моделей, потому что дают структурированные сравнительные данные, на которые ChatGPT уверенно ссылается; Forbes, TechCrunch и Gartner стабильно появляются по B2B-запросам.
-
Попадание в «best-of» листиклы и обзоры рядом с конкурентами — отдельная проверенная тактика.
10. Чего НЕ делать и мифы
-
Не полагайтесь на keyword stuffing — он работает хуже базового уровня (см. раздел 2).
-
Не воспринимайте llms.txt как рычаг видимости (раздел 6).
-
Не ждите цитирований от одной schema-разметки (раздел 7).
-
Осторожно с «информационными петлями». SEO-инструменты вроде Rank Math и SEMrush помечают отсутствие llms.txt как проблему сайта, создавая давление внедрять его без доказательств ценности — самоподдерживающийся цикл, построенный на надежде, а не на данных.
-
Риск дезинформации реален. В эксперименте Ahrefs исследователь выдумал фейковую компанию и распространил ложные утверждения в сети — почти все модели повторяли их как факт, даже когда официальный FAQ компании это опровергал. Это и риск, и косвенное подтверждение силы «упоминаемости».
-
Трезвая рамка. Эксперты прямо называют GEO «скорее SEO, чем новой дисциплиной» — многие тактики не отличаются от поисковой оптимизации.
11. Как измерять результат
-
Доля голоса (share of voice), а не позиции. Опрашивайте AI-платформы еженедельно по целевым вопросам и фиксируйте паттерны цитирования; отслеживайте реферальный трафик с chatgpt.com и perplexity.ai; используйте инструменты вроде Otterly.AI или Profound — 40–60% цитирований меняются ежемесячно, поэтому постоянный мониторинг обязателен.
-
Логи сервера/CDN. Проверяйте обращения к /llms.txt и фильтруйте по user-agent’ам (GPTBot, ClaudeBot, PerplexityBot); можно вставить уникальную honeypot-ссылку, которую пройдёт только автоматический читатель; Cloudflare Analytics разбивает трафик ботов по user-agent.
-
Специализированные трекеры: Ahrefs Brand Radar, BrightEdge, плюс ручное тестирование промптов в ChatGPT/Perplexity/Gemini/Claude.
Ключевые источники
Первичные и наиболее авторитетные:
-
Aggarwal et al., «GEO: Generative Engine Optimization», arXiv:2311.09735, KDD 2024 — рецензируемый фундамент: arxiv.org/abs/2311.09735
-
Официальная спецификация llms.txt — llmstxt.org (Jeremy Howard, Answer.AI)
-
Ahrefs, исследование 75 000 брендов — ahrefs.com/blog/ai-overview-brand-correlation и обновление ahrefs.com/blog/ai-brand-visibility-correlations
-
SE Ranking, сравнение ChatGPT/Perplexity/Google/Bing — seranking.com/blog/chatgpt-vs-perplexity-vs-google-vs-bing-comparison-research
-
Search Engine Land про schema без хайпа — searchengineland.com/schema-markup-ai-search-no-hype-472339
-
Search Engine Land про llms.txt — searchengineland.com/llms-txt-proposed-standard-453676
-
Search Engine Roundtable, позиция Мюллера по schema — seroundtable.com/mueller-schema-helps-llms-google-40693.html
-
Search Engine Journal, упоминания бренда — searchenginejournal.com/ahrefs-data-shows-brand-mentions-boost-ai-search-rankings/559938
Сильные практические/аналитические разборы:
-
The Citation Lab (критика «сигнальных» советов) — medium.com/the-citation-lab/why-most-geo-advice-is-already-wrong
-
ZipTie, как разные платформы цитируют — ziptie.dev/blog/how-different-ai-platforms-cite-the-same-source-differently
-
Leapd, источники ChatGPT/AIO/Perplexity в 2026 — leapd.ai/blog/ai-visibility
-
Honest-гайды по llms.txt (с данными по логам) — codersera.com/blog/llms-txt-complete-guide-2026 и limy.ai/blog/llms.txt-in-2026-the-full-guide
-
Справочник по AI user-agent’ам — nohacks.co/blog/ai-user-agents-landscape-2026 и soar.sh/blog/ai-bots-robots-txt-guide
-
Lumar / Semrush про чанкинг — lumar.io/blog/best-practice/content-chunking-ai-extractability-geo-aeo-explainer и semrush.com/blog/content-chunking
Если хотите, могу превратить это в готовый чек-лист под конкретный тип сайта (e-commerce, SaaS-документация, медиа или локальный бизнес) — там приоритеты тактик заметно различаются по тем же исследованиям.
Тема пересекается с маркетинговыми «продажами воздуха», поэтому я специально помечал, где популярные методики на проверку данными не работают — это и есть та «правдивость», которую вы просили.
Отличная задача. Чтобы список был действительно качественным и подтверждённым сообществом, я проверю существование и репутацию источников по нескольким категориям: рецензируемые работы, признанные эксперты, видео, книги, официальная документация и инструменты. Начну собирать.Let me find the genuinely recognized experts and their video/talk content, starting with the most cited voices in this space.iPullRank’s AI Search Manual is a flagship resource. Let me find more recognized experts and their video content.Let me find the academic follow-up research and additional peer-reviewed work beyond the original GEO paper.Let me verify some specific high-quality video talks and official documentation to round out the list.Собрал. Я отбирал по жёстким признакам качества: рецензирование (KDD, ICLR, arXiv с цитируемостью), официальность (документация самих платформ), признанность автора в индустрии (Mike King, Aleyda Solis, Rand Fishkin и др.) и масштаб данных в исследованиях (десятки–сотни тысяч доменов). Получилось \~38 источников по 7 категориям. Сразу честная оговорка, которая сэкономит вам деньги: рынок GEO-книг и «курсов» наводнён самиздатом-однодневками, поэтому книг в списке мало, а упор — на первоисточники и работы признанных практиков. Отдельно отмечу: даже Джон Мюллер из Google предупреждал, что агрессивное продвижение новых AI-SEO-аббревиатур может быть признаком спама и скама — так что фильтр на авторитетность здесь критичен.
А. Академический фундамент (рецензируемое и цитируемое)
-
GEO: Generative Engine Optimization — Aggarwal et al., arXiv:2311.09735, принята на ACM SIGKDD (KDD) 2024. Та самая базовая работа на 10 000 запросов. <https://arxiv.org/abs/2311.09735> — код и данные: <https://generative-engines.com/GEO/>
-
AutoGEO — Wu, Zhong, Kim, Xiong, arXiv:2510.11438, принята на ICLR 2026. Дистиллирует предпочтения генеративных движков в правила переписывания контента. Репозиторий: <https://github.com/cxcscmu/AutoGEO>
-
Generative Engine Optimization: How to Dominate AI Search — Chen, Wang, Chen, Koudas, arXiv:2509.08919. Важная находка: AI-поиск демонстрирует систематический и подавляющий перекос в сторону earned media над брендовым и социальным контентом — в отличие от более сбалансированного микса Google. <https://arxiv.org/abs/2509.08919>
-
E-GEO: A Testbed for GEO in E-Commerce — Columbia / MIT, arXiv:2511.20867. Профильно для интернет-магазинов. <https://arxiv.org/abs/2511.20867>
-
Beyond Keywords: Driving GSEO with Content-Centric Agents — Chen Q. et al., arXiv:2509.05607. Мульти-агентный фреймворк, итеративно улучшающий контент по циклу «анализ-правка-оценка», оптимизируя семантическое влияние, а не совпадение ключевиков. <https://arxiv.org/abs/2509.05607>
-
Role-Augmented Intent-Driven GSEO — Chen X. et al., arXiv:2508.11158. <https://arxiv.org/abs/2508.11158>
-
When Content is Goliath and Algorithm is David — Ma, Qin, Xu, Tan, arXiv:2509.14436. Показывает, что более высокая «предсказуемость» текста и семантическая близость источников повышают шансы на цитирование. <https://arxiv.org/abs/2509.14436>
-
GEO-Bench: Benchmarking Ranking Manipulation in GEO — arXiv:2605.29107. Полезно для понимания adversarial-рисков и «накрутки». <https://arxiv.org/abs/2605.29107>
Б. Официальная документация платформ (первоисточники)
-
Google Search Central — гайд по оптимизации под генеративный AI (опубликован май 2026): <https://developers.google.com/search/docs/fundamentals/ai-optimization-guide> — и анонс в блоге: <https://developers.google.com/search/blog/2026/05/a-new-resource-for-optimizing>. Прямо подтверждает, что базовые принципы SEO остаются фундаментом для генеративных функций. Важная оговорка от Google: создавать отдельный контент под каждую вариацию запросов (fan-out) ради манипуляции ответами — нарушение политики о масштабном злоупотреблении контентом.
-
Google — AI Features and Your Website: <https://developers.google.com/search/docs/appearance/ai-features>
-
OpenAI — Overview of Crawlers (bots): <https://developers.openai.com/api/docs/bots>. Первоисточник по разделению ботов: OAI-SearchBot и GPTBot управляются независимо — можно разрешить SearchBot для показа в результатах, запретив GPTBot для обучения; на подстройку систем под изменения robots.txt уходит \~24 часа.
-
OpenAI — Publishers & Developers FAQ: <https://help.openai.com/en/articles/12627856> — чтобы контент попадал в сводки и сниппеты ChatGPT, нельзя блокировать OAI-SearchBot.
-
Спецификация llms.txt (Jeremy Howard, Answer.AI): <https://llmstxt.org> — официальный первоисточник стандарта, который вы упоминали в прошлый раз.
В. Признанные эксперты: методички, манифесты, чек-листы
-
iPullRank — The AI Search Manual (Mike King). Это фактически самая полная бесплатная «книга»-методология по GEO/Relevance Engineering, 20+ глав. <https://ipullrank.com/ai-search-manual/introduction>. Майк Кинг изучал, как реально устроены системы под поиском, годами; его взгляд основан на исследованиях и инженерии, что делает его одним из самых чётких голосов в области.
-
iPullRank — определение Relevance Engineering: <https://ipullrank.com/ai-search-manual/relevance-engineering> — концепция «инженерии релевантности» вместо чек-лист-культуры SEO.
-
Aleyda Solis — LearnAIsearch.com: <https://learningaisearch.com> — бесплатный roadmap по GEO/AEO/LLMO от фундамента до технички, контента, измерения и инструментов. Плюс её базовый LearningSEO.io.
-
Aleyda Solis — SEO vs GEO (её собственный разбор): <https://www.aleydasolis.com/en/search-engine-optimization/seo-vs-geo-optimizing-for-traditional-vs-ai-search/>. Именно она превратила оптимизацию под AI-поиск в публичную учебную программу; её отличительный угол — краулируемость: прежде чем оптимизировать предложение под цитирование, боты должны суметь дотянуться до страниц.
-
#SEOFOMO (рассылка Aleyda Solis) — еженедельный отобранный дайджест лучшего в SEO/AI-поиске: <https://www.seofomo.co>
-
Kevin Indig — Growth Memo: <https://www.growth-memo.com>. Его ценный вклад — здоровый скепсис: эссе «The Alpha is not LLM monitoring» отрезвляет тех, кто думает, что очередной дашборд решит проблему — альфа в контенте и инфраструктуре, а дашборд лишь сообщает, сработало ли.
-
Jason Barnard — Kalicube (entity SEO / Knowledge Graph): <https://kalicube.com> — глубоко про сущности и то, как машины «узнают» бренд; один из ключевых голосов по entity-оптимизации.
-
Cindy Krum — MobileMoxie: <https://mobilemoxie.com/blog/> — основатель MobileMoxie, запустившая первый mobile-ориентированный SEO-тулсет; постоянный участник топовых панелей по AI Overviews.
-
Подборка «10 GEO-экспертов, за кем стоит следить в 2026» (карта индустрии с обоснованиями): <https://salespeak.ai/aeo-news/top-experts-generative-engine-optimization> — включает Lily Ray, Kevin Indig, Aleyda Solis, Mike King, Jason Barnard, Rand Fishkin и других реально двигающих область.
Г. Видео и вебинары (проверенные, от признанных авторов)
-
Mike King — «Optimizing the New Search: How Relevance Engineering Is Reshaping SEO» (подкаст The Search Session с Gianluca Fiorelli): <https://www.youtube.com/watch?v=kd7zT8fW3o4>. Майк объясняет, как реально работают AI Overviews и AI Mode и почему видимость теперь зависит от перехода «от страниц к пассажам».
-
Semrush — панель «How AI Overviews are Revolutionizing the SERP»: <https://lp.semrush.com/ai-overviews-panel_en.html> — состав панели: Aleyda Solis, Mike King, Cindy Krum, Nick Eubanks, Marcus Tober.
-
Sitebulb — «SEO for LLMs: Adapting to the AI-first Web» (вебинар с Aleyda Solis и Ray Grieselhuber): реплей доступен через DemandSphere/Sitebulb — <https://www.demandsphere.com/blog/2025-in-review-at-demandsphere/> (там ссылки на записи).
-
The Search Matrix — 3-частная серия вебинаров Sitebulb × iPullRank, где Zach Chahalis дал один из самых детальных на сегодня разборов технических аспектов оптимизации под LLM и AI-поиск.
-
AirOps × Aleyda Solis — «The AI Search Action Checklist» (вебинар с записью): <https://luma.com/ndn0hjio>
-
YouTube-канал iPullRank — выступления Mike King с конференций (включая SEO Week, где он ввёл термин Relevance Engineering): <https://www.youtube.com/@iPullRank>
Д. Дата-исследования индустрии (большие выборки)
-
Ahrefs — корреляция факторов AI-видимости (75 000 брендов): <https://ahrefs.com/blog/ai-overview-brand-correlation> и обновление <https://ahrefs.com/blog/ai-brand-visibility-correlations>. Сильнейший фактор — упоминания бренда (0,664) против бэклинков (0,218).
-
Ahrefs — Q1 2026 AI Search Benchmark Report (13 исследований, 146 млн страниц выдачи, 730 тыс. AI-ответов): <https://www.businesswire.com/news/home/20260526119691/en/> — упоминания на YouTube оказались сильнейшим сигналом AI-видимости.
-
SE Ranking — ChatGPT vs Perplexity vs Google vs Bing (как разные движки выбирают источники): <https://seranking.com/blog/chatgpt-vs-perplexity-vs-google-vs-bing-comparison-research/>
-
Moz — анализ Google AI Mode (40 000 запросов): 88% цитирований пришли со страниц вне органического топ-10. Блог Moz: <https://moz.com/blog>
-
Seer Interactive — исследования AI-цитирований и CTR (база для цифр «87% совпадения ChatGPT с топ-10 Bing» и обвала кликов): <https://www.seerinteractive.com/insights>
-
Search Engine Land — раздел про AI-поиск и schema без хайпа: <https://searchengineland.com/schema-markup-ai-search-no-hype-472339> (и общий хаб: <https://searchengineland.com/library/ai/generative-ai>)
-
Semrush — «Content Chunking: What Is It & Should You Care?» (взвешенно, с оговорками): <https://www.semrush.com/blog/content-chunking>
Е. Книги (с честной оговоркой)
Сильной канонической книги по GEO пока нет — лучшая «книга» это бесплатный AI Search Manual из п.14. Из изданного с относительно вменяемым авторством:
-
«A Practical Guide to Generative Engine Optimization (GEO)» — Mahesh Chand. Автор — технологический лидер и основатель одного из крупнейших в мире сообществ разработчиков (C# Corner). <https://www.amazon.com/dp/B0FY4FGRSX> — это самый «не-однодневочный» автор из найденных. Остальные GEO-книги на Amazon берите с осторожностью: многие — быстрый самиздат без подтверждённой экспертизы.
Ж. Скептический взгляд (для баланса — обязательно)
-
The Citation Lab (Sebastian Mueller) — «Why Most GEO Advice Is Already Wrong»: <https://medium.com/the-citation-lab/why-most-geo-advice-is-already-wrong-4e844ac65dfb>. Бьёт по «сигнальным» советам (llms.txt, schema, инлайн-цитаты), показывая на данных Принстона, что сработали именно содержательные методы, а не сигналы.
-
Rand Fishkin / SparkToro: <https://sparktoro.com/blog>. Главный скептик в списке — и GEO нужны свои скептики: в мире zero-click трафик плохая цель, оптимизировать надо момент упоминания бренда внутри чужого интерфейса. Плюс Digiday с тезисом «GEO — это скорее SEO, чем новая дисциплина»: <https://digiday.com/media/geo-hype-busted-experts-call-it-more-seo-than-new-discipline/>
—
Это 38 проверенных источников. Если хотите, добью до 50 за счёт конкретики под ваш профиль (WordPress/WooCommerce-аудиты и лидогенерация) — добавлю: трекеры AI-видимости (Profound, Otterly.AI, Peec AI, Ahrefs Brand Radar), профильные кейсы по e-commerce-GEO и русскоязычные материалы, если они проходят тот же фильтр на качество. Скажите, в какую сторону углублять.
Это серьёзная задача — я углублюсь в ключевые первоисточники, чтобы вытащить из каждого уникальные детали (а не пересказывать общее), и сведу всё в единую пошаговую методику без повторов. Начну с самых информационно-плотных источников.Google’s guidance I already have the substance of. Let me mine the iPullRank AI Search Manual — the flagship practitioner framework.iPullRank gives me advanced unique material (embeddings, retrieval simulation). Let me extract concrete findings from the newest academic work.У меня теперь есть глубокий уникальный материал из первоисточников — включая концепцию эмбеддингов и симуляции извлечения от iPullRank, формулу видимости и ключевую находку AutoGEO (CMU) о том, что у каждого движка свои правила предпочтений. Свожу всё в единую методику без повторов.Готово — единая пошаговая методика на 12 фаз, собранная из первоисточников без повторов.
Что я для неё реально выкопал из глубины (а не пересказал общее):
Из iPullRank AI Search Manual — продвинутый слой, которого нет в популярных гайдах: концепция «ваш контент это эмбеддинг», семантический скоринг, и главное — симуляция извлечения (retrieval simulation): как воспроизвести RAG-путь через векторную БД и проверить до публикации, те ли пассажи извлекаются. Это вынесено в отдельную Фазу 9.
Из AutoGEO (CMU, ICLR 2026) — две вещи, которые меняют стратегию: формула видимости Vis = Word + Pos + Overall (как академически считается «попадание в ответ») и ключевая находка, что у каждого движка свои правила предпочтений — движко-специфичная оптимизация стабильно бьёт универсальную. Плюс концепция GEU (нельзя жертвовать качеством ответа ради видимости) — она в Фазе 4.7 как защита от «накрутки».
Из Chen et al. + E-GEO — что перекос в earned media в коммерции максимальный, поэтому для магазина Фаза 6 (бренд) важнее внутренней оптимизации.
Структурные решения, на которые стоит обратить внимание:
Методика построена как рабочий процесс, а не справочник: краулируемость-ноль (принцип Aleyda Solis) → бренд → суть → структура → schema → платформы → симуляция → измерение. Приоритет везде один и тот же и обоснован данными: упоминаемость > содержательность > техника.
Каждый факт стоит ровно один раз в той фазе, где применяется (вы просили без повторов), и помечен статусом достоверности — чтобы в клиентских аудитах вы могли честно отделять [ДОКАЗАНО] от [ГИГИЕНА/СПОРНО] и не продавать воздух.
В конце — карта источников и глоссарий, чтобы документ был самодостаточным.
Если хотите, могу следующим шагом превратить это в операционный шаблон аудита — те же фазы, но в виде таблицы со столбцами «проверка / статус на сайте клиента / приоритет / оценка в баллах → итоговый GEO-score». Это уже готовый коммерческий артефакт под вашу практику платных аудитов.
[Методичка от Claude.pdf 3483313](/api/attachments.redirect?id=798b6dc0-3f0a-4508-bfee-97e5d28b8039)
[Глубокая методология GEO Claude (Цимус).pdf 5721600](/api/attachments.redirect?id=97ee1367-d6b7-40af-ba9a-db5c6adcd2aa)
Список выверенных источников от Claude
Вот выверенный реестр — только то, что прошло проверку: рецензируемое, официальное, от признанных авторов или с большими данными. Каждый источник помечен типом, чтобы вы видели, где первоисточник, где нейтральная экспертиза, а где полезный, но коммерчески заинтересованный вендор.
Легенда: [ПЕРВОИСТОЧНИК] — рецензируемое/официальное · [ЭКСПЕРТ] — признанный практик, нейтральная экспертиза · [ДАННЫЕ] — дата-исследование на большой выборке · [ВЕНДОР] — полезно, но автор продаёт услуги/инструмент · [УТИЛИТА] — рабочий инструмент.
Академический фундамент [ПЕРВОИСТОЧНИК]
-
GEO: Generative Engine Optimization — Aggarwal et al., KDD 2024 — arxiv.org/abs/2311.09735
-
AutoGEO «What Generative Search Engines Like» — CMU, ICLR 2026 — arxiv.org/abs/2510.11438 (код: github.com/cxcscmu/AutoGEO)
-
GEO: How to Dominate AI Search (перекос в earned media) — Chen et al. — arxiv.org/abs/2509.08919
-
E-GEO: тестбед для e-commerce — Columbia/MIT — arxiv.org/abs/2511.20867
-
Beyond Keywords: Content-Centric Agents — arxiv.org/abs/2509.05607
-
Role-Augmented Intent-Driven GSEO — arxiv.org/abs/2508.11158
-
When Content is Goliath and Algorithm is David — arxiv.org/abs/2509.14436
-
GEO-Bench: Benchmarking Ranking Manipulation — arxiv.org/abs/2605.29107
Официальная документация платформ [ПЕРВОИСТОЧНИК]
-
Google Search Central — Optimizing for generative AI — developers.google.com/search/docs/fundamentals/ai-optimization-guide
-
Google — AI Features and Your Website — developers.google.com/search/docs/appearance/ai-features
-
OpenAI — Overview of Crawlers — developers.openai.com/api/docs/bots
-
OpenAI — Publishers & Developers FAQ — help.openai.com/en/articles/12627856
-
Спецификация llms.txt — llmstxt.org (полезна как стандарт; помнить — не рычаг видимости)
Признанные эксперты и методологии [ЭКСПЕРТ]
-
iPullRank — AI Search Manual (Mike King) — ipullrank.com/ai-search-manual/introduction (самый авторитетный практический ресурс; отсутствовал в вашей подборке)
-
Aleyda Solis — LearnAIsearch — learningaisearch.com
-
Aleyda Solis — #SEOFOMO (рассылка) — seofomo.co
-
Kevin Indig — Growth Memo — growth-memo.com
-
Rand Fishkin — SparkToro (скептический взгляд) — sparktoro.com/blog
-
Jason Barnard — Kalicube (entity / Knowledge Graph) — kalicube.com
-
Cindy Krum — MobileMoxie — mobilemoxie.com/blog
Дата-исследования [ДАННЫЕ]
-
Ahrefs — корреляция факторов AI-видимости (75k брендов) — ahrefs.com/blog/ai-overview-brand-correlation и ahrefs.com/blog/ai-brand-visibility-correlations
-
Ahrefs — Q1 2026 AI Search Benchmark (146M страниц, 730k ответов) — businesswire.com (релиз от 26.05.2026)
-
SE Ranking — ChatGPT vs Perplexity vs Google vs Bing — seranking.com/blog/chatgpt-vs-perplexity-vs-google-vs-bing-comparison-research/
-
Seer Interactive — AI-цитирования и конверсия (источник цифры 4.4x/87%-Bing) — seerinteractive.com/insights
-
Moz — анализ Google AI Mode (40k запросов) — moz.com/blog
-
The Citation Lab — критический разбор «сигнальных» советов — medium.com/the-citation-lab
Видео и вебинары [ЭКСПЕРТ]
-
Mike King — «Optimizing the New Search» (The Search Session) — youtube.com/watch?v=kd7zT8fW3o4
-
Semrush — панель «How AI Overviews are Revolutionizing the SERP» (Solis, King, Krum) — lp.semrush.com/ai-overviews-panelen.html
-
Sitebulb — «SEO for LLMs» (Aleyda Solis + Ray Grieselhuber) + серия The Search Matrix
-
YouTube-канал iPullRank (выступления Mike King, в т.ч. SEO Week) — youtube.com/@iPullRank
Инструменты и мониторинг [ВЕНДОР] / [УТИЛИТА]
-
Profound — tryprofound.com
[ВЕНДОР] -
Otterly.AI — otterly.ai
[ВЕНДОР] -
Semrush AI Toolkit / AI Overview Tracking — semrush.com
[ВЕНДОР] -
HubSpot AI Search Grader (бесплатно) — hubspot.com
[УТИЛИТА] -
Ahrefs Brand Radar — ahrefs.com
[ВЕНДОР] -
Bing Webmaster Tools (→ AI Performance) — bing.com/webmasters
[УТИЛИТА](критично: ChatGPT-браузинг идёт через Bing) -
IndexNow (быстрая индексация в Bing) — indexnow.org
[УТИЛИТА] -
Schema Markup Validator — validator.schema.org
[УТИЛИТА] -
Google Rich Results Test — search.google.com/test/rich-results
[УТИЛИТА]
Российский сегмент [ДАННЫЕ] / [ЭКСПЕРТ] / [ВЕНДОР]
-
Ant-Team.ru — исследование «какие сайты цитирует ИИ-поиск» (ниша гель-лаки, ваш профиль) — m.seonews.ru/events/kakie-sayty-chashche-vsego-tsitiruet-ii-poisk-issledovanie/
[ДАННЫЕ] -
Топ-1000 цитируемых Алисой доменов (Дзен, Википедия, ВК) — ppc.world / seonews
[ДАННЫЕ] -
Ашманов и партнёры — поведенческие факторы / SEO — ashmanov.com
[ЭКСПЕРТ] -
Habr — технический гайд по GEO/AEO — habr.com/ru/articles/987506/
[ЭКСПЕРТ](проверьте актуальность статьи) -
Сергей Язовский — статьи на ppc.world — ppc.world/articles/kak-popadat-v-otvety-neyrosetey-s-pomoschyu-geo-v-2026-godu/
[ВЕНДОР](статьи разумны; кейсовые цифры на его сайте — маркетинг, делить на скепсис) -
Kokoc — разбор работы Яндекс Нейро — kokoc.com/blog/chto-takoe-yandeks-neyro/
[ВЕНДОР] -
Яндекс Вебмастер (мониторинг, ИКС, CTR) — webmaster.yandex.ru
[УТИЛИТА]
Методички в PDF можно забрать тут бесплатно: https://t.me/LifehackDepartment