llms.txt: что это такое и как правильно настроить файл для AI-поиска
Разбираем спецификацию llms.txt по llmstxt.org: какие секции обязательны, чем отличается от llms-full.txt и как генерировать файл из реестра контента, чтобы он не отставал от сайта.
Автор: GEO Fix Editorial
llms.txt — это короткий markdown-файл в корне сайта, который объясняет AI-системам, что вы за продукт и где у вас лежит важный контент. Он не заменяет robots.txt и не управляет доступом ботов: его задача — дать языковой модели быструю карту сайта в формате, который удобно парсить без рендеринга страниц.
Минимальная структура файла
Спецификация на llmstxt.org описывает четыре уровня заголовков и одно правило: каждая ссылка идёт списком вида `- [Title](url): description`. Никаких таблиц, кода или встроенного HTML — это упрощает извлечение AI-системами.
# Название продукта
> Однострочный summary, который AI цитирует как описание.
Короткий абзац контекста.
## Docs
- [Документация](https://example.com/docs): что покрывает.
## Optional
- [Sitemap](https://example.com/sitemap.xml)llms.txt vs llms-full.txt
llms.txt — это карта со ссылками. llms-full.txt — расширенный экспорт: основной контент сайта в виде markdown, чтобы LLM могли цитировать вас без захода на страницу. Оба файла должны жить в корне домена и обновляться вместе с сайтом — иначе AI будет цитировать устаревшие данные.
Как избежать дрейфа от живого сайта
- Держите единый реестр маршрутов и тарифов в коде — всё остальное генерируйте из него.
- Сделайте llms.txt и llms-full.txt route handler-ами, а не статическими файлами в public/.
- Включите файлы в smoke-тесты сборки: пустой ответ или 404 = сборка падает.
- Добавьте дату обновления в сам файл — так модели смогут оценить свежесть.
GEO Fix реализует именно такой подход: оба файла собираются на лету из тех же реестров, из которых строятся sitemap и schema.org. Открыть рабочий пример можно по адресу /llms.txt и /llms-full.txt этого сайта.
Обновлено:
