методология · v1.0

Как Analyzator AI симулирует потребительский спрос

Этот документ — для тех, кто хочет понять, на каких научных основаниях стоит наш симулятор, какие данные он использует и какая у него измеримая точность. Дата обновления: 16 мая 2026.

01

Архитектура: Stanford GenAgents + Tencent AGA

В основе симулятора — архитектура Generative Agents (Park et al., Stanford University, UIST 2023). Каждый «виртуальный покупатель» — это языковая модель с тремя компонентами:

  • Memory Stream. Поток воспоминаний о виденных товарах, прошлых покупках, впечатлениях. Хранится в виде структурированного текста с timestamp.
  • Retrieval. Извлечение релевантных воспоминаний по формуле score = α·recency + β·importance + γ·relevance. Recency — экспоненциальное затухание (0.995 за час). Importance — оценка 1-10 от LLM. Relevance — косинусное сходство embeddings (Voyage AI voyage-3).
  • Reflection. Периодическая саморефлексия: персона синтезирует из накопленных observations высокоуровневые выводы вида «я предпочитаю проверенные бренды». Триггер: суммарная importance последних observations превысила 150.

Поверх Stanford-архитектуры мы применили оптимизации Affordable Generative Agents(Tencent, TMLR 2024) — Lifestyle Policy для агент-среды и Social Memory для агент-агент диалогов. Это снижает стоимость симуляции в 3 раза без потери качества (31% от baseline в их экспериментах).

02

Аудитория: 2 500 виртуальных покупателей РФ

Agent Bank состоит из 2 500 персон, репрезентативно покрывающих население РФ по данным Росстата 2024 («Социально-экономическое положение регионов России», «Численность населения по полу и возрасту», «Распределение населения по квинтилям дохода»):

Поволжье≈610 (24.4%)
Москва и МО≈463 (18.5%)
Сибирь≈350 (14.0%)
Юг России≈353 (14.1%)
Урал≈255 (10.2%)
Северо-Запад≈180 (7.2%)
Дальний Восток≈165 (6.6%)
Санкт-Петербург и ЛО≈124 (4.9%)

Каждая персона включает:

  • — Демографию (пол, возраст, регион, квинтиль дохода, тип семьи, образование, профессия)
  • — Психографику (архетип, ценности, риск-аппетит, отношение к брендам)
  • — Цифровые привычки (предпочтения маркетплейсов, каналы информации)
  • — 3-5 «затравочных» воспоминаний из жизни персонажа
03

Макро-контекст: ЦБ РФ live

Для калибровки ценовой чувствительности и горизонта планирования покупки используются актуальные макроэкономические индикаторы — подтягиваются с cbr.ru/key-indicatorsпри каждом запуске анализа (кэш 24 часа):

  • — Инфляция YoY (ИПЦ, год к году)
  • — Ключевая ставка ЦБ РФ
  • — Индекс потребительского доверия (квартальный)

При недоступности живых данных используется fallback на последнее известное значение с флагом stale=true.

04

Точность: как мы её измеряем

Текущие метрики (по состоянию на 16 мая 2026):

73%
MAPE-точность
Mean Absolute Percentage Error
4.1 / 5
Реалистичность
оценка ИИ-судьёй (Claude Sonnet-4-5)

MAPE измеряется на наборе из 10 эталонных карточек WB/Ozon с публично-известным месячным объёмом продаж. Симулятор запускается на каждой → предсказанный спрос сравнивается с реальным → среднее абсолютное процентное отклонение. Полный список карточек и протокол — в Validation Framework.

Реалистичность — независимая оценка случайной выборки ответов виртуальных покупателей ИИ-судьёй по 5-балльной шкале «1=стереотипный AI, 5=неотличимо от человека». Методология из работы Tencent AGA (2024), которая, в свою очередь, валидирована против человеческой экспертной оценки.

Метрики обновляются после каждого Validation-прогона. История доступна по запросу.

05

Ограничения модели

  • Симуляция, не предсказание. Результаты носят рекомендательный характер. Реальные продажи зависят от факторов вне модели: сезонность аккаунта, репутация продавца, маркетинговая активность конкурентов, изменения алгоритмов маркетплейса.
  • Минимум 20 покупателей. При меньшей выборке доверительные интервалы становятся слишком широкими для практического применения. Рекомендуем 100+.
  • Точность по категориям различается. На массовых категориях (одежда, бытовая техника) точность ближе к 80%. На нишевых (хобби, специализированные товары) может опускаться до 50-60% — данных меньше, поведение менее предсказуемо.
  • Не заменяет реальное A/B-тестирование. Используется как быстрый фильтр идей перед закупкой. Для финального запуска большой партии рекомендуем пробную поставку.
06

152-ФЗ и хранение данных

На момент беты данные пользователей хранятся в Supabase (EU) и Render (EU). После релиза планируется миграция на Yandex Cloud / Selectel согласно ч. 5 ст. 18 152-ФЗ.

API-ключи маркетплейсов шифруются AES-128 (Fernet) перед сохранением. Доступ к данным пользователя — только сам пользователь и владелец продукта. Audit log всех операций ведётся в Supabase.

Полные правила в Политике конфиденциальности.

07

Источники

  • — Park, J. S. et al. «Generative Agents: Interactive Simulacra of Human Behavior». UIST 2023.
  • — Park, J. S. et al. «Generative Agent Simulations of 1,000 People». 2024.
  • — Yu, Y. et al. «Affordable Generative Agents». TMLR, август 2024.
  • — Росстат. «Социально-экономическое положение регионов России». 2024.
  • — ЦБ РФ. «Ключевые индикаторы экономики». cbr.ru/key-indicators
  • — MPStats. Категорийные данные маркетплейсов WB/Ozon.

Если есть вопросы по методологии или хочешь увидеть, как симулятор работает на твоей категории — пиши hello@analyzator.tech.