Как Analyzator AI симулирует потребительский спрос
Этот документ — для тех, кто хочет понять, на каких научных основаниях стоит наш симулятор, какие данные он использует и какая у него измеримая точность. Дата обновления: 16 мая 2026.
Архитектура: Stanford GenAgents + Tencent AGA
В основе симулятора — архитектура Generative Agents (Park et al., Stanford University, UIST 2023). Каждый «виртуальный покупатель» — это языковая модель с тремя компонентами:
- Memory Stream. Поток воспоминаний о виденных товарах, прошлых покупках, впечатлениях. Хранится в виде структурированного текста с timestamp.
- Retrieval. Извлечение релевантных воспоминаний по формуле
score = α·recency + β·importance + γ·relevance. Recency — экспоненциальное затухание (0.995 за час). Importance — оценка 1-10 от LLM. Relevance — косинусное сходство embeddings (Voyage AI voyage-3). - Reflection. Периодическая саморефлексия: персона синтезирует из накопленных observations высокоуровневые выводы вида «я предпочитаю проверенные бренды». Триггер: суммарная importance последних observations превысила 150.
Поверх Stanford-архитектуры мы применили оптимизации Affordable Generative Agents(Tencent, TMLR 2024) — Lifestyle Policy для агент-среды и Social Memory для агент-агент диалогов. Это снижает стоимость симуляции в 3 раза без потери качества (31% от baseline в их экспериментах).
Аудитория: 2 500 виртуальных покупателей РФ
Agent Bank состоит из 2 500 персон, репрезентативно покрывающих население РФ по данным Росстата 2024 («Социально-экономическое положение регионов России», «Численность населения по полу и возрасту», «Распределение населения по квинтилям дохода»):
Каждая персона включает:
- — Демографию (пол, возраст, регион, квинтиль дохода, тип семьи, образование, профессия)
- — Психографику (архетип, ценности, риск-аппетит, отношение к брендам)
- — Цифровые привычки (предпочтения маркетплейсов, каналы информации)
- — 3-5 «затравочных» воспоминаний из жизни персонажа
Макро-контекст: ЦБ РФ live
Для калибровки ценовой чувствительности и горизонта планирования покупки используются актуальные макроэкономические индикаторы — подтягиваются с cbr.ru/key-indicatorsпри каждом запуске анализа (кэш 24 часа):
- — Инфляция YoY (ИПЦ, год к году)
- — Ключевая ставка ЦБ РФ
- — Индекс потребительского доверия (квартальный)
При недоступности живых данных используется fallback на последнее известное значение с флагом stale=true.
Точность: как мы её измеряем
Текущие метрики (по состоянию на 16 мая 2026):
MAPE измеряется на наборе из 10 эталонных карточек WB/Ozon с публично-известным месячным объёмом продаж. Симулятор запускается на каждой → предсказанный спрос сравнивается с реальным → среднее абсолютное процентное отклонение. Полный список карточек и протокол — в Validation Framework.
Реалистичность — независимая оценка случайной выборки ответов виртуальных покупателей ИИ-судьёй по 5-балльной шкале «1=стереотипный AI, 5=неотличимо от человека». Методология из работы Tencent AGA (2024), которая, в свою очередь, валидирована против человеческой экспертной оценки.
Метрики обновляются после каждого Validation-прогона. История доступна по запросу.
Ограничения модели
- Симуляция, не предсказание. Результаты носят рекомендательный характер. Реальные продажи зависят от факторов вне модели: сезонность аккаунта, репутация продавца, маркетинговая активность конкурентов, изменения алгоритмов маркетплейса.
- Минимум 20 покупателей. При меньшей выборке доверительные интервалы становятся слишком широкими для практического применения. Рекомендуем 100+.
- Точность по категориям различается. На массовых категориях (одежда, бытовая техника) точность ближе к 80%. На нишевых (хобби, специализированные товары) может опускаться до 50-60% — данных меньше, поведение менее предсказуемо.
- Не заменяет реальное A/B-тестирование. Используется как быстрый фильтр идей перед закупкой. Для финального запуска большой партии рекомендуем пробную поставку.
152-ФЗ и хранение данных
На момент беты данные пользователей хранятся в Supabase (EU) и Render (EU). После релиза планируется миграция на Yandex Cloud / Selectel согласно ч. 5 ст. 18 152-ФЗ.
API-ключи маркетплейсов шифруются AES-128 (Fernet) перед сохранением. Доступ к данным пользователя — только сам пользователь и владелец продукта. Audit log всех операций ведётся в Supabase.
Полные правила в Политике конфиденциальности.
Источники
- — Park, J. S. et al. «Generative Agents: Interactive Simulacra of Human Behavior». UIST 2023.
- — Park, J. S. et al. «Generative Agent Simulations of 1,000 People». 2024.
- — Yu, Y. et al. «Affordable Generative Agents». TMLR, август 2024.
- — Росстат. «Социально-экономическое положение регионов России». 2024.
- — ЦБ РФ. «Ключевые индикаторы экономики». cbr.ru/key-indicators
- — MPStats. Категорийные данные маркетплейсов WB/Ozon.
Если есть вопросы по методологии или хочешь увидеть, как симулятор работает на твоей категории — пиши hello@analyzator.tech.