Skip to content
On this page

Подготовка данных

Загрузка данных экспериментов для анализа. AB-Labz Workbench поддерживает два способа загрузки: напрямую через CSV-файл или автоматически через API.

Формат данных

Данные для анализа должны содержать три обязательные колонки, минимум одну метрику и опционально сегменты для дополнительного анализа.

Обязательные колонки:

  • Единица рандомизации: user_id, user, device_id, device, uid — уникальный идентификатор пользователя/сессии/устройства
  • Группа эксперимента: variant, var, group — название варианта (control, treatment, или другие)
  • Дата: dt, date, created_at, create_at, dttm, event_date, event_dt — дата события

Колонки с метриками (минимум 1): Одна или несколько колонок с измеряемыми показателями. Название колонки = название метрики.

Колонки с сегментами (опционально): Дополнительные колонки для группировки данных (например, platform, city, country). Позволяют проанализировать эксперимент по различным срезам аудитории.

Пример данных:

text
user_id,variant,dt,registration,revenue,session_duration,platform
user_1,control,2024-01-15,0,0,120.5,ios
user_2,control,2024-01-15,1,49.99,340.2,android
user_3,treatment,2024-01-16,1,29.99,180.0,web
user_4,treatment,2024-01-16,0,0,95.3,ios

Требования к данным

Для conversion-метрик: Значения должны быть строго 0 или 1. Где 1 = событие произошло, 0 = не произошло.

Важно: Conversion измеряет факт совершения действия, а не количество. Если пользователь совершил событие несколько раз (например, 5 покупок), в данных всё равно указывается 1 (событие произошло), а не количество событий. Для подсчёта количества используйте numeric-метрики.

Для numeric-метрик: Любые числовые значения (целые или дробные). Система рассчитает среднее значение на пользователя в каждой группе.

Для ratio-метрик: Загружаются как две отдельные numeric-метрики (числитель и знаменатель). Ratio создаётся в интерфейсе анализа после загрузки.

Варианты (Variants): Названия вариантов произвольные, но рекомендуется control для контрольной группы. Система поддерживает AB-тесты (2 варианта) и ABC+ тесты (3+ варианта).

Даты: Формат даты — YYYY-MM-DD (например, 2024-01-15). Даты используются для определения начала и окончания эксперимента.

Сегменты: Произвольные строковые переменные для анализа по подгруппам. Например, platform (ios/android/web), city (Moscow/SPB), country (RU/US/EU). Сегменты позволяют проверить, как эффект эксперимента различается для разных групп пользователей.

Ограничение: Сегмент не должен содержать более 10 уникальных значений. При превышении этого лимита сегмент не будет доступен для фильтрации в анализе.

Распознавание колонок

Система автоматически распознает обязательные колонки по их названиям. Вы можете использовать любое из поддерживаемых названий:

Для единицы рандомизации:

  • user_id — основное название
  • user — краткая форма
  • device_id, device — для экспериментов на уровне устройств
  • uid — универсальный идентификатор

Для группы эксперимента:

  • variant — основное название (рекомендуется)
  • var — краткая форма
  • group — альтернативное название

Для даты:

  • dt — основное название
  • date — полная форма
  • created_at, create_at — временная метка создания
  • dttm — дата и время
  • event_date, event_dt — дата события

Система распознает колонки независимо от регистра и даже если название колонки содержит дополнительные символы (например, user_id_hash распознается как user_id).

Способ 1: Загрузка CSV-файла

Загрузите данные напрямую с вашего компьютера.

Лимиты и ограничения

Формат: только CSV (с запятой или точкой с запятой как разделитель)

Размер файла: до 100 МБ

Кодировка: UTF-8 (рекомендуется) или Windows-1251

Разделитель: запятая (,) или точка с запятой (;) — определяется автоматически

Процесс загрузки

Перейдите в раздел Подготовка данных. На вкладке "Загрузить CSV" нажмите "Выбрать" и выберите CSV-файл с вашего компьютера.

После выбора файла:

  • Отобразится имя файла
  • Активируется кнопка "Загрузить и проанализировать"

Нажмите кнопку загрузки. Начнётся процесс:

  1. Загрузка файла на сервер
  2. Валидация структуры данных
  3. Подготовка данных для анализа

После завершения загрузки вы сможете запустить анализ или прогноз. Весь процесс занимает от нескольких секунд до минуты (в зависимости от размера файла).

Способ 2: Загрузка через API

Получите данные, которые были предварительно отправлены в AB-Labz Workbench через API.

Как это работает:

  1. Ваша система отправляет (push) данные экспериментов в AB-Labz Workbench через API по мере их накопления
  2. Когда эксперимент завершен, вы выбираете его из списка загруженных экспериментов в интерфейсе
  3. Система подготавливает данные, после чего вы можете запустить анализ или прогноз

Как получить данные

Перейдите в раздел Подготовка данных и выберите вкладку "Получить по API".

В выпадающем списке "ID эксперимента" отобразятся все эксперименты, данные которых были загружены через API. Выберите нужный эксперимент из списка.

После выбора эксперимента данные будут автоматически подготовлены, и вы сможете запустить анализ или прогноз.

Важно: Для работы API-загрузки необходимо предварительно настроить API-ключ в разделе API ключи и настроить отправку данных из вашей системы. Подробности в разделе API документации.

Валидация данных

Система автоматически проверяет:

  • Наличие обязательных колонок (user_id, variant, dt)
  • Корректность типов данных

При обнаружении ошибок отображается сообщение с пояснением проблемы. Исправьте данные и повторите загрузку.

Импорт метрик в каталог

Если в данных есть метрики, которых нет в каталоге, система предложит импортировать их.

Модальное окно импорта:

  • Список новых метрик с чекбоксами
  • Автоопределение типа (conversion/numeric)
  • Возможность выбора, какие метрики добавить

Важно: Импорт в каталог опционален. Данные будут проанализированы независимо от того, добавлены метрики в каталог или нет.

Рекомендуется импортировать метрики для документирования и стандартизации названий в команде.

AB-Labz - Лаборатория продуктовых экспериментов