Appearance
Подготовка данных
Загрузка данных экспериментов для анализа. AB-Labz Workbench поддерживает два способа загрузки: напрямую через CSV-файл или автоматически через API.
Формат данных
Данные для анализа должны содержать три обязательные колонки, минимум одну метрику и опционально сегменты для дополнительного анализа.
Обязательные колонки:
- Единица рандомизации:
user_id,user,device_id,device,uid— уникальный идентификатор пользователя/сессии/устройства - Группа эксперимента:
variant,var,group— название варианта (control,treatment, или другие) - Дата:
dt,date,created_at,create_at,dttm,event_date,event_dt— дата события
Колонки с метриками (минимум 1): Одна или несколько колонок с измеряемыми показателями. Название колонки = название метрики.
Колонки с сегментами (опционально): Дополнительные колонки для группировки данных (например, platform, city, country). Позволяют проанализировать эксперимент по различным срезам аудитории.
Пример данных:
text
user_id,variant,dt,registration,revenue,session_duration,platform
user_1,control,2024-01-15,0,0,120.5,ios
user_2,control,2024-01-15,1,49.99,340.2,android
user_3,treatment,2024-01-16,1,29.99,180.0,web
user_4,treatment,2024-01-16,0,0,95.3,ios
Требования к данным
Для conversion-метрик: Значения должны быть строго 0 или 1. Где 1 = событие произошло, 0 = не произошло.
Важно: Conversion измеряет факт совершения действия, а не количество. Если пользователь совершил событие несколько раз (например, 5 покупок), в данных всё равно указывается 1 (событие произошло), а не количество событий. Для подсчёта количества используйте numeric-метрики.
Для numeric-метрик: Любые числовые значения (целые или дробные). Система рассчитает среднее значение на пользователя в каждой группе.
Для ratio-метрик: Загружаются как две отдельные numeric-метрики (числитель и знаменатель). Ratio создаётся в интерфейсе анализа после загрузки.
Варианты (Variants): Названия вариантов произвольные, но рекомендуется control для контрольной группы. Система поддерживает AB-тесты (2 варианта) и ABC+ тесты (3+ варианта).
Даты: Формат даты — YYYY-MM-DD (например, 2024-01-15). Даты используются для определения начала и окончания эксперимента.
Сегменты: Произвольные строковые переменные для анализа по подгруппам. Например, platform (ios/android/web), city (Moscow/SPB), country (RU/US/EU). Сегменты позволяют проверить, как эффект эксперимента различается для разных групп пользователей.
Ограничение: Сегмент не должен содержать более 10 уникальных значений. При превышении этого лимита сегмент не будет доступен для фильтрации в анализе.
Распознавание колонок
Система автоматически распознает обязательные колонки по их названиям. Вы можете использовать любое из поддерживаемых названий:
Для единицы рандомизации:
user_id— основное названиеuser— краткая формаdevice_id,device— для экспериментов на уровне устройствuid— универсальный идентификатор
Для группы эксперимента:
variant— основное название (рекомендуется)var— краткая формаgroup— альтернативное название
Для даты:
dt— основное названиеdate— полная формаcreated_at,create_at— временная метка созданияdttm— дата и времяevent_date,event_dt— дата события
Система распознает колонки независимо от регистра и даже если название колонки содержит дополнительные символы (например, user_id_hash распознается как user_id).
Способ 1: Загрузка CSV-файла
Загрузите данные напрямую с вашего компьютера.
Лимиты и ограничения
Формат: только CSV (с запятой или точкой с запятой как разделитель)
Размер файла: до 100 МБ
Кодировка: UTF-8 (рекомендуется) или Windows-1251
Разделитель: запятая (,) или точка с запятой (;) — определяется автоматически
Процесс загрузки
Перейдите в раздел Подготовка данных. На вкладке "Загрузить CSV" нажмите "Выбрать" и выберите CSV-файл с вашего компьютера.
После выбора файла:
- Отобразится имя файла
- Активируется кнопка "Загрузить и проанализировать"
Нажмите кнопку загрузки. Начнётся процесс:
- Загрузка файла на сервер
- Валидация структуры данных
- Подготовка данных для анализа
После завершения загрузки вы сможете запустить анализ или прогноз. Весь процесс занимает от нескольких секунд до минуты (в зависимости от размера файла).
Способ 2: Загрузка через API
Получите данные, которые были предварительно отправлены в AB-Labz Workbench через API.
Как это работает:
- Ваша система отправляет (push) данные экспериментов в AB-Labz Workbench через API по мере их накопления
- Когда эксперимент завершен, вы выбираете его из списка загруженных экспериментов в интерфейсе
- Система подготавливает данные, после чего вы можете запустить анализ или прогноз
Как получить данные
Перейдите в раздел Подготовка данных и выберите вкладку "Получить по API".
В выпадающем списке "ID эксперимента" отобразятся все эксперименты, данные которых были загружены через API. Выберите нужный эксперимент из списка.
После выбора эксперимента данные будут автоматически подготовлены, и вы сможете запустить анализ или прогноз.
Важно: Для работы API-загрузки необходимо предварительно настроить API-ключ в разделе API ключи и настроить отправку данных из вашей системы. Подробности в разделе API документации.
Валидация данных
Система автоматически проверяет:
- Наличие обязательных колонок (
user_id,variant,dt) - Корректность типов данных
При обнаружении ошибок отображается сообщение с пояснением проблемы. Исправьте данные и повторите загрузку.
Импорт метрик в каталог
Если в данных есть метрики, которых нет в каталоге, система предложит импортировать их.
Модальное окно импорта:
- Список новых метрик с чекбоксами
- Автоопределение типа (conversion/numeric)
- Возможность выбора, какие метрики добавить
Важно: Импорт в каталог опционален. Данные будут проанализированы независимо от того, добавлены метрики в каталог или нет.
Рекомендуется импортировать метрики для документирования и стандартизации названий в команде.
AB-Labz Library