Как использовать публичные HR-данные для обучения аналитиков в IT-компаниях

17 сентября 2021 г.
4 мин. чтения
Анастасия Демьянова

# Как использовать публичные HR-данные для обучения аналитиков в IT-компаниях

Почему HR-данные такие ценные, но сложные в доступе

HR-данные — это самая конфиденциальная информация в компании. Они содержат персональные данные, финансовую информацию и показатели производительности, которые требуют особой защиты. В то же время, именно эти данные позволяют принимать обоснованные решения в HR.

Однако доступ к реальным данным ограничен. Только 24% HR-отделов считают, что извлекают максимальную ценность из своих HR-систем. 65% HR-руководителей не уверены, что их текущий подход к технологиям помогает достижению бизнес-целей. Именно поэтому практика с синтетическими данными становится критически важной.

Как выбрать подходящий HR-датасет

Выбор правильного датасета может стать разницей между базовыми отчётами и глубокими выводами о рабочей силе. Вот как подойти к выбору:

Соответствие цели анализа

Начните с вопроса, который хотите решить. Например, если анализируете уход сотрудников, выберите датасет с переменными: стаж, должность, отдел, показатель ухода. Для анализа вовлечённости добавьте результаты опросов с контекстом: менеджер, уровень должности, локация.

Структура датасета

Лучше всего, когда каждая строка — это один сотрудник, а каждый столбец — переменная. Табличный формат упрощает фильтрацию, группировку и визуализацию данных. Для Excel и CSV лучше использовать простую структуру, а не смешивать форматы в одном файле.

Чёткие переменные

Датасет должен использовать понятные названия полей и чёткие определения. Переменные, такие как стаж, уровень зарплаты, оценка производительности и история продвижений, должны быть легко интерпретируемыми.

Достаточный объём данных

Маленькие датасеты редко дают надёжные тренды. Датсет, покрывающий несколько отделов, должностей и уровней стажа, позволяет сравнивать группы и выявлять закономерности.

Безопасность использования

Публичные датасеты обычно анонимизированы или синтетические, что позволяет практиковаться без риска для конфиденциальности. Но важно проверить, не содержат ли они комбинации данных, которые могут идентифицировать сотрудников.

9 датасетов для практики HR-аналитики в IT

1. HR-датасет для анализа ухода сотрудников

Этот датасет включает связанные CSV-файлы, а не одну таблицу. Он подходит для анализа, который объединяет данные HRIS с зарплатными сетками, расходами на рекрутинг и показателями производительности.

#### Примеры данных:

- Основные данные о сотрудниках: демография, отдел, должность, уровень зарплаты, менеджер, даты найма и увольнения, оценка производительности.

- Вовлечённость и удовлетворённость: результаты опросов, уровень удовлетворённости, количество специальных проектов, дата последнего ревью, количество опозданий за последние 30 дней.

- Зарплатные сетки: диапазоны зарплат по должностям (мин, сред, макс).

- Расходы на рекрутинг: расходы по каналам набора, которые можно связать с источником найма сотрудника.

- Производительность: показатели, такие как ошибки в день, жалобы за 90 дней.

#### Примеры анализа:

  • Сравнение паттернов увольнений по отделам и должностям.
  • Проверка соответствия зарплатных сеток фактическим зарплатам сотрудников.
  • Анализ эффективности каналов найма.
  • Поиск факторов, влияющих на низкую производительность.
  • Сравнение вовлечённости ушедших и оставшихся сотрудников.
  • 2. HR-датасет для анализа вовлечённости

    Этот датасет содержит 1,480 записей о сотрудниках и включает показатели ухода, контекст работы, зарплатные сетки и показатели опыта сотрудников.

    #### Примеры данных:

    - Уход: показатель, указывающий, ушёл сотрудник или нет.

    - Контекст работы: отдел, должность, уровень должности.

    - Зарплата: месячный доход и уровень зарплаты.

    - Рабочие паттерны: статус переработок, бизнес-поездки.

    - Опыт работы: удовлетворённость, баланс работы и личной жизни.

    - Стаж и продвижение: время в компании, время в должности, время с последнего продвижения, время с текущим менеджером.

    #### Примеры анализа:

  • Сравнение ухода по отделам, должностям и уровням.
  • Сравнение ухода по зарплатным сеткам и диапазонам доходов.
  • Сравнение ухода между сотрудниками с переработками и без.
  • Сравнение удовлетворённости и баланса работы ушедших и оставшихся сотрудников.
  • Анализ влияния стажа и продвижений на уход.
  • 3. IBM HR-датасет для анализа ухода и производительности

    Этот датасет содержит 1,470 записей и 35 переменных. Он подходит для дашбординга, статистического анализа и базового прогнозирования.

    #### Примеры данных:

    - Уход: показатель, указывающий, ушёл сотрудник или нет.

    - Отдел и должность: где работает сотрудник и какую роль выполняет.

    - Зарплата: месячный доход и процент повышения зарплаты.

    - Переработки: статус переработок.

    - Удовлетворённость и баланс работы: оценки удовлетворённости и баланса работы.

    - Стаж и продвижение: время в компании и время с последнего продвижения.

    #### Примеры анализа:

  • Сравнение ухода по отделам и должностям.
  • Сравнение ухода по уровням зарплаты и доходам.
  • Сравнение ухода между сотрудниками с переработками и без.
  • Сравнение удовлетворённости и баланса работы ушедших и оставшихся сотрудников.
  • Анализ влияния стажа и продвижений на уход.
  • Как создать синтетический HR-датасет с помощью ИИ

    Создание синтетических данных — это мощный инструмент для обучения аналитиков. ИИ может помочь создать реалистичные HR-данные для практики, но важно проверить результат перед использованием.

    Преимущества синтетических данных:

    - Безопасность: данные не содержат реальных персональных данных.

    - Гибкость: можно создавать данные для любых сценариев.

    - Масштабируемость: можно создавать большие объёмы данных для тестирования.

    Пример создания датасета:

    1. Определите структуру данных: какие переменные нужны для анализа.

    2. Определите распределение данных: как данные должны быть распределены по переменным.

    3. Создайте синтетические данные: используйте ИИ для генерации данных.

    4. Проверьте данные: убедитесь, что данные соответствуют реальным сценариям.

    Заключение

    Публичные HR-датасеты — это отличный способ практиковаться в аналитике без риска для конфиденциальности. Они позволяют строить дашборды, тестировать гипотезы и обучать аналитиков. Выбор правильного датасета и создание синтетических данных — ключевые шаги для успешного обучения аналитиков в IT-компаниях.

    Если вам нужна помощь с настройкой процесса — [оставьте заявку](#request).

    Нужна помощь с подбором?

    Мы находим кандидатов за 7 дней и гарантируем замену. Оставьте заявку и получите расчёт бюджета.

    Оставить заявку →

    Теги:

    #hr
    АД

    Анастасия Демьянова

    Head of Recruitment. Специализируется на подборе и работе с людьми. Более 9 лет опыта в рекрутинге.

    Похожие статьи

    Карьера и развитие

    Как выбрать HR-курсы для новичков: 9 проверенных программ для старта карьеры в HR

    Начало карьеры в HR — это как старт в неизвестный город. У вас есть карта, но нет точного маршрута. HR-курсы для новичков становятся вашим компасом. Они дают фундаментальные знания, помогают понять нюансы профессии и дают уверенность в том,

    21 апреля 2026 г.
    3 мин
    Илья Демьянов
    Карьера и развитие

    Как выбрать онлайн-курсы по HR для российских IT-компаний

    В условиях жесткой конкуренции и высокой текучести кадров российские IT-компании не могут позволить себе игнорировать развитие HR-навыков сотрудников. Онлайн-курсы по HR предлагают гибкое и доступное решение для профессионального роста.

    3 апреля 2026 г.
    3 мин
    Илья Демьянов
    Карьера и развитие

    25 критических факторов для успеха корпоративного тренинга продаж

    Корпоративные тренинги продаж – это важнейший инструмент для развития навыков и повышения эффективности продаж в компании. Однако, чтобы тренинг был действительно эффективным, необходимо соблюдать ряд критических факторов. В этой статье мы

    1 апреля 2026 г.
    3 мин
    Анастасия Демьянова

    Оставить заявку на подбор

    Оставьте номер — персональный рекрутер перезвонит в течение 30 минут

    🛡️

    Гарантия замены

    Отчёт за 48ч

    💼

    Персональный рекрутер