Озеро данных и BI-платформа для страховой компании

DCДатаКрафтЗаказчик: СтрахГарант
Подтверждён заказчиком
ВнедрениеСтрахование15 октября 2025 г.

Импортозамещение

Microsoft Power BI Apache Superset

Задача

Крупная страховая компания с 30+ продуктами нуждалась в едином аналитическом хранилище для анализа убыточности, андеррайтинга и клиентской аналитики. Данные хранились в 8 изолированных системах.

Решение

Построено Data Lake на базе S3-совместимого хранилища. ETL-процессы через Apache Spark и Airflow. Трансформация данных через dbt. BI-визуализация в Apache Superset. Самообслуживаемая аналитика для бизнес-пользователей.

Результаты

Время подготовки аналитических отчётов сократилось с 2 недель до 15 минут. Выявлены убыточные сегменты, корректировка тарифов привела к улучшению убыточности на 8 п.п. 200+ активных пользователей BI.

Масштаб и сроки

Масштаб

30+ страховых продуктов, 8 систем-источников

Длительность

7 месяцев

Технологии

Apache SparkAirflowPostgreSQLSupersetPythondbt

Оценка заказчика

В срок
5/5
В рамках бюджета
5/5
Коммуникация
5/5
Готов к повторному сотрудничеству: Да

Экспертные инсайты

Участники проекта делятся уроками, техническими деталями и выводами

Технический разбор

ClickHouse vs Greenplum: когда что выбирать

Для этого проекта мы выбрали ClickHouse из-за скорости на аналитических запросах. Но заказчик хотел ещё и ad-hoc SQL с JOIN'ами по 10 таблиц — здесь ClickHouse проигрывает. Решение: ClickHouse для предрассчитанных витрин (90% запросов BI-аналитиков), Greenplum для сложных исследовательских запросов (10% запросов data scientists). Двухуровневая архитектура дороже, но закрывает все потребности.

СН

Сергей Наумов

Data-архитектор

Команда проекта

СН

Сергей Наумов

Data-архитектор

МС

Мария Степанова

BI-аналитик

Связаться

Запросите знакомство с командой проекта через CaseLink

Войдите в аккаунт, чтобы продолжить