Доклад «Data‑driven‑подход к анализу данных»

Аватар автора
Инфосистемы Джет
Что делать, когда данных становится больше, а качественных решений — нет? Павел Егоров разбирает большие вызовы data-подхода: • почему 40% времени data-специалисты тратят впустую из-за плохого качества данных • как дата-каталоги и глоссарии спасают от хаоса в показателях (один KPI считают шестью разными способами!) • зачем внедрять «дата контракты» между бизнесом и IT — как в поставках молока • почему Lakehouse вытесняет классические хранилища и когда переходить на него Смотрите, чтобы увидеть живые кейсы из промышленности, ритейла и банков. 00:01:00 — Рост данных: IoT, машинное зрение, телеметрия, ERP. 00:04:05 — Проблема №1: недостаток данных для обучения ML-моделей. 00:07:18 — Кейс: как в автосалонах один показатель продаж считали по-разному. 00:09:21 — Категорирование данных: ПДн, гостайна, коммерческая тайна. 00:10:36 — Производственные данные: почему «характеризующие» показатели никто не собирает. 00:12:18 — Ответственность за данные: КИП, финансы, ИБ. 00:13:34 — Интеграция Data Catalog с процессами разработки. 00:14:50 — Синергия с информационной безопасностью: поиск инцидентов через Data Lineage. 00:17:18 — Метрики эффективности: 40% трудозатрат экономят автоматизированные процессы. 00:18:22 — Архитектуры данных: Greenplum, Clickhouse, Lakehouse. 00:19:02 — Lakehouse на практике: S3 + Trino + Iceberg. 00:21:23 — Дата-контракты: как договориться с бизнесом о качестве данных. 00:25:00 — Автоматическое сканирование BI-отчётов и баз данных. 00:26:28 — Концепция...

0/0


0/0

0/0

0/0