📌 Цель:
Определить и классифицировать все типы данных, используемых в компании, чтобы создать структурированный подход к их учету, управлению и использованию.
Дата-активы – это все данные, имеющие ценность для бизнеса. Они могут быть операционными, аналитическими, финансовыми, клиентскими, публичными и т. д..
🔹 1️⃣ Проблемы отсутствия классификации дата-активов
🚨 Разрозненность данных – данные разбросаны по разным системам без единой структуры.
🚨 Трудности с lineage – невозможно отследить, какие данные используются в отчетах и моделях.
🚨 Низкая управляемость – сложно определить владельцев данных и применимые к ним политики.
🚨 Отсутствие четких SLA – пользователи не знают, насколько надежны и актуальны данные.
Четкая классификация решает эти проблемы, создавая прозрачную систему учета данных.
🔹 2️⃣ Основные типы дата-активов
Каждая организация использует разные категории данных. Мы разделяем их на основные типы:
📌 1. Операционные данные
🔹 Описание: Данные, которые генерируются в ходе повседневной работы бизнеса.
🔹 Примеры: заказы, транзакции, балансы.
🔹 Источники: DBSS, CRM, SCM
🔹 Использование: поддержка бизнес-процессов в реальном времени.
📌 2. Аналитические данные
🔹 Описание: Обработанные данные, которые используются для бизнес-анализа.
🔹 Примеры: BI-отчеты, метрики KPI, финансовые модели.
🔹 Источники: Lake House
🔹 Использование: построение дашбордов, прогнозирование, ML-модели.
📌 3. Финансовые данные
🔹 Описание: Данные, связанные с доходами, расходами, бухгалтерским учетом.
🔹 Примеры: отчеты о прибыли и убытках, налоговые декларации.
🔹 Источники: бухгалтерские системы.
🔹 Использование: финансовый контроль, отчетность, инвестиционные расчеты.
📌 4. Клиентские данные (Customer Data)
🔹 Описание: Информация о клиентах и их активности.
🔹 Примеры: контактные данные, история транзакций, поддержка клиентов.
🔹 Источники: DBSS.
🔹 Использование: маркетинг, персонализация, анализ поведения.
📌 5. Данные мониторинга и логов
🔹 Описание: Данные, собираемые для контроля работы IT-систем и безопасности.
🔹 Примеры: системные логи, метрики производительности, события безопасности.
🔹 Источники: ELK Stack, Prometheus, Grafana, Splunk.
🔹 Использование: мониторинг инфраструктуры, аудит, кибербезопасность.
📌 6. Внешние данные (External & Open Data)
🔹 Описание: Данные, полученные из внешних источников.
🔹 Примеры: курсы валют, погодные условия, макроэкономическая статистика.
🔹 Источники: API, веб-скрапинг, партнерские интеграции.
🔹 Использование: анализ рынка, построение предсказательных моделей.
🔹 3️⃣ Классификация данных по уровням критичности
Не все данные имеют одинаковую важность для бизнеса. Мы вводим уровни критичности:
Критичность | Описание | Пример |
---|---|---|
🛑 Критические (Critical Data) | Данные, нарушение доступности которых ведёт к финансовым потерям или сбоям в работе | Транзакции, баланс на счетах |
⚠️ Важные (High-Value Data) | Данные, которые важны, но не влияют на ключевые процессы мгновенно | BI-отчеты, аналитика по продажам |
📊 Обычные (Operational Data) | Данные, которые не критичны, но важны для текущих операций | Логи, отчёты о маркетинговых кампаниях |
📂 Архивные (Historical Data) | Старые данные, которые нужны для отчетности и истории | Продажи за прошлые годы, архивные базы клиентов |
🔹 4️⃣ Ожидаемые результаты
✅ Четкое понимание типов данных → каждый тип данных имеет свою стратегию хранения и использования.
✅ Простота управления → бизнес-пользователи понимают, какие данные где находятся и кто за них отвечает.
✅ Лучшая защита и безопасность → для критичных данных действуют строгие политики доступа.
✅ Эффективное использование ресурсов → аналитические и операционные данные разделены.
📍 Итог:
Определение типов дата-активов и их классификация позволяют лучше организовать управление данными, улучшить прозрачность и снизить риски.