Data Detective — каталог данных Т‑Банка

Data Detective — это продукт класса Data Catalog для сотрудников Т‑Банка, которые хотят найти информацию о данных. Продукт собирает в одном месте метаданные из более чем 28 систем источников. Среди данных: технические характеристики, бизнес-описания таблиц, информация об отчетности, код пользовательских процессов, Lineage, сэмплы данных и так далее.

Data Catalog снижает время на поиск данных и зависимостей по ним, облегчает контроль и аудит огромной модели данных, косвенно повышает безопасность данных или утилизируемость ресурсов Data Platform за счет лучшего контроля за квотами.

В статье расскажем больше о Data Detective.

Data Detective, DD — каталог данных Группы компаний «Т-Технологии». Data Catalog — каталог данных. Lineage — процесс отслеживания пути данных от источника до конечного потребителя. Сэмпл — образец. Data Platform — платформа данных. CRM — система управления взаимоотношениями с клиентами. Data Lake — озеро данных, хранилище данных. Without Data Catalog — без каталога данных. Need more data — нужно больше данных. Don’t fit — не подходит. Prepare the data — подготовить данные. Find the data — найти данные. Get the data — получить данные. Evaluate the data — оценить данные. Try it — попробовать это. Understand the data — понять данные. Analyze the data — проанализировать данные. Share the data — поделиться данными. Buy Now, Pay Later, BNPL — способ оплаты, позволяющий купить товар сейчас и заплатить полную стоимость позже. Датасет — набор данных. ETL — процесс транспортировки данных. ML — машинное обучение. CTR — коэффициент кликабельности. DAU, MAU, WAU — метрики, позволяющие оценить количество активных пользователь в день, неделю и месяц. Roling Retention — доля аудитории, которая вернулась спустя определенное время. Ingest — поглощение чего-либо. Data Detective Model — модель каталога данных. Data Detective Editor (DDeD) — редактор метаданных. Etc. — и так далее. UI — пользовательский интерфейс. Public API — программный интерфейс. Pull-метод и push-метод — методы работы с данными. Фреймворк — структура, которая дает набор инструментов, библиотек и правил для разработки приложений. Airflow — платформа управления обработкой данных. OpenSearch — система поисковых и аналитических инстурментов. ArangoDB — графовая база данных. Backend или бэкенд — серверная разработка. Java Spring Boot — инструмент, который упрощает создание микрослужб и веб-приложений. CI/CD — набор практик и инструментов для автоматизации разработки и доставки программного обеспечения. Yaml — формат сериализации данных. React — библиотека для разработки пользовательских интерфейсов. Python — язык программирования. Pandas — библиотека для обработки и анализа данных. PostgreSQL — система управления базами данных. Apache Kafka — распределенная платформа для обработки потоков данных в реальном времени. HL++ Foundation 2022, PGConf, SmartData 2022, PyCon 2022, Profit Finance Day — ИТ-конференции. T‑Bank Data Meetup — ИТ-мероприятие Т-Банка, посвященное данным. How to load everything in the data catalog and not to die — как загрузить все в каталог данных и не умереть.

© 2006—2025, АО «ТБанк», официальный сайт, универсальная лицензия ЦБ РФ № 2673