ML-инженер в VoiceKit

Ищем инженера для разработки моделей синтеза речи и Voice Cloning на базе LLM. Вас ждет работа с большими объемами данных и свобода в выборе решений

Описание

Команда VoiceKit разрабатывает и развивает технологии распознавания и синтеза речи в экосистеме Группы «Т‑Технологии». Мы создаем и поддерживаем голосовые интерфейсы, которые используются в клиентских сервисах, ассистентах и агентных системах.

Ищем ML-инженера в 2 направления.

В направление Speech Synthesis ищем инженеров, которым интересно работать с мультимодальными LLM-архитектурами синтеза. Вы будете разрабатывать и внедрять модели натуралистичного синтеза речи с поддержкой функциональности Voice Cloning.

Фокусы направления:

— Text Omni LLM. Добавление аудиомодальности, адаптация доменов, дистилляция.

— Audio codecs. Аудио- и семантические кодеки с низким и высоким битрейтом.

— Audio alignment. Офлайн- и онлайн-RL, critic- и reward-модели.

В направление Spoken Dialogue Models ищем инженера, который будет разрабатывать end-to-end диалоговые модели для автоматизации работы колл-центра.

Фокусы направления:

— Разработка end-to-end-моделей, которые не уступают каскадному пайплайну в понимании пользовательской речи и качестве сгенерированных ответов.

— Повышение естественности диалогового взаимодействия за счет минимизации задержек, улучшения обработки прерываний и интеграции паралингвистической информации из пользовательской речи.

— Адаптация моделей под специфику конкретных банковских продуктов с последующим внедрением.

Как мы работаем:

— Ориентируемся на бизнес-ценность. Решаем прикладные задачи, которые напрямую влияют на развитие банковских продуктов и улучшение клиентского опыта.

— Используем современные подходы к внедрению мультимодальности в LLM и большие объемы данных.

— Гибко корректируем планы при получении новых результатов, чтобы развивать проект в нужном направлении.

Почему у нас интересно:

— Широкий спектр задач, GPU и большие объемы данных. Мы обучаем быстрые классические модели синтеза и крупные текстовые и аудио-LLM для разных элементов нашего пайплайна.

— Пространство в выборе решений. Вы будете определять способы достижения результатов и нести за них ответственность.

— Опытная команда с широким набором навыков. Приветствуем регулярную смену задач и постепенное погружение во все домены синтеза.

Обязанности

Искать и анализировать проблемы и точки улучшения моделей и продуктов
Генерировать гипотезы и идеи
Разрабатывать и проводить эксперименты
Внедрять успешные кейсы
Собирать, синтезировать и настраивать разметку текстовых и аудиоданных
Поддерживать качество кодовой базы и артефактов исследований

Требования

У вас есть знания и опыт в одном из доменов: Large generative models, Speech recognition, Speech или Music synthesis, Reinforcement learning
Умеете проектировать прозрачную архитектуру и разрабатывать поддерживаемый код
Умеете синтезировать жизнеспособные гипотезы и реализовать серии экспериментов для проверки
Готовы брать ответственность за задачи и работать с высокой автономностью
Регулярно актуализируете свои знания в аудио- и LLM-доменах и DL в целом

Мы предлагаем

Работу в офисе или гибридный формат — по договоренности с руководителем
Возможность работы в аккредитованной ИТ-компании
ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью
Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
Компенсацию затрат на спортивные абонементы, приложение Т‑Спорта для онлайн-занятий и командные тренировки с коллегами
3 дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
Специальные тарифы на продукты Т‑Банка и широкую программу скидок от партнеров
Достойную зарплату — обсудим ее на собеседовании

Откликнуться на вакансию

ML Ops-инженер

Ищем инженера, который будет автоматизировать жизненный цикл ML-моделей: от разработки и тестирования до развертывания, мониторинга и поддержки в продакшене

Откликнуться

ML-инженер в Data Platform

Развиваем корпоративное хранилище данных. Ищем сильного ML-инженера, который готов стать драйвером ML-практик, улучшать платформу и процессы

Откликнуться

ML-инженер в области Generative CV

Разрабатываем решения для создания визуального контента. Ищем ML-инженера в TFusion — одну из команд AI-центра Т‑Банка

Откликнуться