Ищем инженера для разработки моделей синтеза речи и Voice Cloning на базе LLM. Вас ждет работа с большими объемами данных и свобода в выборе решений

Команда VoiceKit разрабатывает и развивает технологии распознавания и синтеза речи в экосистеме Группы «Т‑Технологии». Мы создаем и поддерживаем голосовые интерфейсы, которые используются в клиентских сервисах, ассистентах и агентных системах.
Ищем
В направление Speech Synthesis ищем инженеров, которым интересно работать с мультимодальными LLM-архитектурами синтеза. Вы будете разрабатывать и внедрять модели натуралистичного синтеза речи с поддержкой функциональности Voice Cloning.
Фокусы направления:
— Text Omni LLM. Добавление аудиомодальности, адаптация доменов, дистилляция.
— Audio codecs. Аудио- и семантические кодеки с низким и высоким битрейтом.
— Audio alignment. Офлайн- и
В направление Spoken Dialogue Models ищем инженера, который будет разрабатывать
Фокусы направления:
— Разработка
— Повышение естественности диалогового взаимодействия за счет минимизации задержек, улучшения обработки прерываний и интеграции паралингвистической информации из пользовательской речи.
— Адаптация моделей под специфику конкретных банковских продуктов с последующим внедрением.
Как мы работаем:
— Ориентируемся на
— Используем современные подходы к внедрению мультимодальности в LLM и большие объемы данных.
— Гибко корректируем планы при получении новых результатов, чтобы развивать проект в нужном направлении.
Почему у нас интересно:
— Широкий спектр задач, GPU и большие объемы данных. Мы обучаем быстрые классические модели синтеза и крупные текстовые и
— Пространство в выборе решений. Вы будете определять способы достижения результатов и нести за них ответственность.
— Опытная команда с широким набором навыков. Приветствуем регулярную смену задач и постепенное погружение во все домены синтеза.
Искать и анализировать проблемы и точки улучшения моделей и продуктов
Генерировать гипотезы и идеи
Разрабатывать и проводить эксперименты
Внедрять успешные кейсы
Собирать, синтезировать и настраивать разметку текстовых и аудиоданных
Поддерживать качество кодовой базы и артефактов исследований
У вас есть знания и опыт в одном из доменов: Large generative models, Speech recognition, Speech или Music synthesis, Reinforcement learning
Умеете проектировать прозрачную архитектуру и разрабатывать поддерживаемый код
Умеете синтезировать жизнеспособные гипотезы и реализовать серии экспериментов для проверки
Готовы брать ответственность за задачи и работать с высокой автономностью
Регулярно актуализируете свои знания в аудио- и
Работу в офисе или гибридный формат — по договоренности с руководителем
Возможность работы в аккредитованной
ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
Рост по карьерному треку: проходите курсы по софт- и
Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
Компенсацию затрат на спортивные абонементы, приложение Т‑Спорта для
3 дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
Специальные тарифы на продукты Т‑Банка и широкую программу скидок от партнеров
Достойную зарплату — обсудим ее на собеседовании
Откликнуться на вакансию
Ищем инженера, который будет автоматизировать жизненный цикл ML-моделей: от разработки и тестирования до развертывания, мониторинга и поддержки в продакшене
Развиваем корпоративное хранилище данных. Ищем сильного ML-инженера, который готов стать драйвером ML-практик, улучшать платформу и процессы
Разрабатываем решения для создания визуального контента. Ищем ML-инженера в TFusion — одну из команд AI-центра Т‑Банка