О компании:
Наш продукт ориентирован на русскоязычные и кыргызскоязычные рынки с возможностью масштабирования на международную аудиторию.
Обязанности:
1. Разработка и оптимизация ML-моделей:
Настройка и интеграция моделей STT (Speech-to-Text) и TTS (Text-to-Speech), таких как Whisper, Tacotron, VITS, и т.д.
Работа с крупными языковыми моделями (LLM), такими как GPT (OpenAI), LLaMA, или их локальными аналогами.
Обучение и дообучение моделей под узкие задачи (специфичные языки, акценты, домены).
2. Обработка и анализ данных:
Сбор, подготовка и аугментация аудио- и текстовых данных для обучения и тестирования моделей.
Создание пайплайнов для работы с большими данными.
3. Оптимизация:
Оптимизация latency и производительности для работы в реальном времени.
4. Мониторинг и поддержка моделей:
Настройка метрик качества (WER, MOS) и мониторинг их в продакшене.
Постоянное улучшение точности и производительности.
5. Исследования и эксперименты:
Анализ и внедрение новых технологий, связанных с синтезом и распознаванием речи.
Участие в построении кастомных моделей для русскоязычных и киргизскоязычных рынков.
---
Требования:
Обязательные навыки:
Уверенные знания в области ML/DL, понимание работы архитектур нейронных сетей (Transformer, RNN, CNN).
Опыт работы с TTS/STT решениями (Tacotron, Whisper, VITS, или их альтернативы).
Знание Python и основных ML-фреймворков: TensorFlow, PyTorch.
Опыт работы с Docker, Git, Linux-системами.
Знание инструментов работы с аудиоданными (Librosa, PyDub) и NLP-библиотек (Hugging Face, spaCy).
Умение обучать и дообучать модели на пользовательских данных.
Опыт оптимизации моделей (Quantization, Pruning, Distillation).
Будет плюсом:
Опыт работы с крупными языковыми моделями (LLM) и их интеграцией.
Навыки развёртывания ML-решений на сервере (AWS, GCP, Azure).
Опыт создания решений для работы с киргизским или другими редкими языками.
Участие в проектах, связанных с синтезом речи, аудиомоделированием, автоматизацией.
---
Мы предлагаем:
Удалённый формат работы или гибрид (обсуждается индивидуально).
Конкурентную зарплату (зависит от уровня опыта).
Участие в инновационном проекте с потенциалом международного масштабирования.
Профессиональный рост: возможность внедрения собственных идей, участие в R&D.
Работа с современными технологиями и интересными задачами в области ML/AI.
Программа обучения и развития (курсы, конференции).
Отправляйте резюме, портфолио проектов или ссылку на GitHub на email: [email protected].
В сопроводительном письме расскажите о своём опыте в области ML/STT/TTS и почему вам интересен наш проект.
Мы ждём именно вас, чтобы вместе делать будущее умнее и доступнее!