Войти

LLM инженер

Компания Genesis Studio
Тип Офис / Бишкек
Оклад От 70000 KGS в месяц
Описание вакансии


🤖 Вакансия: Middle+ LLM Engineer (Языковые модели, AI)

Формат: Удаленно или гибрид (по договоренности)

Занятость: Полная

Компания: Genesis Studio — продуктовое направление компании Genesis

📌 О проекте:

Работа над созданием AI-решений на базе LLM (Large Language Models) для внутренних и внешних корпоративных задач: автоматизация документооборота, построение чат-ботов, ассистентов, интеграция с CRM/ERP (включая Bitrix24 и Notion), генерация деловых документов, интеллектуальный поиск и др.

Мы создаем масштабируемые LLM-системы с прицелом на кастомизацию под бизнес, включая RAG, собственные векторные базы, приватные deployment-решения и доменно-ориентированную оптимизацию моделей.

🔧 Технологический стек:
  • Языки: Python (основа), Bash
  • LLM: OpenAI (GPT-4/4o), Claude, Mistral, Mixtral, LLaMA, Gemini
  • Фреймворки: LangChain, LlamaIndex, FastAPI, Haystack
  • DevOps: Docker, Kubernetes (желательно), CI/CD
  • Векторные БД: Weaviate, Pinecone, Qdrant, FAISS
  • RAG: Retrieval-Augmented Generation (в т.ч. для PDF, DOCX, API и CRM)
  • MLOps/Serving: OpenAI API, Replicate, Together.ai, Ollama, vLLM
  • Интеграции: Bitrix24, Notion, Slack, Telegram, Google Docs, и пр.
✅ Требования:
  • Опыт от 2–3 лет в NLP/LLM проектах, желательно с продуктовой нагрузкой
  • Глубокое понимание архитектур LLM и тонкой настройки (fine-tuning, LoRA, RAG)
  • Умение строить production-ready пайплайны: от данных до ответа модели
  • Опыт работы с векторными БД, построением индексов и оптимизацией RAG
  • Знание Prompt Engineering: Zero-shot, Few-shot, Chain-of-Thought, ReAct
  • Умение масштабировать и оптимизировать работу модели (через caching, batching и пр.)
  • Опыт интеграции LLM в реальные бизнес-сценарии
➕ Будет плюсом:
  • Опыт работы с open-source LLM (Mistral, LLaMA, Falcon) и их деплойментом локально
  • Опыт тонкой настройки моделей с использованием LoRA или QLoRA
  • Опыт построения RAG-ассистентов в корпоративных системах (ERP, CRM, HRM)
  • Навыки оптимизации inference latency
💼 Мы предлагаем:
  • Участие в R&D и продакшн-проектах на стыке NLP, генеративного ИИ и бизнес-автоматизации
  • Гибкий график и удаленный формат
  • Работу с CTO и core-командой Genesis Studio
  • Доступ к платным API, облакам, GPU-инфраструктуре
  • Влияние на технические решения и архитектуру
  • Прозрачную мотивацию и рост по результатам

Телефон +996 502 375 939