Формат: Удаленно или гибрид (по договоренности)
Занятость: Полная
Компания: Genesis Studio — продуктовое направление компании Genesis
📌 О проекте:Работа над созданием AI-решений на базе LLM (Large Language Models) для внутренних и внешних корпоративных задач: автоматизация документооборота, построение чат-ботов, ассистентов, интеграция с CRM/ERP (включая Bitrix24 и Notion), генерация деловых документов, интеллектуальный поиск и др.
Мы создаем масштабируемые LLM-системы с прицелом на кастомизацию под бизнес, включая RAG, собственные векторные базы, приватные deployment-решения и доменно-ориентированную оптимизацию моделей.
🔧 Технологический стек:- Языки: Python (основа), Bash
- LLM: OpenAI (GPT-4/4o), Claude, Mistral, Mixtral, LLaMA, Gemini
- Фреймворки: LangChain, LlamaIndex, FastAPI, Haystack
- DevOps: Docker, Kubernetes (желательно), CI/CD
- Векторные БД: Weaviate, Pinecone, Qdrant, FAISS
- RAG: Retrieval-Augmented Generation (в т.ч. для PDF, DOCX, API и CRM)
- MLOps/Serving: OpenAI API, Replicate, Together.ai, Ollama, vLLM
- Интеграции: Bitrix24, Notion, Slack, Telegram, Google Docs, и пр.
- Опыт от 2–3 лет в NLP/LLM проектах, желательно с продуктовой нагрузкой
- Глубокое понимание архитектур LLM и тонкой настройки (fine-tuning, LoRA, RAG)
- Умение строить production-ready пайплайны: от данных до ответа модели
- Опыт работы с векторными БД, построением индексов и оптимизацией RAG
- Знание Prompt Engineering: Zero-shot, Few-shot, Chain-of-Thought, ReAct
- Умение масштабировать и оптимизировать работу модели (через caching, batching и пр.)
- Опыт интеграции LLM в реальные бизнес-сценарии
- Опыт работы с open-source LLM (Mistral, LLaMA, Falcon) и их деплойментом локально
- Опыт тонкой настройки моделей с использованием LoRA или QLoRA
- Опыт построения RAG-ассистентов в корпоративных системах (ERP, CRM, HRM)
- Навыки оптимизации inference latency
- Участие в R&D и продакшн-проектах на стыке NLP, генеративного ИИ и бизнес-автоматизации
- Гибкий график и удаленный формат
- Работу с CTO и core-командой Genesis Studio
- Доступ к платным API, облакам, GPU-инфраструктуре
- Влияние на технические решения и архитектуру
- Прозрачную мотивацию и рост по результатам