LoRA Fine-Tuning Russian Qwen Demo
Дообучил русскоязычную конфигурацию Qwen2.5-1.5B-Instruct через LoRA и собрал локальный inference-пайплайн на Hugging Face, Transformers и PEFT.
LoRA Fine-Tuning Russian Qwen Demo
Проблема: для локальных русскоязычных AI-сценариев часто не хватает компактной модели, которую можно быстро адаптировать под задачу и запускать без зависимости от внешнего API. Решение: я собрал пайплайн fine-tuning через LoRA для Qwen2.5-1.5B-Instruct, настроил GPU training, подготовил запуск через Hugging Face Transformers и PEFT, а затем собрал локальный inference-процесс для русскоязычной модели. Результат: получился воспроизводимый проект, который показывает полный путь от дообучения Qwen через LoRA до локального запуска модели и даёт понятную базу для дальнейших прикладных AI-сценариев.