<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Ollama on kropachev.digital</title><link>https://kropachev.digital/tags/ollama/</link><description>Recent content in Ollama on kropachev.digital</description><generator>Hugo -- gohugo.io</generator><language>ru</language><lastBuildDate>Mon, 01 Jun 2026 05:32:33 +0000</lastBuildDate><atom:link href="https://kropachev.digital/tags/ollama/index.xml" rel="self" type="application/rss+xml"/><item><title>🤖 Домашняя LLM - пополнение вики в Proxmox-заметках</title><link>https://kropachev.digital/posts/2026/06/01-domashnyaya-llm/</link><pubDate>Mon, 01 Jun 2026 05:32:33 +0000</pubDate><guid>https://kropachev.digital/posts/2026/06/01-domashnyaya-llm/</guid><description>&lt;img src="https://kropachev.digital/" alt="Featured image of post 🤖 Домашняя LLM - пополнение вики в Proxmox-заметках" /&gt;&lt;h1 id="-домашняя-llm---пополнение-вики-в-proxmox-заметках"&gt;🤖 Домашняя LLM - пополнение вики в Proxmox-заметках
&lt;/h1&gt;&lt;p&gt;Тема прикладная и техническая, поэтому управленческий контекст в этот раз за скобками. Пост адресован начинающим инженерам и энтузиастам с домашними серверами, которым интересно поднять собственную LLM на знакомом железе и попробовать ее в работе, а не только читать о подобных сборках в чужих блогах.&lt;br&gt;
В вики proxmox-notes добавлены две новые статьи, которые вместе складываются в маршрут от голого сервера до рабочего веб-чата с моделью на собственной видеокарте.&lt;/p&gt;
&lt;h2 id="-что-внутри"&gt;🗂️ Что внутри
&lt;/h2&gt;&lt;p&gt;Во-первых - про PCIe passthrough: что включать в BIOS, как разнести устройства по группам IOMMU, как привязать видеокарту к vfio-pci и зачем хосту встроенная графика после проброса дискретной карты.&lt;br&gt;
Во-вторых - про саму виртуальную машину: параметры VM под passthrough (q35, выделенные ядра, фиксированная память без баллунинга), установка Ubuntu Server 26.04 с драйверами NVIDIA и CUDA, развертывание Ollama и Open WebUI в Docker, Caddy с автоматическим TLS перед веб-интерфейсом.&lt;br&gt;
На прохождение всех шагов при наличии нужного железа уходит примерно вечер. На выходе - локальный веб-чат с моделью, доступный с любого устройства домашней сети и не отправляющий запросы во внешние сервисы.&lt;/p&gt;
&lt;h2 id="-тестирование"&gt;🧪 Тестирование
&lt;/h2&gt;&lt;p&gt;Для теста я попросил qwen3 и gemma4 написать скрипты замеров - и стал свидетелем того, насколько по-разному модели подходят к одной и той же задаче.&lt;br&gt;
🥇 gemma4 пошла инженерным путем: обращение к Ollama API с stream: false, разбор полей eval_count и total_duration для корректного учета времени генерации, аккуратная структура замера - правда, с арифметической ошибкой в одной из формул, которую пришлось чинить руками.&lt;br&gt;
🤷‍♂️ qwen3-coder выбрала короткий путь - subprocess с замером time.time() вокруг внешнего вызова: решение рабочее, но систематически занижающее результат на накладные расходы запуска процесса.&lt;br&gt;
Все как у людей.&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;Набор тестов простой: логическая задача на определение дня недели, арифметический расчет, написание хокку и проверка стабильности на повторных запусках. Через него прогонялись шесть моделей от 8B до 30B параметров.&lt;/p&gt;
&lt;h2 id="-результаты-тестов"&gt;⏱️ Результаты тестов
&lt;/h2&gt;&lt;p&gt;На 16 ГБ VRAM комфортно живут модели уровня 24-30B в квантовании Q4. MoE-архитектуры по скорости опережают плотные модели сопоставимого размера. Модели с внутренним рассуждением расходуют на него заметную долю токенов, и практическая скорость генерации у них ниже номинальной. По качеству: llama3.1:8b спотыкается даже на простых задачах, qwen3.5 на хокку ушла в бесконечный цикл, наиболее сбалансированной оказалась gpt-oss; для работы с кодом удобнее gemma4, для длинных текстов - mistral-small3.2. Полные цифры - в самой вики.&lt;/p&gt;
&lt;h2 id="-ссылки"&gt;🔗 Ссылки
&lt;/h2&gt;&lt;p&gt;Проброс видеокарты:&lt;br&gt;
&lt;a class="link" href="https://github.com/kropachev/proxmox-notes/wiki/proxmox-pcie-passthrough" target="_blank" rel="noopener"
 &gt;https://github.com/kropachev/proxmox-notes/wiki/proxmox-pcie-passthrough&lt;/a&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;Создание виртуальной машины под LLM:&lt;br&gt;
&lt;a class="link" href="https://github.com/kropachev/proxmox-notes/wiki/proxmox-creating-llm-vm" target="_blank" rel="noopener"
 &gt;https://github.com/kropachev/proxmox-notes/wiki/proxmox-creating-llm-vm&lt;/a&gt;&lt;/p&gt;</description></item></channel></rss>