thedeemon: (Default)
[personal profile] thedeemon
Столкнувшись недавно с лимитом запросов к AI в Warp'e, заинтересовался наконец что можно локально у себя запустить, на машине без мощного GPU. И оказалось вовремя, китайцы тут удружили недавно. Теперь есть модели, которые довольно шустро работают на CPU, безо всяких видеокарт. Рецепт такой:
1) ставим программу ollama.
2) в одном табе терминала пишем "ollama serve".
3) в другом табе пишем "ollama run deepseek-coder-v2:16b".

При первом запуске она скачает несколько гигов модели, потом будет запускаться за считанные секунды. Ест до 9 гигов RAM, когда думает. После запуска пишем там вместо промпта сперва "/set parameter num_thread 10" (по умолчанию она использует половину логических ядер, у меня их всего 12, потому 10 отдать ей на размышления - получается неплохо). И потом можно задавать всякие вопросы по программированию и администрированию. Результат не идеальный, конечно, но весьма впечатляет для штуки, работающей локально, без интернета и чужих кластеров.

Date: 2024-08-02 04:51 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Отлично. А смысл? Чего от этого зверка можно добиться?

Date: 2024-08-02 05:01 pm (UTC)
dennisgorelik: 2020-06-13 in my home office (Default)
From: [personal profile] dennisgorelik
> весьма впечатляет для штуки, работающей локально, без интернета и чужих кластеров

Зачем нужен именно локальный AI?

Date: 2024-08-02 05:47 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

О, отлично. Но ведь можно у чатгпт спросить?

Date: 2024-08-02 06:55 pm (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Да, конечно. Мне копайлот нравится. Чуть задумаешься, он уже подсказывает.

Date: 2024-08-03 11:14 am (UTC)
dennisgorelik: 2020-06-13 in my home office (Default)
From: [personal profile] dennisgorelik
> Чтоб не упираться в ограничения по числу запросов к нелокальным, например.

Разве эти ограничения по числу запросов более критичны, чем качество и общая производительность вычислений?

Profile

thedeemon: (Default)
Dmitry Popov

December 2025

S M T W T F S
 12 3456
789101112 13
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 31st, 2026 01:03 pm
Powered by Dreamwidth Studios