Найбільший україномовний каталог інструментів ШІ.
Дослідити каталогСлава Україні! Героям Слава!
Найбільший україномовний каталог інструментів ШІ.
Дослідити каталогСлава Україні! Героям Слава!

Оптимізатор для українських розробників, що працюють з локальними мовними моделями та хочуть підвищити їхню продуктивність. Він ефективно керує пам'яттю та швидкістю відгуку на наявному обладнанні. Проєкт з відкритим кодом.
Autotune is an open-source runtime optimizer for local LLMs that reduces KV cache memory, improves first-token latency, and dynamically adapts inference settings to your hardware and workload. It works with Ollama, MLX, and as an API. Results from benchmarks show that Autotune can lower time-to-first-token by 39%, wall time for agentic workflows by 46%, and KV cache memory usage by 67%. Features include an OpenAI-compatible local API, a built-in CLI, RAM management, and model recommendations.