CanIRunAI — Descubra quais modelos de IA rodam no seu PC
Criador do Blog e Desenvolvedor FullStack
3 min de leitura
Já tentou rodar um modelo de IA local e seu PC travou? Ou pior, ficou esperando 2 minutos por uma resposta de 3 linhas?
Criei o CanIRunAI pra resolver exatamente isso. Você informa seu hardware (GPU, RAM e CPU) e o site te diz quais modelos rodam bem, quais rodam devagar e quais nem adianta tentar.
Acesse: canirunai.kc1t.com
O que são os "B" nos modelos?
Quando você vê um modelo como qwen2.5-coder:14b, esse 14B significa 14 bilhões de parâmetros. Parâmetros são os "pesos" da rede neural — quanto mais, mais inteligente o modelo tende a ser, mas mais recurso ele consome.
Pensa como qualidade gráfica em jogos: quanto maior o B, mais bonito fica, mas mais pesado roda.
| Tamanho | Parâmetros | RAM mínima | Pra quê serve |
|---|---|---|---|
| 1-2B | 1-2 bilhões | ~2GB | Tarefas simples, autocomplete |
| 3-4B | 3-4 bilhões | ~4GB | Scripts básicos, chatbot leve |
| 7-8B | 7-8 bilhões | ~8GB | Código funcional, conversas úteis |
| 14B | 14 bilhões | ~16GB | Código complexo, análises |
| 32B | 32 bilhões | ~32GB | Projetos sérios, quase nível GPT |
| 70B+ | 70+ bilhões | ~64GB+ | Top tier, precisa de servidor |
Na prática, o que isso muda?
O salto de qualidade não é linear. Os maiores ganhos estão nos primeiros tiers:
- 1B → 7B = salto enorme, o modelo "aprende a pensar"
- 7B → 14B = salto grande, respostas mais precisas
- 14B → 32B = salto médio, menos erros
- 32B → 70B = refinamento, diferença sutil
- 70B → 405B = marginal, só datacenter sente
O 7B é o ponto mágico onde o modelo deixa de ser burrinho e vira realmente útil. Por isso é o tamanho mais popular do mundo open-source.
Exemplos reais de hardware
| Seu PC | Melhor modelo pra código | Experiência |
|---|---|---|
| GTX 1650 + 16GB RAM | Qwen 2.5 Coder 3B (GPU) | ⚡ Rápido, ~25 tok/s |
| RTX 3060 12GB + 32GB RAM | Qwen 2.5 Coder 8B (GPU) | ⚡ Rápido, ~35 tok/s |
| Sem GPU + 8GB RAM | Qwen 2.5 Coder 1.5B (CPU) | 🟡 Usável, ~10 tok/s |
| RTX 4090 24GB + 64GB RAM | Qwen 2.5 Coder 14B (GPU) | ⚡ Voando, ~50 tok/s |
| MacBook M4 Max 48GB | Qwen 2.5 Coder 32B | ⚡ Muito rápido |
Como usar
- Acesse canirunai.kc1t.com
- Selecione sua GPU, RAM e CPU
- Veja o relatório com os modelos compatíveis
Sem cadastro, sem enrolação.
Se tiver sugestão ou quiser contribuir, o projeto é open-source. Feedbacks são sempre bem-vindos.
