Ilustrasi perbandingan format model LLM - GGUF, AWQ, GPTQ, EXL2

GGUF, AWQ, GPTQ, EXL2 - Pilih yang Mana Buat Model LLM lo?

Lo download model Llama, Mistral, atau Qwen. Di halaman Hugging Face ada puluhan file: .gguf, .awq, .gptq, .exl2, .safetensors. Lo bingung milih yang mana. Gue juga dulu gitu. Masalahnya: salah pilih format = buang resource. Format yang salah bikin GPU lo nganggur, CPU lo overload, atau model lo gak bisa jalan sama sekali. ...

9 Juni 2026 · 7 min · 1321 words · Reynaidi Siburian
Ilustrasi AI yang mulai ngaco di tengah percakapan panjang - token attention bocor ke awal percakapan

Lo Ngobrol Sama AI Lama-Lama Kok Makin Ngaco? Ini Sebabnya - Bukan Lo Aja Yang Ngerasain

🎣 Hook Lo lagi asyik ngobrol sama ChatGPT, Claude, atau DeepSeek. Di awal, jawabannya tajam. Detail. Nyambung terus sama konteks yang lo kasih. Tapi makin panjang percakapan, mulai aneh. Dia lupa lo udah bilang apa 10 pesan lalu. Mulai ngulang informasi yang udah pernah dikasih. Tiba-tiba jawabannya jadi generik, kayak lagi ngobrol sama orang yang baru dateng di tengah diskusi. ...

5 Juni 2026 · 10 min · 2043 words · Reynaidi Siburian