Claude Sonnet 5: Model Agentic Pertama yang Bisa Coding dan Tool Use Setara Opus

Claude Sonnet 5 baru saja dirilis Anthropic dengan klaim ambisius: ini adalah model Sonnet paling agentic yang pernah ada. Bisa membuat rencana, menggunakan tools seperti browser dan terminal, serta berjalan secara otonom di level yang beberapa bulan lalu hanya bisa dilakukan model besar dan mahal.

Yang menarik, Sonnet 5 ini performanya mendekati Opus 4.8 — model flagship Anthropic — tapi dengan harga lebih murah. Untuk developer yang selama ini pakai Sonnet 3.5, 3.6, atau 3.7 untuk coding dan tool use, ini upgrade signifikan.

Apa yang Baru di Sonnet 5?

Dari announcement Anthropic, ada beberapa peningkatan kunci dibanding pendahulunya (Sonnet 4.6):

1. Agentic Performance yang Jauh Lebih Baik

Sonnet 5 menunjukkan improvement substansial di empat area utama:

  • Reasoning — kemampuan breakdown masalah kompleks jadi langkah-langkah eksekusi
  • Tool Use — integrasi dengan browser, terminal, dan API eksternal
  • Coding — sustained coding untuk multi-step software engineering work
  • Knowledge Work — handling messy technical contexts tanpa kehilangan track

Yang bikin ini berbeda: Sonnet 5 bisa handle sustained coding dan debugging di konteks teknis yang berantakan. Model sebelumnya cenderung kehilangan track kalau task-nya multi-step dan butuh banyak tool switching.

2. Cost-Performance Sweet Spot

Dari benchmark yang Anthropic publish, Sonnet 5 (orange line) adalah strict improvement over Sonnet 4.6 (gray line). Dia cover range cost-performance yang jauh lebih luas dibanding Opus 4.8 (yellow line).

Di medium effort level, Sonnet 5 kasih cost efficiency yang substantially improved. Di higher effort, performanya bisa match Opus 4.8 untuk beberapa task. Antara Sonnet 5 dan Opus 4.8, user bisa adjust effort level untuk find balance antara cost dan performance.

3. Safety yang Lebih Baik

Safety assessments Anthropic menemukan Sonnet 5 punya overall lower rate of undesirable behaviors dibanding Sonnet 4.6. Model ini juga generally safer untuk digunakan di agentic contexts.

Evaluasi menunjukkan Sonnet 5 punya much lower ability untuk perform cybersecurity tasks dibanding Opus models sekarang. Ini actually good news dari safety perspective — modelnya powerful tapi tidak terlalu dangerous di tangan yang salah.

Ketersediaan dan Pricing

Sonnet 5 sudah available across all plans:

  • Free dan Pro plans — jadi default model
  • Max, Team, dan Enterprise — available sebagai option
  • Claude Code — integrated langsung
  • Claude Platform — via API dengan model ID claude-sonnet-5

Pricing (introductory sampai 31 Agustus 2026):

  • Input: $2 per million tokens
  • Output: $10 per million tokens

Setelah 31 Agustus 2026:

  • Input: $3 per million tokens
  • Output: $15 per million tokens

Masih jauh lebih murah dibanding Opus tier, tapi dengan performance yang mendekati.

Apa Artinya Buat Developer?

Kalau lu selama ini:

  • Pakai Sonnet 3.x/4.x untuk coding tapi sering kehilangan context di task panjang
  • Butuh model yang bisa handle multi-step debugging tanpa constant hand-holding
  • Mau agentic capabilities tapi Opus terlalu mahal untuk production use

Sonnet 5 mungkin jadi sweet spot yang lu cari. Model ini kasih agentic execution layer yang strong untuk software engineering work — sustained coding, tool use, debugging — di harga yang masih masuk akal untuk production deployment.

Yang perlu dicatat: Sonnet 5 bukan replacement untuk Opus di semua use case. Untuk task yang butuh deepest reasoning atau most sophisticated analysis, Opus masih raja. Tapi untuk 80% use case agentic coding dan tool use sehari-hari, Sonnet 5 sepertinya sudah lebih dari cukup.

Tinggal tunggu benchmark independen untuk confirm apakah claim Anthropic ini hold up di real-world scenarios. Tapi dari early signals, Sonnet 5 looks promising.

For more context, check out Opus 4.8 Plans, Gemini 3.5 Executes AI Wrote 80% in 10 Minutes.

Ada yang sudah coba? Share pengalaman lu di comments.


Discover more from Susiloharjo

Subscribe to get the latest posts sent to your email.

Leave a Comment

Discover more from Susiloharjo

Subscribe now to keep reading and get access to the full archive.

Continue reading