Her Claude CLI cagrisi paraya mal olur — girdi tokenleri, cikti tokenleri ve cache islemlerinin hepsinin bir fiyati vardir. Butce bayragi turlerin arasinda kontrol edilir, uretim ortasinda degil, bu yuzden tek bir pahali tur, herhangi bir limit devreye girmeden once tamamlanir. Cagri basina minimum ek yuku (~Opus icin ~$0.016) ve cache ekonomisini (tekrarlanan istemlerde %90 tasarruf) anlamak, onceden kestirilebilir bir fatura ile surpiz arasindaki farki belirleyen seydir.
Token Fiyatlandirmasi
Token Fiyatlandirmasi
| Token Turu | Opus (1M basina) | Sonnet (1M basina) |
|---|---|---|
| Girdi tokenleri | $15.00 | $3.00 |
| Cikti tokenleri | $75.00 | $15.00 |
| 5 dakikalik cache yazma | $18.75 | $3.75 |
| 1 saatlik cache yazma | $30.00 | $6.00 |
| Cache okuma | $1.50 (%90 indirim!) | $0.30 (%90 indirim!) |
Fiyatlandirma degisir. Guncel fiyatlar icin console.anthropic.com/settings/cost adresini kontrol edin.
En onemli satir cache okuma satirdir. Bir sistem istemi veya konusma on eki onbellege alindiktan sonra, sonraki cagrilar onu girdi fiyatinin onda biri fiyatina geri okur. Gercek tasarruf buradan gelir.
Cagri Basina Minimum Maliyet
Her Opus cagrisi en az $0.016’ya mal olur — “1+1 kac?” bile. Sistem istemi tek basina ~14.253 cache okuma tokenidir. Bu, —max-budget-usd 0.01’in Opus ile her zaman basarisiz olacagi anlamina gelir. En az $0.02, hatta daha iyisi $0.10 belirleyin ki Claude’a gercekten yanit verecek alan birakin.
Her cagri, ne sordugunuzdan bagimsiz olarak sistem istemi icin bir “vergi” oder:
- Opus: cagri basina en az ~$0.016
- Sonnet: cagri basina en az ~$0.005
Sistem istemi yaklasik 14.253 cache okuma tokenidir. “1+1 kac?” gibi onemsiz bir soru bile Opus ile $0.016’ya mal olur cunku bu tokenler Claude yanit vermeden once okunmak zorundadir.
Butce Kesin Bir Ust Sinir Degildir
--max-budget-usd bayragi turler arasinda kontrol edilir, uretim ortasinda degil. Gercekte olan sudur:
- Claude bir yanit uretmeye baslar
- Yanit tamamlanir (tam tur)
- Sonra butce kontrol edilir
- Asilarsa sonraki tur baslamaz
Bu, tek bir turun butceyi asabilecegi anlamina gelir. $1 butce belirleyin ve karmasik bir yeniden yapılandirma isteyin — Claude, butce kontrolu devreye girmeden once $2-3’luk uzun bir yanit uretebilir.
—max-budget-usd kesin bir ust sinir DEGILDIR. Turler arasinda kontrol edilir, uretim ortasinda degil. Uzun bir ilk tur, herhangi bir butce kontrolu calistirmadan once tamamen tamamlanir. Surprizlerden kacinmak icin butceleri beklenen tur basina maliyetinizin en az 2-3 katina ayarlayin. Opus icin minimum pratik butce $0.10’dur — $0.02’nin altindaki herhangi bir deger yalnizca sistem isteminden kaynakli butce hatasini tetikler.
Butce, cagri basina minimum tabandan dusuk ayarlandiginda olan sudur:
subtype alani "success"’ten "error_max_budget_usd"’a degisir, ancak is_error false kalir — bu kontrollü bir durustur, cokme degil. Butce limitlerini tespit etmek icin her zaman is_error yerine subtype kontrol edin.
Between turns
Butce tabanini kendiniz test edin:
claude -p “What is 2+2?” —output-format json —max-budget-usd 0.10 | jq ‘{subtype, cost: .total_cost_usd}’
subtype’in “success” mi yoksa “error_max_budget_usd” mi oldugunu kontrol edin. Simdi —max-budget-usd 0.01 deneyin — sistem istemi tabani ~$0.016 oldugu icin onemsiz bir soru bile onu asar.
Cache Ekonomisi
Onbellekleme gercek tasarrufun yasandigi yerdir. Tipik bir cagrinin nasil gorundugumuze bakalim.
Yeni bir oturuma ilk cagri:
- Onbellekten ~14K token okunur (onceki bir oturumdan onbellege alinmis sistem istemi)
- Onbellege ~1.4K token yazilir (oturuma ozgu yeni icerik)
Sonraki cagrilar (ayni oturum veya ayni sistem istemi):
- Neredeyse her sey 0.1x oraninda cache okumalarina duser
- Yalnizca yeni icerik cache girisleri olusturur
10 turlu Opus oturumu icin tasarruf hesaplamasi:
| Onbelleksiz | Onbellekli | |
|---|---|---|
| Maliyet | 10 x 15K girdi tokeni x $15/M = $2.25 | 1 x 15K cache yazma + 9 x 15K cache okuma = $0.65 |
| Tasarruf | — | %71 |
Onemli cikarin: konusmalari mumkun oldukca ayni oturumda tutun. Devam ettirilen her tur %90 indirimli cache okumalarindan faydalanir.
5 Maliyet Optimizasyon Stratejisi
-
Basit gorevler icin Sonnet kullanin —
claude -p "Format this JSON" --model claude-sonnet-4-6calistirin. Sonnet token basina ~%40 daha ucuzdur ($3/$15’e karsi $5/$25 MTok basina). Opus’u karmasik akil yurutme icin saklayin. -
Saf metin gorevleri icin araclari devre disi birakin —
claude -p "Summarize this text" --tools ""calistirin. Sistem isteminde arac aciklamasi olmamasi daha az girdi tokeni anlamina gelir. -
Basit sorular icin
--effort lowkullanin —claude -p "What is 2+2?" --effort lowcalistirin. Dusuk eftor daha kisa dusunme ve daha az cikti tokeni demektir. -
Gercekci butce limitleri belirleyin — Opus tek tur icin minimum $0.10, cok turlu oturumlar icin $5.00. Opus icin $0.02’nin altindaki herhangi bir deger her zaman butce hatasi tetikler.
-
Cache isabetlerini en ust duzeye cikarmak icin benzer istemleri gruplandirin — Ayni sistem istemine sahip istemleri arka arkaya calistirin. Sonraki cagrilar %90 indirimli cache okumalarindan faydalanir.
Sektör Karsilastirmalari
Takimlar arasindaki tipik kullanim kaliplari:
Maliyet Karsilastirmalari
| Metrik | Deger |
|---|---|
| Gelistirici basina gunluk ortalama | $6 |
| 90. yuzdelik gunluk | $12 |
| Aylik tahmin | $100-200/gelistirici |
| 100 turlu Opus (onbelleksiz) | $50-100 |
| 100 turlu Opus (onbellekli) | $10-19 |
Onbellekli ve onbelleksiz oturumlar arasindaki fark carpicidir — 5 kata kadar daha ucuz. Bu yuzden oturum yonetimi ve cache farkindaliği Claude’u olcekli olarak kullanan takimlar icin bu kadar onemlidir.
Cagri basina maliyetleri jq ile takip edin: claude -p ”…” —output-format json | jq ‘{cost: .total_cost_usd, tokens: .usage.output_tokens}’
Her oturum siz bir sey yazmadan once 30.000-40.000 token yukler — sistem istemi (~14K), arac tanimlari, CLAUDE.md dosyalari ve MCP sunucu semalari. Opus fiyatlandirmasiyla bu, baslamak icin oturum basina $0.02-0.06’dir. Pro plan kullanicilari icin bu gorunmez baslangic maliyeti oturum basina gunluk kotanizin %1-3’unu tuketir. Bu ek yuku azaltmak icin kullanilmayan MCP sunucularini devre disi birakin ve saf metin gorevleri icin —tools "" kullanin.
Bir uretim sisteminin inceleme basina maliyet metriklerini (cost_usd, input_tokens, cache_read_tokens) nasil kaydettigini ve SQL analitik panolari olusturdugunu MR Inceleyici Olusturun, Bolum 6: Hatalari Yonetme ve Maliyetleri Izleme bolumunde gorun.
claude -p “Hello” —output-format json —max-budget-usd 0.10 | jq ‘{cost: .total_cost_usd, cached: .usage.cache_read_input_tokens}’ komutunu calistirin. Artik cagri basina temel maliyetinizi biliyorsunuz. Iki kez calistirin — ikinci cagride cache_read_input_tokens’in nasil arttigini izleyin.