Skip to content

Maliyetler

Token fiyatlandirmasi, cache ekonomisi ve butce kontrollerini anlayin

7 dk okuma
Token flow: input tokens fork into cache hit or miss paths, merge into processing, then output tokensInput TokensCache Hit90% off$3 → $0.30/MTokCache MissFull Price $3/MTokProcessingOutput Tokens

Her Claude CLI cagrisi paraya mal olur — girdi tokenleri, cikti tokenleri ve cache islemlerinin hepsinin bir fiyati vardir. Butce bayragi turlerin arasinda kontrol edilir, uretim ortasinda degil, bu yuzden tek bir pahali tur, herhangi bir limit devreye girmeden once tamamlanir. Cagri basina minimum ek yuku (~Opus icin ~$0.016) ve cache ekonomisini (tekrarlanan istemlerde %90 tasarruf) anlamak, onceden kestirilebilir bir fatura ile surpiz arasindaki farki belirleyen seydir.

Token Fiyatlandirmasi

Token Fiyatlandirmasi

Token TuruOpus (1M basina)Sonnet (1M basina)
Girdi tokenleri$15.00$3.00
Cikti tokenleri$75.00$15.00
5 dakikalik cache yazma$18.75$3.75
1 saatlik cache yazma$30.00$6.00
Cache okuma$1.50 (%90 indirim!)$0.30 (%90 indirim!)
Tip

Fiyatlandirma degisir. Guncel fiyatlar icin console.anthropic.com/settings/cost adresini kontrol edin.

En onemli satir cache okuma satirdir. Bir sistem istemi veya konusma on eki onbellege alindiktan sonra, sonraki cagrilar onu girdi fiyatinin onda biri fiyatina geri okur. Gercek tasarruf buradan gelir.

Cagri Basina Minimum Maliyet

Cagri Basina Minimum Maliyet

Her Opus cagrisi en az $0.016’ya mal olur — “1+1 kac?” bile. Sistem istemi tek basina ~14.253 cache okuma tokenidir. Bu, —max-budget-usd 0.01’in Opus ile her zaman basarisiz olacagi anlamina gelir. En az $0.02, hatta daha iyisi $0.10 belirleyin ki Claude’a gercekten yanit verecek alan birakin.

Her cagri, ne sordugunuzdan bagimsiz olarak sistem istemi icin bir “vergi” oder:

  • Opus: cagri basina en az ~$0.016
  • Sonnet: cagri basina en az ~$0.005

Sistem istemi yaklasik 14.253 cache okuma tokenidir. “1+1 kac?” gibi onemsiz bir soru bile Opus ile $0.016’ya mal olur cunku bu tokenler Claude yanit vermeden once okunmak zorundadir.

Butce Kesin Bir Ust Sinir Degildir

--max-budget-usd bayragi turler arasinda kontrol edilir, uretim ortasinda degil. Gercekte olan sudur:

  1. Claude bir yanit uretmeye baslar
  2. Yanit tamamlanir (tam tur)
  3. Sonra butce kontrol edilir
  4. Asilarsa sonraki tur baslamaz

Bu, tek bir turun butceyi asabilecegi anlamina gelir. $1 butce belirleyin ve karmasik bir yeniden yapılandirma isteyin — Claude, butce kontrolu devreye girmeden once $2-3’luk uzun bir yanit uretebilir.

Gotcha

—max-budget-usd kesin bir ust sinir DEGILDIR. Turler arasinda kontrol edilir, uretim ortasinda degil. Uzun bir ilk tur, herhangi bir butce kontrolu calistirmadan once tamamen tamamlanir. Surprizlerden kacinmak icin butceleri beklenen tur basina maliyetinizin en az 2-3 katina ayarlayin. Opus icin minimum pratik butce $0.10’dur — $0.02’nin altindaki herhangi bir deger yalnizca sistem isteminden kaynakli butce hatasini tetikler.

Butce, cagri basina minimum tabandan dusuk ayarlandiginda olan sudur:

Butce Asildi -- butce minimum tabanin altindaartifacts/17/budget_overshoot.json
1{
2 "type": "result",
3 "subtype": "error_max_budget_usd",A
4 "duration_ms": 125999,
5 "is_error": false,
6 "num_turns": 1,
7 "session_id": "7a950bc0-0afb-4754-b66c-d65a5288dbd3",B
8 "total_cost_usd": 0.1521415,
9 "modelUsage": {
10 "claude-opus-4-6": {
11 "inputTokens": 3,C
12 "outputTokens": 5446,
13 "cacheReadInputTokens": 14253,
14 "cacheCreationInputTokens": 1416,
15 "costUSD": 0.1521415
16 }
17 }
18}
A'success' degil -- butce asildi
BGercek maliyet: $0.15 -- sistem istemi tabani tek basina mikro butceyi asiyor
CButce kontrolu devreye girmeden once 5.446 cikti tokeni uretildi

subtype alani "success"’ten "error_max_budget_usd"’a degisir, ancak is_error false kalir — bu kontrollü bir durustur, cokme degil. Butce limitlerini tespit etmek icin her zaman is_error yerine subtype kontrol edin.

Budget OvershootBUDGET VISUALIZATION
Budget checked HERE ↑
Between turns
$0.000
Budget
$0.050
Actual
$0.152
Ratio
3.04x
Tokens
5,446
Try This

Butce tabanini kendiniz test edin:

claude -p “What is 2+2?” —output-format json —max-budget-usd 0.10 | jq ‘{subtype, cost: .total_cost_usd}’

subtype’in “success” mi yoksa “error_max_budget_usd” mi oldugunu kontrol edin. Simdi —max-budget-usd 0.01 deneyin — sistem istemi tabani ~$0.016 oldugu icin onemsiz bir soru bile onu asar.

Cache Ekonomisi

Onbellekleme gercek tasarrufun yasandigi yerdir. Tipik bir cagrinin nasil gorundugumuze bakalim.

Yeni bir oturuma ilk cagri:

  • Onbellekten ~14K token okunur (onceki bir oturumdan onbellege alinmis sistem istemi)
  • Onbellege ~1.4K token yazilir (oturuma ozgu yeni icerik)

Sonraki cagrilar (ayni oturum veya ayni sistem istemi):

  • Neredeyse her sey 0.1x oraninda cache okumalarina duser
  • Yalnizca yeni icerik cache girisleri olusturur

10 turlu Opus oturumu icin tasarruf hesaplamasi:

OnbelleksizOnbellekli
Maliyet10 x 15K girdi tokeni x $15/M = $2.251 x 15K cache yazma + 9 x 15K cache okuma = $0.65
Tasarruf%71

Onemli cikarin: konusmalari mumkun oldukca ayni oturumda tutun. Devam ettirilen her tur %90 indirimli cache okumalarindan faydalanir.

Token Maliyet HesaplayicisiINTERACTIVE CALCULATOR
10K
1K
5
50%
Hit 50%Miss 50%
ESTIMATED COSTS
Opus 4.6
Per call
$0.0525
Per session (5 turns)
$0.26
Daily (10 sessions)
$2.63

5 Maliyet Optimizasyon Stratejisi

  1. Basit gorevler icin Sonnet kullaninclaude -p "Format this JSON" --model claude-sonnet-4-6 calistirin. Sonnet token basina ~%40 daha ucuzdur ($3/$15’e karsi $5/$25 MTok basina). Opus’u karmasik akil yurutme icin saklayin.

  2. Saf metin gorevleri icin araclari devre disi birakinclaude -p "Summarize this text" --tools "" calistirin. Sistem isteminde arac aciklamasi olmamasi daha az girdi tokeni anlamina gelir.

  3. Basit sorular icin --effort low kullaninclaude -p "What is 2+2?" --effort low calistirin. Dusuk eftor daha kisa dusunme ve daha az cikti tokeni demektir.

  4. Gercekci butce limitleri belirleyin — Opus tek tur icin minimum $0.10, cok turlu oturumlar icin $5.00. Opus icin $0.02’nin altindaki herhangi bir deger her zaman butce hatasi tetikler.

  5. Cache isabetlerini en ust duzeye cikarmak icin benzer istemleri gruplandirin — Ayni sistem istemine sahip istemleri arka arkaya calistirin. Sonraki cagrilar %90 indirimli cache okumalarindan faydalanir.

Sektör Karsilastirmalari

Takimlar arasindaki tipik kullanim kaliplari:

Maliyet Karsilastirmalari

MetrikDeger
Gelistirici basina gunluk ortalama$6
90. yuzdelik gunluk$12
Aylik tahmin$100-200/gelistirici
100 turlu Opus (onbelleksiz)$50-100
100 turlu Opus (onbellekli)$10-19

Onbellekli ve onbelleksiz oturumlar arasindaki fark carpicidir — 5 kata kadar daha ucuz. Bu yuzden oturum yonetimi ve cache farkindaliği Claude’u olcekli olarak kullanan takimlar icin bu kadar onemlidir.

Tip

Cagri basina maliyetleri jq ile takip edin: claude -p ”…” —output-format json | jq ‘{cost: .total_cost_usd, tokens: .usage.output_tokens}’

Ilk Isteminizden Once 30-40K Token Tuketilir

Her oturum siz bir sey yazmadan once 30.000-40.000 token yukler — sistem istemi (~14K), arac tanimlari, CLAUDE.md dosyalari ve MCP sunucu semalari. Opus fiyatlandirmasiyla bu, baslamak icin oturum basina $0.02-0.06’dir. Pro plan kullanicilari icin bu gorunmez baslangic maliyeti oturum basina gunluk kotanizin %1-3’unu tuketir. Bu ek yuku azaltmak icin kullanilmayan MCP sunucularini devre disi birakin ve saf metin gorevleri icin —tools "" kullanin.

Bunu Uygulamada Gorun

Bir uretim sisteminin inceleme basina maliyet metriklerini (cost_usd, input_tokens, cache_read_tokens) nasil kaydettigini ve SQL analitik panolari olusturdugunu MR Inceleyici Olusturun, Bolum 6: Hatalari Yonetme ve Maliyetleri Izleme bolumunde gorun.

Now Do This

claude -p “Hello” —output-format json —max-budget-usd 0.10 | jq ‘{cost: .total_cost_usd, cached: .usage.cache_read_input_tokens}’ komutunu calistirin. Artik cagri basina temel maliyetinizi biliyorsunuz. Iki kez calistirin — ikinci cagride cache_read_input_tokens’in nasil arttigini izleyin.