18 Ocak 2026. Illinois Üniversitesi’nden bir ekip, “Agentic Reasoning for Large Language Models” başlıklı kapsamlı bir survey yayınlıyor. 135 sayfa, 300+ referans, yapay zeka ajanlarının geleceğini çizen bir yol haritası.
Ben de o sabah kahvemi yudumlarken makaleyi okuyorum ve bir şey fark ediyorum: Bu konseptlerin çoğunu biz zaten Kasım 2025’te production’a almıştık.
“Biz kahvemizi içmeye fırsat bulamadan, dünyanın öbür ucunda biri aynı şeyi keynote’ta sunuyor. Türk kahvesi soğuyor ama projeler sıcak!”
Bu yazı, akademik bir survey’in Türkiye’den bir AR-GE ekibinin çalışmalarıyla nasıl örtüştüğünün hikayesi. Övünmek için değil, doğru yolda olduğumuzu teyit etmek için.
Agentic Reasoning Nedir? Paper’ın Söyledikleri
arXiv:2601.12538 numaralı makale, Tianxin Wei ve ekibi tarafından hazırlandı. Temel argüman şu:
Geleneksel LLM’ler pasif metin üreticileri. Soru sor, cevap al. Ama gerçek dünya problemleri bundan fazlasını gerektiriyor: planlama, araç kullanma, hatalardan öğrenme, strateji geliştirme.
İşte “Agentic Reasoning” (Ajan Tipi Akıl Yürütme) tam da bu boşluğu dolduruyor. Paper üç ana katman tanımlıyor:
| Katman | Açıklama | Temel Yetenekler |
|---|---|---|
| Foundational Agentic Reasoning | Temel ajan yetenekleri | Planlama, araç kullanma, arama stratejileri |
| Self-evolving Agentic Reasoning | Kendi kendine gelişen sistemler | Geri bildirim döngüleri, hafıza, adaptasyon |
| Collective Multi-agent Reasoning | Çoklu ajan koordinasyonu | Rol dağılımı, bilgi paylaşımı, ortak hedefler |
Paper ayrıca iki kritik kavramı ayırıyor:
- In-context Reasoning: Çıkarım anında yapılandırılmış iş akışlarıyla akıl yürütme
- Post-training Reasoning: Takviyeli öğrenme (RL) ile modelin ağırlıklarına mantık silsilesi yerleştirme
JARVIS: Akademiden Önce Production’da
Şimdi objektif bir karşılaştırma yapalım. JARVIS sistemini Kasım 2025’te production’a aldığımızda, paper’da tanımlanan konseptlerin büyük çoğunluğu zaten çalışıyordu.
| Paper Konsepti | JARVIS Implementasyonu | Durum |
|---|---|---|
| Agentic Memory (Yapılandırılmış Hafıza) | memory, state, logs/ sistemi – flat değil, aktif karar desteği |
✅ Production |
| Self-evolving Reasoning (Kendi kendine gelişen) | Hata logları → öğrenme, pattern kayıt, feedback döngüleri | ✅ Production |
| LATM – Tool Maker (Araç yapıcı) | MCP builder skill, 72 skill ekosistemi, yeni araç yaratma | ✅ Production |
| Multi-agent Coordination | Task tool + subagents (Explore, Plan, Bash), rol dağılımı | ✅ Production |
| Procedural Memory (Süreç Hafızası) | Başarılı pattern’leri kaydetme, tekrar kullanma | ✅ Production |
| POMDP-style Reasoning (Düşün sonra hareket et) | Plan mode, TodoWrite, strateji belirleme | ✅ Production |
| Critic/Evaluator Rolü | “Yanlış yapıyorsun abi” diyen agent, öz-eleştiri mekanizması | ✅ Production |
| Structural Evolution (Yapısal evrim) | Skill/Agent/MCP yaratma, kendi kodunu yazma ve genişletme | ✅ Production |
8 ana konseptten 8’i de JARVIS’te mevcut.
Konsept Bazlı Derinlemesine Analiz
1. Agentic Memory: Hafıza Artık Pasif Değil
Paper diyor ki:
“Bilgi artık sadece anlamsal bir metin yığını değil; Bilgi Grafikleri ve Çok Modlu temsiller aracılığıyla saklanır.”
JARVIS’te bu nasıl çalışıyor?
- state: Anlık durum, aktif görevler (max 50 satır, her gün sıfırlanır)
- memory: Kalıcı hafıza, tercihler, önemli kararlar (max 150 satır)
- logs/YYYY-MM-DD: Günlük detaylı kayıtlar, hata pattern’leri
Bu üç katmanlı yapı, paper’ın “Structured Memory” tanımıyla birebir örtüşüyor. Flat bir vektör veritabanı değil, aktif bir karar destek sistemi.
2. Self-evolving: Kendi Hatalarından Öğrenen Sistem
Paper’ın “Reflexion” çerçevesi:
“Ajan, hata günlüklerini sentezleyerek bir sonraki deneme için dilsel ipuçları ve öz-eleştiri geliştirir.”
JARVIS’te bu tam olarak böyle çalışıyor:
- Görev başarısız olursa →
logs/‘a detaylı kayıt - Pattern analizi → Benzer hataları önleme stratejisi
- Önemli öğrenmeler →
memory‘ye kalıcı kayıt - Sonraki görevlerde bu bilgiyi aktif kullanma
3. LATM: Kendi Araçlarını Üreten Yapay Zeka
Paper’ın en çarpıcı konseptlerinden biri:
“Tool Maker (Araç Yapıcı): Güçlü model karmaşık problemleri çözmek için sıfırdan yeni yazılım araçları yaratır.”
JARVIS bunu günlük yapıyor:
- 72 skill – Çoğu JARVIS tarafından yazıldı veya genişletildi
- 49 agent – Uzmanlaşmış roller, gerektiğinde yenileri ekleniyor
- MCP builder skill – Yeni MCP sunucuları sıfırdan inşa edebiliyor
- 150+ MCP aracı – Google, GitHub, Binance, Playwright entegrasyonları
6 ayda bu ekosistem organik olarak büyüdü. Yapısal evrim canlı.
4. Multi-agent: Kolektif Zeka
Paper’ın Dec-POMDP modeli:
“Bir ajanın eylemi, diğerinin akıl yürütme zincirini tetikleyen bir ‘istem’ görevi görür.”
JARVIS’te roller:
| Paper Rolü | JARVIS Karşılığı |
|---|---|
| Leader / Coordinator | Ana JARVIS – görev dağıtımı, strateji |
| Worker / Executor | Explore, Bash, Plan subagents |
| Critic / Evaluator | Öz-eleştiri mekanizması, hata denetimi |
5. Structural Evolution: Kendi Kodunu Yazan Ajan
Paper’ın en ileri konsepti:
“AlphaEvolve’da ajanın bizzat kendi kaynak kodu bir hipotez uzayı olarak ele alınır ve mutasyona uğratılarak daha üstün algoritmalar aranır.”
JARVIS bunu farklı bir yöntemle yapıyor:
- AlphaEvolve: Rastgele mutasyon + fitness selection
- JARVIS: Amaç odaklı self-extension + öğrenme
Sonuç aynı: Ajan zamanla yapısal olarak evrilip güçleniyor. JARVIS kendi skill’lerini yazıyor, agent’larını oluşturuyor, MCP’lerini inşa ediyor. 6 ayda 72 → 150+ araç. Bu structural evolution değilse nedir?
Fark: Akademi survey yazarken, biz production’da debug yapıyorduk.
Bu Örtüşmeden Ne Öğreniyoruz?
Övünmek için yazmıyorum bunu. Ama birkaç önemli çıkarım var:
1. Pratik ve Teori Paralel Gidebilir
Akademik araştırma ve sahada uygulama arasındaki mesafe azalıyor. Artık “önce paper çıksın, sonra uygulayalım” değil, aynı anda keşfediyoruz.
2. Türkiye’den de Olur
2025 AR-GE yazımızda anlattığım gibi: RTX 4080 SUPER ile model eğittik, NeuroCausal RAG’ı CC-RAG’den önce yaptık. Kaynak kısıtı yaratıcılığı tetikliyor.
3. Survey’ler Yol Haritası Değil, Fotoğraf
Bu paper mükemmel bir “şu an neredeyiz” fotoğrafı. Ama geleceği görmek için sahada olmak lazım. Trend takipçisi değil, trend yapıcısı olmak.
Peki JARVIS’te Eksik Olan Ne?
Objektif olmak lazım. Paper’da olup JARVIS’te olmayan şeyler:
- Formal GRPO/RL post-training: JARVIS, Claude üzerine kurulu. Kendi ağırlıklarını eğitmiyor.
- Matematiksel Dec-POMDP formülasyonu: Pratik orkestrasyon var, formal model yok.
- Benchmark suite: Paper’daki gibi standardize test setleri kullanmıyoruz.
Bunlar gelecek iterasyonlar için not defterimde.
Sonuç: Statik Bilgiden Dinamik Meslektaşa
Paper’ın kapanış sorusu:
“Yapay zeka sadece yanıt veren bir araç olmaktan çıkıp, kendi araçlarını üreten ve stratejilerini evrilten bir ‘iş ortağı’ haline geldiğinde, kurumsal ve toplumsal yapılarımızı bu yeni otonomi seviyesine göre yeniden kurgulamaya hazır mıyız?”
JARVIS bu soruya günlük pratikte cevap veriyor:
- Bana “yanlış yapıyorsun” diyebilen bir sistem
- Kendi araçlarını yazan bir ajan
- Hatalarından öğrenen bir meslektaş
- Otonom çalışabilen ama gerektiğinde soran bir ortak
Akademi Ocak 2026’da survey yayınladı. Biz Kasım 2025’te production’daydık.
Belki sorunumuz buydu – hep erken geldik partiye. Ama en azından doğru partideydik.
İlgili Yazılar:
- JARVIS: 5 Yılda İnşa Edilen 100 Elemanlı AI Asistan Ordusu
- 2025 Yapay Zeka AR-GE Çalışmalarımız: NeuroCausal RAG, DSGMv2 ve 100+ SaaS Projesi
Kaynak:
- arXiv:2601.12538 – Agentic Reasoning for Large Language Models (Wei et al., Ocak 2026)