Agentic Reasoning: Akademi Ocak 2026'da Yazdı, Biz Kasım 2025'te Production'daydık - Ertuğrul Akben | Yazılım | Yapay Zeka

18 Ocak 2026. Illinois Üniversitesi’nden bir ekip, “Agentic Reasoning for Large Language Models” başlıklı kapsamlı bir survey yayınlıyor. 135 sayfa, 300+ referans, yapay zeka ajanlarının geleceğini çizen bir yol haritası.

Ben de o sabah kahvemi yudumlarken makaleyi okuyorum ve bir şey fark ediyorum: Bu konseptlerin çoğunu biz zaten Kasım 2025’te production’a almıştık.

“Biz kahvemizi içmeye fırsat bulamadan, dünyanın öbür ucunda biri aynı şeyi keynote’ta sunuyor. Türk kahvesi soğuyor ama projeler sıcak!”

Bu yazı, akademik bir survey’in Türkiye’den bir AR-GE ekibinin çalışmalarıyla nasıl örtüştüğünün hikayesi. Övünmek için değil, doğru yolda olduğumuzu teyit etmek için.

Agentic Reasoning Nedir? Paper’ın Söyledikleri

arXiv:2601.12538 numaralı makale, Tianxin Wei ve ekibi tarafından hazırlandı. Temel argüman şu:

Geleneksel LLM’ler pasif metin üreticileri. Soru sor, cevap al. Ama gerçek dünya problemleri bundan fazlasını gerektiriyor: planlama, araç kullanma, hatalardan öğrenme, strateji geliştirme.

İşte “Agentic Reasoning” (Ajan Tipi Akıl Yürütme) tam da bu boşluğu dolduruyor. Paper üç ana katman tanımlıyor:

Katman	Açıklama	Temel Yetenekler
Foundational Agentic Reasoning	Temel ajan yetenekleri	Planlama, araç kullanma, arama stratejileri
Self-evolving Agentic Reasoning	Kendi kendine gelişen sistemler	Geri bildirim döngüleri, hafıza, adaptasyon
Collective Multi-agent Reasoning	Çoklu ajan koordinasyonu	Rol dağılımı, bilgi paylaşımı, ortak hedefler

Paper ayrıca iki kritik kavramı ayırıyor:

In-context Reasoning: Çıkarım anında yapılandırılmış iş akışlarıyla akıl yürütme
Post-training Reasoning: Takviyeli öğrenme (RL) ile modelin ağırlıklarına mantık silsilesi yerleştirme

JARVIS: Akademiden Önce Production’da

Şimdi objektif bir karşılaştırma yapalım. JARVIS sistemini Kasım 2025’te production’a aldığımızda, paper’da tanımlanan konseptlerin büyük çoğunluğu zaten çalışıyordu.

Paper Konsepti	JARVIS Implementasyonu	Durum
Agentic Memory (Yapılandırılmış Hafıza)	`memory`, `state`, `logs/` sistemi – flat değil, aktif karar desteği	✅ Production
Self-evolving Reasoning (Kendi kendine gelişen)	Hata logları → öğrenme, pattern kayıt, feedback döngüleri	✅ Production
LATM – Tool Maker (Araç yapıcı)	MCP builder skill, 72 skill ekosistemi, yeni araç yaratma	✅ Production
Multi-agent Coordination	Task tool + subagents (Explore, Plan, Bash), rol dağılımı	✅ Production
Procedural Memory (Süreç Hafızası)	Başarılı pattern’leri kaydetme, tekrar kullanma	✅ Production
POMDP-style Reasoning (Düşün sonra hareket et)	Plan mode, TodoWrite, strateji belirleme	✅ Production
Critic/Evaluator Rolü	“Yanlış yapıyorsun abi” diyen agent, öz-eleştiri mekanizması	✅ Production
Structural Evolution (Yapısal evrim)	Skill/Agent/MCP yaratma, kendi kodunu yazma ve genişletme	✅ Production

8 ana konseptten 8’i de JARVIS’te mevcut.

Konsept Bazlı Derinlemesine Analiz

1. Agentic Memory: Hafıza Artık Pasif Değil

Paper diyor ki:

“Bilgi artık sadece anlamsal bir metin yığını değil; Bilgi Grafikleri ve Çok Modlu temsiller aracılığıyla saklanır.”

JARVIS’te bu nasıl çalışıyor?

state: Anlık durum, aktif görevler (max 50 satır, her gün sıfırlanır)
memory: Kalıcı hafıza, tercihler, önemli kararlar (max 150 satır)
logs/YYYY-MM-DD: Günlük detaylı kayıtlar, hata pattern’leri

Bu üç katmanlı yapı, paper’ın “Structured Memory” tanımıyla birebir örtüşüyor. Flat bir vektör veritabanı değil, aktif bir karar destek sistemi.

2. Self-evolving: Kendi Hatalarından Öğrenen Sistem

Paper’ın “Reflexion” çerçevesi:

“Ajan, hata günlüklerini sentezleyerek bir sonraki deneme için dilsel ipuçları ve öz-eleştiri geliştirir.”

JARVIS’te bu tam olarak böyle çalışıyor:

Görev başarısız olursa → logs/‘a detaylı kayıt
Pattern analizi → Benzer hataları önleme stratejisi
Önemli öğrenmeler → memory‘ye kalıcı kayıt
Sonraki görevlerde bu bilgiyi aktif kullanma

3. LATM: Kendi Araçlarını Üreten Yapay Zeka

Paper’ın en çarpıcı konseptlerinden biri:

“Tool Maker (Araç Yapıcı): Güçlü model karmaşık problemleri çözmek için sıfırdan yeni yazılım araçları yaratır.”

JARVIS bunu günlük yapıyor:

72 skill – Çoğu JARVIS tarafından yazıldı veya genişletildi
49 agent – Uzmanlaşmış roller, gerektiğinde yenileri ekleniyor
MCP builder skill – Yeni MCP sunucuları sıfırdan inşa edebiliyor
150+ MCP aracı – Google, GitHub, Binance, Playwright entegrasyonları

6 ayda bu ekosistem organik olarak büyüdü. Yapısal evrim canlı.

4. Multi-agent: Kolektif Zeka

Paper’ın Dec-POMDP modeli:

“Bir ajanın eylemi, diğerinin akıl yürütme zincirini tetikleyen bir ‘istem’ görevi görür.”

JARVIS’te roller:

Paper Rolü	JARVIS Karşılığı
Leader / Coordinator	Ana JARVIS – görev dağıtımı, strateji
Worker / Executor	Explore, Bash, Plan subagents
Critic / Evaluator	Öz-eleştiri mekanizması, hata denetimi

5. Structural Evolution: Kendi Kodunu Yazan Ajan

Paper’ın en ileri konsepti:

“AlphaEvolve’da ajanın bizzat kendi kaynak kodu bir hipotez uzayı olarak ele alınır ve mutasyona uğratılarak daha üstün algoritmalar aranır.”

JARVIS bunu farklı bir yöntemle yapıyor:

AlphaEvolve: Rastgele mutasyon + fitness selection
JARVIS: Amaç odaklı self-extension + öğrenme

Sonuç aynı: Ajan zamanla yapısal olarak evrilip güçleniyor. JARVIS kendi skill’lerini yazıyor, agent’larını oluşturuyor, MCP’lerini inşa ediyor. 6 ayda 72 → 150+ araç. Bu structural evolution değilse nedir?

Fark: Akademi survey yazarken, biz production’da debug yapıyorduk.

Bu Örtüşmeden Ne Öğreniyoruz?

Övünmek için yazmıyorum bunu. Ama birkaç önemli çıkarım var:

1. Pratik ve Teori Paralel Gidebilir

Akademik araştırma ve sahada uygulama arasındaki mesafe azalıyor. Artık “önce paper çıksın, sonra uygulayalım” değil, aynı anda keşfediyoruz.

2. Türkiye’den de Olur

2025 AR-GE yazımızda anlattığım gibi: RTX 4080 SUPER ile model eğittik, NeuroCausal RAG’ı CC-RAG’den önce yaptık. Kaynak kısıtı yaratıcılığı tetikliyor.

3. Survey’ler Yol Haritası Değil, Fotoğraf

Bu paper mükemmel bir “şu an neredeyiz” fotoğrafı. Ama geleceği görmek için sahada olmak lazım. Trend takipçisi değil, trend yapıcısı olmak.

Peki JARVIS’te Eksik Olan Ne?

Objektif olmak lazım. Paper’da olup JARVIS’te olmayan şeyler:

Formal GRPO/RL post-training: JARVIS, Claude üzerine kurulu. Kendi ağırlıklarını eğitmiyor.
Matematiksel Dec-POMDP formülasyonu: Pratik orkestrasyon var, formal model yok.
Benchmark suite: Paper’daki gibi standardize test setleri kullanmıyoruz.

Bunlar gelecek iterasyonlar için not defterimde.

Sonuç: Statik Bilgiden Dinamik Meslektaşa

Paper’ın kapanış sorusu:

“Yapay zeka sadece yanıt veren bir araç olmaktan çıkıp, kendi araçlarını üreten ve stratejilerini evrilten bir ‘iş ortağı’ haline geldiğinde, kurumsal ve toplumsal yapılarımızı bu yeni otonomi seviyesine göre yeniden kurgulamaya hazır mıyız?”

JARVIS bu soruya günlük pratikte cevap veriyor:

Bana “yanlış yapıyorsun” diyebilen bir sistem
Kendi araçlarını yazan bir ajan
Hatalarından öğrenen bir meslektaş
Otonom çalışabilen ama gerektiğinde soran bir ortak

Akademi Ocak 2026’da survey yayınladı. Biz Kasım 2025’te production’daydık.

Belki sorunumuz buydu – hep erken geldik partiye. Ama en azından doğru partideydik.

İlgili Yazılar:

Kaynak:

arXiv:2601.12538 – Agentic Reasoning for Large Language Models (Wei et al., Ocak 2026)

Ertuğrul Akben

Ertuğrul Akben

Yurt Dışı Ofisleri

Bölge Ofisi

Merkez

Atölye

Ana Şirketler

Sektörler

Agentic Reasoning: Akademi Ocak 2026’da Yazdı, Biz Kasım 2025’te Production’daydık