22 Nisan 2026 · 6 dk okuma
RAG Nedir? Retrieval-Augmented Generation 2026 Kurumsal Rehberi
Makrops Mühendislik Ekibi
Yazılım, 3D ve yapay zeka mühendisliği · İstanbul / Berlin / New York
Kısa tanım
RAG (Retrieval-Augmented Generation — Getirmeyle Güçlendirilmiş Üretim), bir büyük dil modeline (LLM) cevabı üretmeden önce harici bir bilgi kaynağından (belge, veritabanı, API) ilgili parçaları getirip bağlam olarak veren mimari yaklaşımdır. LLM, kendi eğitim verisindeki bilgiyle sınırlı kalmaz; sizin kurumsal verilerinizle konuşur.Bir cümlede: RAG = Arama + LLM.
Neden RAG?
LLM'lerin 3 ana problemi var: 1. Halüsinasyon — bilmediğini uydurur 2. Güncel değil — eğitim tarihinden sonrasını bilmez 3. Kurumsal veriye kör — sizin şirketinizin dokümanlarını bilmez
RAG bu üçünü birden çözer. LLM'in cevap üretmesini istediğinizde: 1. Soru → embedding vektörüne çevrilir 2. Vector database'de benzer dokümanlar aranır 3. Bulunan parçalar LLM'e "context" olarak verilir 4. LLM, verilen context içinden cevap oluşturur
Sonuç: kaynak gösteren, güncel, şirketinize özel cevaplar.
Mimari (sade versiyon)
``` Kullanıcı sorusu ↓ [Embedding modeli] → vektör ↓ [Vector DB] → en ilgili 5-10 chunk ↓ [Prompt: soru + context + talimat] ↓ [LLM — GPT-4o / Claude / Gemini / Llama] ↓ Cevap + kaynak linkleri ```
Bileşenler
1. Document loader
PDF, DOCX, not ve dokümantasyon SaaS ürünleri, Confluence, Google Drive, web scraping, veritabanı, iş birliği SaaS ürünleri — her şey kaynak olabilir.2. Chunking
Uzun dokümanlar 200-800 token'lık parçalara bölünür. Akıllı chunking: başlık hiyerarşisi + örtüşme + semantik sınırlar.3. Embedding
Metin → vektör (genellikle 1536 veya 3072 boyutlu). Modeller: OpenAI `text-embedding-3-large`, Cohere Embed, open-source BGE, E5.4. Vector database
Pinecone, Weaviate, Qdrant, Milvus, Chroma, pgvector (PostgreSQL eklentisi — 2026'da en popüler). Benzerlik arama: cosine, dot product, L2.5. Retriever
Hybrid search (vector + keyword BM25), re-ranking (Cohere Rerank, Voyage), metadata filtering (tarih, yazar, bölüm).6. LLM
GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Llama 3.1, Mistral Large. Seçim: hassasiyet vs maliyet vs veri gizliliği.7. Orchestration
LangChain, LlamaIndex, Haystack, özel kod. 2026'da "framework'süz" yaklaşım tekrar yaygınlaşıyor.Kurumsal RAG kullanım senaryoları
| Senaryo | Örnek |
| İç destek asistanı | "İK politikamız izin için ne diyor?" |
| Müşteri destek bot | Ürün dokümantasyonu + ticket geçmişi |
| Satış enablement | Rakip analiz + fiyatlandırma + case study |
| Hukuk / uyum | Sözleşme klozu arama, risk analizi |
| Mühendislik | Kod tabanı soru-cevap (Copilot-type) |
| Finans | Rapor + açıklama + uyarı üretimi |
| Sağlık | Klinik kılavuz + hasta geçmişi destekli karar |
RAG'ın sınırları
- Kaynak kalitesi — çöp girer, çöp çıkar
- Chunking kritik — kötü chunk → yanlış context → yanlış cevap
- Gizlilik — vektörler bile bilgi sızdırabilir; on-prem veya self-hosted LLM gerekebilir
- Güncelleme — vector DB senkron tutulmalı
- Çelişkili kaynaklar — 3 doküman 3 farklı şey diyorsa LLM hangisini seçer?
- Çoklu adım muhakeme — RAG tek-adım arama için iyi, çok hop gerektiren sorularda zorlanır (Agent + RAG kombinasyonu gerekir)
RAG + Agent
RAG tek başına "soru-cevap"tır. AI Agent ise plan yapar, araç kullanır, çok adımlı iş yapar. Kombine kullanım: Agent, RAG'ı bir araç olarak çağırır; ihtiyaç varsa SQL veritabanına da sorgu atar, ihtiyaç varsa email gönderir. Detay: AI agent nedir.
2026 iyi pratikler
- pgvector tercihi — PostgreSQL kullanıyorsanız ayrı vector DB gerekmez
- Hybrid search — sadece vector değil, keyword + vector birlikte
- Re-ranking — ilk retrieval sonrası 2. filtre kaliteyi çok yükseltir
- Metadata + filter — tarih, kullanıcı rol, bölge filtresi şart
- Evaluation pipeline — Ragas, TruLens ile otomatik kalite ölçüm
- Guardrails — cevap kaynak göstermiyorsa uyar; PII maskele
- Caching — tekrar eden sorular için semantik cache
- Observability — her query + context + cevap log'lansın
Ne zaman RAG, ne zaman fine-tuning?
| Durum | Seçim |
| Sık değişen bilgi, kaynak göstermek önemli | RAG |
| Stilinizi + tonunuzu + domain terminolojisini öğretmek | Fine-tune |
| İkisi birden gerekli | RAG + fine-tune (hibrit) |
*Makrops; kurumsal müşteriler için özel RAG chatbot, doküman asistanı, SQL + vector hibrit Q&A ve AI agent projeleri teslim eder. OpenAI, Anthropic, Google ve on-prem Llama/Mistral alternatifleriyle 6-12 haftalık MVP. AI çözümleri hizmetimiz veya iletişim.*