22 Nisan 2026 · 6 dk okuma

RAG Nedir? Retrieval-Augmented Generation 2026 Kurumsal Rehberi

Makrops Mühendislik Ekibi

Yazılım, 3D ve yapay zeka mühendisliği · İstanbul / Berlin / New York

Kısa tanım

RAG (Retrieval-Augmented Generation — Getirmeyle Güçlendirilmiş Üretim), bir büyük dil modeline (LLM) cevabı üretmeden önce harici bir bilgi kaynağından (belge, veritabanı, API) ilgili parçaları getirip bağlam olarak veren mimari yaklaşımdır. LLM, kendi eğitim verisindeki bilgiyle sınırlı kalmaz; sizin kurumsal verilerinizle konuşur.

Bir cümlede: RAG = Arama + LLM.

Neden RAG?

LLM'lerin 3 ana problemi var: 1. Halüsinasyon — bilmediğini uydurur 2. Güncel değil — eğitim tarihinden sonrasını bilmez 3. Kurumsal veriye kör — sizin şirketinizin dokümanlarını bilmez

RAG bu üçünü birden çözer. LLM'in cevap üretmesini istediğinizde: 1. Soru → embedding vektörüne çevrilir 2. Vector database'de benzer dokümanlar aranır 3. Bulunan parçalar LLM'e "context" olarak verilir 4. LLM, verilen context içinden cevap oluşturur

Sonuç: kaynak gösteren, güncel, şirketinize özel cevaplar.

Mimari (sade versiyon)

``` Kullanıcı sorusu ↓ [Embedding modeli] → vektör ↓ [Vector DB] → en ilgili 5-10 chunk ↓ [Prompt: soru + context + talimat] ↓ [LLM — GPT-4o / Claude / Gemini / Llama] ↓ Cevap + kaynak linkleri ```

Bileşenler

1. Document loader

PDF, DOCX, not ve dokümantasyon SaaS ürünleri, Confluence, Google Drive, web scraping, veritabanı, iş birliği SaaS ürünleri — her şey kaynak olabilir.

2. Chunking

Uzun dokümanlar 200-800 token'lık parçalara bölünür. Akıllı chunking: başlık hiyerarşisi + örtüşme + semantik sınırlar.

3. Embedding

Metin → vektör (genellikle 1536 veya 3072 boyutlu). Modeller: OpenAI `text-embedding-3-large`, Cohere Embed, open-source BGE, E5.

4. Vector database

Pinecone, Weaviate, Qdrant, Milvus, Chroma, pgvector (PostgreSQL eklentisi — 2026'da en popüler). Benzerlik arama: cosine, dot product, L2.

5. Retriever

Hybrid search (vector + keyword BM25), re-ranking (Cohere Rerank, Voyage), metadata filtering (tarih, yazar, bölüm).

6. LLM

GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Llama 3.1, Mistral Large. Seçim: hassasiyet vs maliyet vs veri gizliliği.

7. Orchestration

LangChain, LlamaIndex, Haystack, özel kod. 2026'da "framework'süz" yaklaşım tekrar yaygınlaşıyor.

Kurumsal RAG kullanım senaryoları

Senaryo

Örnek

|---|---|

İç destek asistanı	"İK politikamız izin için ne diyor?"
Müşteri destek bot	Ürün dokümantasyonu + ticket geçmişi
Satış enablement	Rakip analiz + fiyatlandırma + case study
Hukuk / uyum	Sözleşme klozu arama, risk analizi
Mühendislik	Kod tabanı soru-cevap (Copilot-type)
Finans	Rapor + açıklama + uyarı üretimi
Sağlık	Klinik kılavuz + hasta geçmişi destekli karar

RAG'ın sınırları

Kaynak kalitesi — çöp girer, çöp çıkar
Chunking kritik — kötü chunk → yanlış context → yanlış cevap
Gizlilik — vektörler bile bilgi sızdırabilir; on-prem veya self-hosted LLM gerekebilir
Güncelleme — vector DB senkron tutulmalı
Çelişkili kaynaklar — 3 doküman 3 farklı şey diyorsa LLM hangisini seçer?
Çoklu adım muhakeme — RAG tek-adım arama için iyi, çok hop gerektiren sorularda zorlanır (Agent + RAG kombinasyonu gerekir)

RAG + Agent

RAG tek başına "soru-cevap"tır. AI Agent ise plan yapar, araç kullanır, çok adımlı iş yapar. Kombine kullanım: Agent, RAG'ı bir araç olarak çağırır; ihtiyaç varsa SQL veritabanına da sorgu atar, ihtiyaç varsa email gönderir. Detay: AI agent nedir.

2026 iyi pratikler

pgvector tercihi — PostgreSQL kullanıyorsanız ayrı vector DB gerekmez
Hybrid search — sadece vector değil, keyword + vector birlikte
Re-ranking — ilk retrieval sonrası 2. filtre kaliteyi çok yükseltir
Metadata + filter — tarih, kullanıcı rol, bölge filtresi şart
Evaluation pipeline — Ragas, TruLens ile otomatik kalite ölçüm
Guardrails — cevap kaynak göstermiyorsa uyar; PII maskele
Caching — tekrar eden sorular için semantik cache
Observability — her query + context + cevap log'lansın

Ne zaman RAG, ne zaman fine-tuning?

Durum

Seçim

|---|---|

Sık değişen bilgi, kaynak göstermek önemli	RAG
Stilinizi + tonunuzu + domain terminolojisini öğretmek	Fine-tune
İkisi birden gerekli	RAG + fine-tune (hibrit)

*Makrops; kurumsal müşteriler için özel RAG chatbot, doküman asistanı, SQL + vector hibrit Q&A ve AI agent projeleri teslim eder. OpenAI, Anthropic, Google ve on-prem Llama/Mistral alternatifleriyle 6-12 haftalık MVP. AI çözümleri hizmetimiz veya iletişim.*

22 Nisan 2026 · 6 dk okuma

RAG Nedir? Retrieval-Augmented Generation 2026 Kurumsal Rehberi

Makrops Mühendislik Ekibi

Yazılım, 3D ve yapay zeka mühendisliği · İstanbul / Berlin / New York

Kısa tanım

Bir cümlede: RAG = Arama + LLM.

Neden RAG?

Sonuç: kaynak gösteren, güncel, şirketinize özel cevaplar.

Mimari (sade versiyon)

Bileşenler

1. Document loader

PDF, DOCX, not ve dokümantasyon SaaS ürünleri, Confluence, Google Drive, web scraping, veritabanı, iş birliği SaaS ürünleri — her şey kaynak olabilir.

2. Chunking

Uzun dokümanlar 200-800 token'lık parçalara bölünür. Akıllı chunking: başlık hiyerarşisi + örtüşme + semantik sınırlar.

3. Embedding

Metin → vektör (genellikle 1536 veya 3072 boyutlu). Modeller: OpenAI `text-embedding-3-large`, Cohere Embed, open-source BGE, E5.

4. Vector database

Pinecone, Weaviate, Qdrant, Milvus, Chroma, pgvector (PostgreSQL eklentisi — 2026'da en popüler). Benzerlik arama: cosine, dot product, L2.

5. Retriever

Hybrid search (vector + keyword BM25), re-ranking (Cohere Rerank, Voyage), metadata filtering (tarih, yazar, bölüm).

6. LLM

GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, Llama 3.1, Mistral Large. Seçim: hassasiyet vs maliyet vs veri gizliliği.

7. Orchestration

LangChain, LlamaIndex, Haystack, özel kod. 2026'da "framework'süz" yaklaşım tekrar yaygınlaşıyor.

Kurumsal RAG kullanım senaryoları

Senaryo

Örnek

|---|---|

İç destek asistanı	"İK politikamız izin için ne diyor?"
Müşteri destek bot	Ürün dokümantasyonu + ticket geçmişi
Satış enablement	Rakip analiz + fiyatlandırma + case study
Hukuk / uyum	Sözleşme klozu arama, risk analizi
Mühendislik	Kod tabanı soru-cevap (Copilot-type)
Finans	Rapor + açıklama + uyarı üretimi
Sağlık	Klinik kılavuz + hasta geçmişi destekli karar

RAG'ın sınırları

Kaynak kalitesi — çöp girer, çöp çıkar
Chunking kritik — kötü chunk → yanlış context → yanlış cevap
Gizlilik — vektörler bile bilgi sızdırabilir; on-prem veya self-hosted LLM gerekebilir
Güncelleme — vector DB senkron tutulmalı
Çelişkili kaynaklar — 3 doküman 3 farklı şey diyorsa LLM hangisini seçer?
Çoklu adım muhakeme — RAG tek-adım arama için iyi, çok hop gerektiren sorularda zorlanır (Agent + RAG kombinasyonu gerekir)

RAG + Agent

2026 iyi pratikler

pgvector tercihi — PostgreSQL kullanıyorsanız ayrı vector DB gerekmez
Hybrid search — sadece vector değil, keyword + vector birlikte
Re-ranking — ilk retrieval sonrası 2. filtre kaliteyi çok yükseltir
Metadata + filter — tarih, kullanıcı rol, bölge filtresi şart
Evaluation pipeline — Ragas, TruLens ile otomatik kalite ölçüm
Guardrails — cevap kaynak göstermiyorsa uyar; PII maskele
Caching — tekrar eden sorular için semantik cache
Observability — her query + context + cevap log'lansın

Ne zaman RAG, ne zaman fine-tuning?

Durum

Seçim

|---|---|

Sık değişen bilgi, kaynak göstermek önemli	RAG
Stilinizi + tonunuzu + domain terminolojisini öğretmek	Fine-tune
İkisi birden gerekli	RAG + fine-tune (hibrit)