Küresel Görüntü Sıkıştırma Kıyaslaması 2026: JPEG vs WebP vs AVIF Benchmark Protokolü

İçindekiler

  1. Amaç, Kapsam ve Ölçüm İlkeleri
  2. Veri Seti Tasarımı ve Toplama Protokolü
  3. Örnekleme Modeli ve Veri Setleri
  4. Dahil Etme ve Hariç Tutma Kuralları
  5. Deney Tasarımı ve Test Matrisi
  6. Kalite Metrikleri ve Encoder Ayarları
  7. Donanım ve Ortam Gereksinimleri
  8. Otomasyon Pipeline Tasarımı
  9. Veri Şeması ve Ham Sonuç Depolama
  10. Analiz Planı ve Segmentasyon
  11. Nihai Rapor Şablonu
  12. Teslimatlar ve Zaman Çizelgesi
  13. Kaynak ve Bütçe Yaklaşımı
  14. KVKK ve Etik Uyum Çerçevesi

Bu çalışma, Tools1984 için Türkiye odaklı olarak “gerçek web görselleri” üzerinde tekrar üretilebilir (reproducible), otomasyonlu ve araştırma-grade bir “küresel” görsel sıkıştırma kıyaslaması (benchmark) üretme yöntemini tanımlar. Ölçüm çıktısı olarak boyut kazancı + kalite kaybı + encode süresi + tarayıcı uyumluluğu dörtlüsünü aynı raporda birleştiren, kaynakları ve kodu şeffaf bir protokol hedeflenir.

Çalışma, doğrudan ölçüm üretmez; yalnızca gerçek veriyi nasıl toplayacağınızı ve nasıl ölçeceğinizi adım adım tarif eder.

Türkiye odağı üç kanalın birleştirilmesiyle sağlanır:

  • Açık web veri setleri: HTTP Archive (BigQuery üzerinden .tr ve Türkiye odaklı alan adı filtreleri) ve Common Crawl (CDXJ/Index API ile .tr ve Türkçe içerik filtreleri).
  • Türkiye’deki üst alan adları ve kategori örneklemesi: Tranco listesi ile .tr TLD ve Türkiye’nin yoğun trafik alan sektörlerinden (haber, e‑ticaret, kamu, bankacılık, ilan, forum) katmanlı örnekleme.
  • Tools1984 kullanım sinyali: Sunucu loglarından yalnızca anonimleştirilmiş/aggregate metriklerle (format türleri, ortalama boyutlar, talep edilen dönüşümler) test matrisini gerçek talebe göre ağırlıklandırma. (KVKK ilkeleri dikkate alınır.)

Ana teknik kapsam: JPEG/PNG kaynakları üzerinden JPEG (MozJPEG), WebP (cwebp/libwebp), AVIF (libavif ile aom/rav1e/SVT-AV1) ve piyasada yaygın servisler (TinyPNG/Tinify, ShortPixel) ile kıyas. Rapor, tek bir “en iyi format budur” iddiası üretmek yerine; içerik türüne, çözünürlüğe, alfa kanalına, kaynak sitenin tipine ve tarayıcı uyumluluğuna göre karar matrisi çıkaracak şekilde tasarlanır.


Amaç, Kapsam ve Ölçüm İlkeleri

Bu benchmark’ın “araştırma değeri taşıyan” tarafı; veri setinin şeffaflığı, protokolün tekrar üretilebilirliği, sonuçların segmentlenerek sunulması ve ham verinin (URL/hash/ölçüm) paylaşılabilir oluşudur. Hedeflenen şey; sıradan bir blog yazısı değil, cite edilebilir bir Research/Dataset/Benchmark varlığıdır.

Araştırma Soruları

#Araştırma Sorusu
1Türkiye odaklı web görsellerinde format/encoder seçimi (JPEG vs WebP vs AVIF) boyut/kalite/hız dengesini nasıl değiştirir?
2Hangi içerik türlerinde (fotoğraf, ürün görseli, UI screenshot, ikon/illüstrasyon) hangi format daha avantajlı?
3“Servis tabanlı” optimizasyon (TinyPNG/ShortPixel) ile “açık kaynak encoder” (mozjpeg/cwebp/libavif) arasındaki farklar neler?
4Türkiye’de yüksek trafikli sektörlerde (haber, e‑ticaret vb.) görsel dağılımı (boyut, format, çözünürlük, alfa) nasıl?

Ölçüm İlkeleri

  • Deterministik pipeline: Aynı kaynak görsel → aynı normalize edilmiş renk/metadata yaklaşımları → her encoder için belirlenmiş kalite merdiveni.
  • İki düzeyli veri: Sonuçlar ham veri (tek görsel‑tek deneme) + toplu analiz (domain/sector/type segmentleri) olarak saklanır.
  • Pareto yaklaşımı: “Kıyas” tek bir metrik değil; Pareto seti (boyut ↓, kalite ↑, süre ↓) olarak sunulur.

Veri Seti Tasarımı ve Toplama Protokolü

Türkiye Odaklı Veri Kaynakları

KaynakAçıklamaTürkiye FiltresiErişim Yöntemi
HTTP ArchiveHer ay güncellenen crawl verisi; sayfa ve request düzeyinde kaynak tipleriDomain .tr + Türkiye’de bilinen büyük sitelerBigQuery üzerinden sorgu
Common CrawlWARC arşivleri ve CDX index ile URL/mime/timestamp bazında filtreleme.tr TLD + Türkçe sayfa dili tespitiCDXJ/Index API + WARC range fetch
Tranco.tr TLD filtreli “hedef domain listesi” üretmek için kararlılık sağlar.tr TLD filtreli üst domainlerCSV indirme + filtreleme
Tools1984 LoglarıKullanıcı talebinin yoğunlaştığı dönüşümleri bulmak için aggregate metrikDil/locale ve domain referer segmentasyonuLog aggregation (KVKK uyumlu)
Tablo 1: Türkiye odaklı veri kaynakları ve erişim yöntemleri

Not: HTTP Archive, URL seçimini Chrome User Experience Report temelli yapabildiğini belirtir. Tek URL’nin tüm siteyi temsil etmeyebileceği, metodolojik bir sınırlılık olarak raporlanmalıdır.


Örnekleme Modeli ve Veri Setleri

Önerilen ana hedef: 10.000 görsel (N=10.000). Pilot aşama N=2.000, yüksek istatistik gücü için N=50.000 alternatif olarak planlanabilir.

Çok Aşamalı Katmanlı Örnekleme

KatmanKırılımDeğerler
Katman 1Domain / SektörHaber, E‑ticaret, Kamu, Bankacılık, İlan, Forum/Blog, SaaS
Katman 2Görsel TürüFotoğraf, Ürün fotoğrafı, Banner, UI screenshot, İkon/İllüstrasyon, Saydam PNG, Küçük sprite
Katman 3Çözünürlük Aralığı≤256px, 257–1024px, 1025–2048px, >2048px
Tablo 2: Katmanlı örnekleme kırılımları

Domain Havuzu Oluşturma

  1. Tranco listesinden .tr TLD filtreli ilk K domain (ör: 2.000).
  2. Türkiye’de yaygın ama .tr olmayan büyük siteler için elle ek “whitelist” (ör: .com.tr, .com uzantılı Türkiye siteleri). Bu liste raporda şeffaf biçimde yayınlanır.
  3. Her domain için HTTP Archive üzerinden yalnızca zaten taranan URL’ler kullanılır.
  4. Direkt crawl yapılacaksa: robots.txt ve ToS kontrolü + istek limiti (domain başına en fazla 2–5 HTML sayfa, en fazla 50 görsel URL).
  5. Her sayfadan: <img>, srcset, CSS background görselleri ayrıştırılır; her görsel URL için HEAD/GET ile MIME ve bytes doğrulanır.

Planlanan Veri Setleri

Veri Seti AdıAmaçTürkiye FiltresiToplama YöntemiArtılarıRisk / Eksi
HTTPA‑TR‑ImagesTürkiye odaklı gerçek sayfa yüklemelerinde görülen görsellerDomain .tr + Türkiye’de bilinen büyük siteler; sayfa dili tespitiBigQuery → image request URL listesi → görsel indirmeÖlçülebilir ve tekrarlanabilir crawling; aylık güncellenirHTTP Archive tek URL temsili sınırlı olabilir
CC‑TR‑ImagesDaha geniş web kapsaması + historik varyasyon.tr TLD + Türkçe sayfa dili tespiti (HTML dil sınıflandırması)CDXJ/Index API ile URL/mime filtrele → WARC range fetchÇok büyük kapsam; index bazlı çekim mümkünURL index sunucusunu overload etmeme; columnar index önerisi
TR‑Category‑CrawlSektörleri dengeli temsilSektör whitelist (haber, e‑ticaret, kamu, banka)Tools1984 crawler (rate limit + cache)Türkiye sektör kırılımı çok temizToS/robots uyumu + operasyon yükü
Tools1984‑Usage‑SignalsHangi tool/format kombinasyonuna ağırlık verileceğini bulmakDil/locale ve domain referer segmentasyonuLog aggregation (format/boyut histogramı, dönüşüm oranı)Gerçek talebe göre test matrisi optimize edilirKVKK uyumu ve anonimleştirme zorunlu
Tablo 3: Planlanan veri setleri, kaynaklar ve risk analizi

Dahil Etme ve Hariç Tutma Kuralları

Dahil Etme Kriterleri (Minimum Şartlar)

KriterKoşul
MIME Türüimage/jpeg, image/png, image/webp, image/avif (isteğe bağlı: image/svg+xml)
Dosya Boyutu2 KB – 10 MB (uç değerler ayrı “outlier” analizi)
Minimum Çözünürlük64×64 piksel (tracking pixel’ları ayıklamak için)
Tablo 4: Dahil etme kriterleri

Hariç Tutma Kuralları

KuralGerekçe
Animasyonlu içerik (animated WebP/APNG/GIF)Bu benchmark “still image” odaklı
Telif/dağıtım riskli görsellerHam görselleri kamuya açık dağıtmamak; yalnızca URL + hash + ölçüm paylaşmak
Dinamik/korumalı URL’lerİmzalı CDN URL’leri (kısa TTL), login gerektiren içerikler erişilemez
Aynı içeriğin tekrarlarısha256 digest ile dedup uygulanır
Tablo 5: Hariç tutma kuralları ve gerekçeleri

Teknik not: Common Crawl tarafında CDX index, WARC file/offset/length alanları ile “range request” yöntemiyle tek bir kaydı çekmeye izin veren bir iş akışını destekler.


Deney Tasarımı ve Test Matrisi

Bu benchmark, “araç” ve “codec” ayrımını net tutmalıdır:

  • Codec/encoder (açık kaynak, parametrelenebilir): MozJPEG, cwebp/libwebp, libavif (aom/rav1e/SVT-AV1)
  • Servis/ürün (black-box, sınırlı parametre): TinyPNG/Tinify API, ShortPixel API

Format × Araç × Ayar Test Matrisi

Çıktı FormatıAraç / EncoderAyar SetiNot
JPEGMozJPEG (cjpeg)quality ∈ {50, 60, 70, 80, 90}; progressive on; optimize onMozJPEG kalite parametresi 0–100, varsayılan 75
PNG (lossless optimize)oxipng / zopfliOptimize parametreleri raporda pinlenirImageOptim benzeri toolchain, Linux’ta tekrar üretilebilir
PNG/JPEG (smart lossy)TinyPNG / Tinify API“service default” (parametre yok)TinyPNG smart lossy compression; REST servis
JPEG/PNG/WebP/AVIFShortPixel APIlossy / glossy / lossless modları; WebP/AVIF dönüşümüShortPixel API; 3 kalite modu
WebPcwebp (libwebp)-q ∈ {50, 60, 70, 80, 90}; -m ∈ {4, 6}; -preset ∈ {photo, picture, drawing, text}cwebp dokümantasyonu ve preset seçenekleri
AVIFlibavif (avifenc)–codec ∈ {aom, rav1e, svt}; –speed (codec’e göre); -q kalite parametreleriavifenc man sayfası; AOMedia AVIF spesifikasyonu
AVIF (heifsave)libvipsQ (varsayılan 50); compression=AV1libvips heifsave dokümanı; AVIF/AV1 desteği
Tablo 6: Test matrisi — format × araç × ayar kombinasyonları

Not: Squoosh “referans UI” olarak raporda anılabilir (özellikle AVIF denemeleri için yaygın) ancak araştırma-grade ölçüm için CLI/pipeline tarafında aynı encoder’ları doğrudan kullanmak daha tekrar üretilebilir olur.


Kalite Metrikleri ve Encoder Ayarları

Encoder Ayar Standardizasyonu

Amaç: “aynı kalite hedefi” altında farklı formatların boyutunu kıyaslamak. İki yaklaşım planlanır:

YaklaşımYöntemAçıklama
Kalite Merdiveni (Quality Ladder)Her codec için 5–7 kalite seviyesiSabit quality parametreleri ile boyut/kalite karşılaştırması
Algısal Kalite HedeflemeButteraugli skoru sabit aralıktaAlgısal kalite sabitlenip boyut kıyası yapılır (ileri seviye)
Tablo 7: Encoder ayar standardizasyon yaklaşımları

Kalite Merdiveni Değerleri

FormatKalite SeviyeleriEk Parametreler
JPEG (MozJPEG)50, 60, 70, 80, 90progressive=on, optimize=on
WebP (cwebp)50, 60, 70, 80, 90-m ∈ {4, 6}; -preset ∈ {photo, picture, drawing, text}
AVIF (avifenc)30, 40, 50, 60, 70–speed ∈ {2, 4, 6}; –codec ∈ {aom, rav1e, svt}
Tablo 8: Format bazlı kalite merdiveni değerleri (pilot ile kalibre edilir)

Kalite Ölçüm Metrikleri

MetrikTürAçıklamaKullanım Amacı
PSNRPiksel bazlıSinyal-gürültü oranı (dB)Hızlı karşılaştırma; referans metrik
SSIMYapısalYapısal benzerlik indeksi (0–1)İnsan algısına daha yakın yapısal ölçüm
MS-SSIMÇok ölçekli yapısalMulti-Scale SSIMFarklı çözünürlüklerde daha güvenilir
ButteraugliAlgısal/psikovisüelAlgısal fark mesafesiİnsan gözü algısına en yakın metrik; kalite hedefleme için kullanılır
Tablo 9: Kalite ölçüm metrikleri karşılaştırması

Donanım ve Ortam Gereksinimleri

Araştırma-grade benchmark’ın “gizli düşmanı” ölçüm ortamıdır. Ortam şartları raporda sabitlenmelidir:

BileşenSpesifikasyonNot
İşletim SistemiUbuntu LTS (ör: 24.04) veya Debian stableDocker ile sabitlenir
CPUTek bir “ana koşum” makinesi + opsiyonel doğrulama makinesiAVIF encode CPU-yoğun olabilir
RAM≥ 32 GB10k × çoklu varyant, paralel encode için
DiskNVMe, ≥ 1 TB çalışma alanıHam indirilenler + ara çıktılar
Sürüm PinlemeDocker image ile libwebp, libavif, mozjpeg sürümleri sabitlenirTekrar üretilebilirlik için zorunlu
Tablo 10: Donanım ve ortam gereksinimleri

Otomasyon Pipeline Tasarımı

Pipeline Aşamaları

AşamaİşlemGirdiÇıktı
1. URL HavuzuHTTP Archive + Common Crawl + Tranco + whitelist birleştirmeBigQuery sorguları, CDX index, Tranco CSVurl_pool.csv
2. İndirme ve DoğrulamaGörsel indir, MIME/boyut/çözünürlük kontrol, sha256 dedupurl_pool.csvTemizlenmiş görsel arşivi + images.csv
3. Encode MatrisiHer görsel × her encoder varyantı için sıkıştırmaGörsel arşivi + test matrisi konfigürasyonuSıkıştırılmış çıktılar + encode süreleri
4. Kalite ÖlçümüSSIM, MS-SSIM, Butteraugli hesaplamaOrijinal + sıkıştırılmış çiftlerMetrik skorları
5. Ham SonuçlarCSV/Parquet yazma + özet tablolarTüm ölçüm verileriruns.csv + özet raporlar
Tablo 11: Pipeline aşamaları ve veri akışı

Otomasyon Script İskeleti (Pseudocode)

CONFIG:
  dataset_id       = "gicb-2026-tr"
  target_n_images  = 10000
  encoders         = [mozjpeg, cwebp, avifenc(aom), avifenc(rav1e),
                      avifenc(svt), libvips_heifsave]
  services         = [tinify_api, shortpixel_api]
  quality_ladder   = {
    jpeg: [50, 60, 70, 80, 90],
    webp: [50, 60, 70, 80, 90],
    avif: [30, 40, 50, 60, 70]
  }
  presets = {
    webp: ["photo","picture","drawing","text"],
    avif_speed: [2, 4, 6]
  }

STEP 1: BUILD_URL_POOL()
  domains_tr  = Tranco.top_domains(filter_tld=".tr", limit=K)
  urls_httpa  = HTTPArchive.query_images(domains=domains_tr, month=LATEST)
  urls_cc     = CommonCrawl.cdx_query(tld=".tr", mime="image/*", limit=K2)
  urls_manual = load_whitelist("turkey_high_traffic_domains.txt")
  url_pool    = union(urls_httpa, urls_cc, urls_manual)
  url_pool    = apply_exclusion_rules(url_pool)
  save(url_pool, "url_pool.csv")

STEP 2: DOWNLOAD_AND_VALIDATE()
  for url in url_pool:
    resp = http_get(url, timeout, max_bytes)
    if mime not in allowed_mimes: continue
    if bytes < min_bytes or bytes > max_bytes: continue
    img = decode_image(resp.bytes)
    if img.width < 64 or img.height < 64: continue
    sha = sha256(resp.bytes)
    if sha already_seen: continue
    store_original(img_bytes, sha)
    write_metadata_row(sha, url, domain, mime, width, height, bytes)

STEP 3: RUN_ENCODERS()
  for each original_image in originals:
    for each encoder_variant in test_matrix:
      out_bytes, encode_time, meta = encode(original_image, encoder_variant)
      metrics = compute_metrics(original_image, out_bytes)
      write_result_row(image_id, encoder_variant, out_bytes,
                       encode_time, metrics)

STEP 4: AGGREGATE()
  build_summary_tables(
    segment_by=[format_in, sector, domain, resolution_bucket, alpha_flag]
  )
  export_figures()
  export_report_markdown()

Docker/CI Entegrasyonu

  • Pilot: Tek bir docker compose up benchmark komutuyla 200 görsel koşabilmek.
  • CI (nightly): GitHub Actions / self-hosted runner üzerinde 20 görsel “smoke test”.
  • CI (haftalık): 200 görsel “pilot refresh” koşumu.
  • Tam koşum: 10.000 görsel × matristeki varyant sayısı → CI yerine “batch runner” (kendi sunucu/spot VM).

Not: HTTP Archive verisi BigQuery üzerinde olduğundan, sorgu maliyeti ve ücretsiz kota gibi pratikler rapor eklerinde belirtilmelidir.


Veri Şeması ve Ham Sonuç Depolama

Ham veri iki dosyaya ayrılır: images.csv (görsel metadata) ve runs.csv (her encode denemesi).

images.csv Şeması

KolonTipAçıklama
dataset_idstringVeri seti tanımlayıcısı (ör: “gicb-2026-tr”)
image_idstring (sha256)Görselin benzersiz hash değeri
source_urlstringGörselin indirildiği URL
source_domainstringKaynak alan adı
source_datasetenumhttpa | cc | crawl | tools1984_optin
fetch_timestamp_utcdatetimeİndirme zamanı (UTC)
mime_instringOrijinal MIME türü
bytes_inintegerOrijinal dosya boyutu (byte)
widthintegerGenişlik (piksel)
heightintegerYükseklik (piksel)
has_alphabooleanAlfa kanalı var mı?
content_hintenumphoto | product | ui | icon | illustration | unknown
license_notestringTelif notu (ör: “not redistributed”)
Tablo 12: images.csv veri şeması

runs.csv Şeması

KolonTipAçıklama
run_iduuidKoşum benzersiz tanımlayıcısı
image_idstring (sha256)Kaynak görselin hash değeri
encoder_familyenummozjpeg | cwebp | avifenc | tinify | shortpixel | libvips
encoder_versionstringEncoder sürümü (tekrar üretilebilirlik için)
codecenumjpeg | png | webp | avif
settings_jsonJSON stringKalite/preset/speed parametreleri
bytes_outintegerÇıktı dosya boyutu (byte)
encode_wall_msfloatEncode süresi (milisaniye)
peak_rss_mbfloatPik bellek kullanımı (MB) — opsiyonel
ssimfloatSSIM skoru (0–1)
ms_ssimfloatMS-SSIM skoru
psnrfloatPSNR değeri (dB) — opsiyonel
butterauglifloatButteraugli algısal fark skoru
statusenumok | fail | skipped
error_messagestring (nullable)Hata mesajı (başarısızlık durumunda)
Tablo 13: runs.csv veri şeması

Analiz Planı ve Segmentasyon

Analiz, “genel ortalama” tuzağına düşmeden segmentlenmelidir.

Temel Metrikler

  • compression_ratio = bytes_out / bytes_in
  • “Bit-per-pixel” benzeri normalize ölçüler
  • Butteraugli aralığında “hedef kalite bandı” (ör: 1.0–2.0) için boyut karşılaştırması

Analiz Segmentleri

SegmentKırılım DeğerleriAnaliz Amacı
SektörHaber, E-ticaret, Kamu, FinansSektörel görsel karakteristiklerinin etkisi
Görsel TürüPhoto, Product, UI, Iconİçerik tipine göre format avantajı
Alfa KanalıVar / YokSaydamlık gerektiren görsellerde format performansı
Çözünürlük≤256px, 257–1024px, 1025–2048px, >2048pxBoyut/kalite dengesinin çözünürlüğe bağlılığı
Kaynak FormatJPEG, PNGGiriş formatının çıktı performansına etkisi
Tablo 14: Analiz segmentleri ve kırılım değerleri

Karar Çıktıları

  • Her segment için “Pareto front”: boyut ↓, Butteraugli ↓, süre ↓
  • “Varsayılan öneri seti”: Tools1984 için 2–3 preset kombinasyonu (hızlı / denge / kalite)

Nihai Rapor Şablonu ve Görselleştirme

Planlanan Görselleştirmeler

Şekil / TabloTürİçerik
Şekil 1Akış DiyagramıVeri toplama ve benchmark pipeline’ı (tekrar üretilebilir iş akışı)
Şekil 2Scatter Plot10.000 Türkiye odaklı görselde encoder‑format Pareto karşılaştırması (Butteraugli vs çıktı boyutu)
Şekil 3Bar/Box PlotHaber vs E‑ticaret vs Kamu sitelerinde WebP/AVIF kazanç dağılımı
Şekil 4CDF Grafiği“% kaç görselde WebP/AVIF, JPEG’e göre X% küçüldü?” kümülatif dağılım
Şekil 5Violin PlotSektör bazlı sıkıştırma oranı dağılımları
Tablo XÖneri TablosuTools1984 için önerilen 3 mod (hız/denge/kalite) ve parametreleri
Tablo 15: Nihai raporda yer alacak görselleştirmeler

Rapor Bölüm Yapısı

  1. Giriş ve Kapsam: Neyi ölçüyoruz, neden; Türkiye odağı nasıl sağlandı.
  2. Veri Seti: Kaynaklar, örnekleme, dedup, hariç tutma, veri manifesti.
  3. Metodoloji: Encoder ayarları, ortam, ölçüm metrikleri, tekrar üretilebilirlik.
  4. Sonuçlar (Genel): Format bazlı tradeoff analizleri.
  5. Sonuçlar (Türkiye Segmentleri): Sektör/görsel türü kırılımları.
  6. Tools1984 İçin Öneriler: Varsayılan presetler, UI/UX önerileri, API parametreleri.
  7. Kısıtlar ve Geçerlilik: Temsil sorunu, timeslice etkisi, servislerin black-box olması.
  8. Ekler: Komutlar, Docker hash, CSV şeması, BigQuery sorgu örnekleri.

Teslimatlar ve Zaman Çizelgesi

FazSüre (Öneri)TeslimatKabul Kriteri
Tasarım Kilidi1 haftaProtokol v1, test matrisi v1, etik/KVKK kontrol listesiRepo’da sürüm pin + veri kaynakları net
Pilot Koşum1 haftaN=200–500 görsel pilot sonuçları + performans ölçümüPipeline tek komutla çalışıyor; metrikler üretiliyor
Veri Seti Dondurma1–2 haftaN ≈ 10.000 “image manifest” (URL + hash + meta)Dedup oranı raporlanmış; hariç tutma kuralları uygulanmış
Tam Benchmark1–2 haftaTüm matriste encode + metrik ham sonuçlarıruns.csv tutarlı; hata oranı < hedef
Analiz ve Yayın1 haftaNihai rapor (TR + EN), grafikler, indirilebilir ham ölçümRapor içi tablolar/figürler tamam; metodoloji şeffaf
Tablo 16: Faz planı, teslimatlar ve kabul kriterleri

Kaynak ve Bütçe Yaklaşımı

“Compute bütçesi” uydurulacak bir sayı olmamalı; pilot ölçümle hesaplanmalıdır. Bu yüzden bütçe metodu şöyle tasarlanır:

  1. Pilot koşumda her encoder varyantı için ortalama süreyi ölç: t_jpeg, t_webp, t_avif_aom, t_avif_rav1e, t_avif_svt, t_service_call
  2. Toplam iş: total_variants = N_images × variants_per_image
  3. Tahmini süre: T_total ≈ Σ(N_images × t_variant) / paralellik_katsayısı

Kaynak Gereksinimleri

KalemMinimumÖnerilenNot
Koşum Makinesi16 vCPU / 32 GB RAM32 vCPU / 64 GB RAMAVIF encode ağır olabilir; pilotla doğrula
Depolama500 GB1–2 TBHam + ara çıktı + log
Paralellik4–8 worker8–16 workerIO/CPU dengesi
Servis API KotasıPilot 200 görsel10k görselTinify/ShortPixel kota modeli doğrulanır
İnsan Zamanı1 eng (ops) + 1 eng (analysis)+ 1 eng (data)4–6 hafta bandında
Tablo 17: Kaynak gereksinimleri ve bütçe yaklaşımı

Servis maliyeti (TinyPNG/ShortPixel): Ödeme modeli ve kota değişebilir; raporda “güncel fiyatı sağlayıcıdan doğrulayın” notu düşülür. Pilot aşamada 100–200 görselle maliyet örneği çıkarılıp birim maliyet hesaplanır.


KVKK ve Etik Uyum Çerçevesi

Tools1984 logları kullanılırsa, kişisel veri işleme tanımı ve yükümlülükler için Türkiye mevzuatına (KVKK) uygun bir yaklaşım zorunludur.

Pratik Minimumlar

KuralAçıklama
Ham görsel paylaşmamaKullanıcı görsellerini depolamamak / yeniden dağıtmamak (mümkünse hiç almamak)
Sadece aggregate metrikinput_mime, bytes_in, bytes_out, tool_name, timestamp_bucket, country_segment (IP saklamadan)
Opt-in mekanizmasıÖrnek görsel gerekiyorsa: açık rıza ile “research upload” alanı
AnonimleştirmeBireysel kullanıcıya ilişkilendirilebilecek hiçbir veri raporda yer almaz
Tablo 18: KVKK uyum çerçevesi — pratik minimumlar

Bu bölüm, nihai raporda “Etik ve Uyum” eki olarak genişletilerek yer almalıdır.


Bu çalışma, ölçüm üretmez; yalnızca gerçek veriyi nasıl toplayacağınızı ve nasıl ölçeceğinizi adım adım tarif eder. Tüm metodoloji, veri kaynakları ve pipeline kodları şeffaf ve tekrar üretilebilir şekilde tasarlanmıştır.

💬 Yorumlar (0)

Yorumlar yükleniyor…