Kemik yaşı (BA) tahmini, 60+ yıldır deneyimli radyologların manuel olarak yaptığı zaman alıcı bir iştir. 2017'den itibaren yapay zeka modelleri bu işi 5 saniyede yapmaya başladı — ve doğrulukları artık uzman radyologlarla yarışıyor.
Neden AI kemik yaşı için ideal?
Geleneksel Greulich-Pyle ve Tanner-Whitehouse 2/3 yöntemleri:
- Uzman radyoloji eğitimi gerektirir (1-2 dakika/görüntü)
- Uzmanlar arası %95 uyum (yani ±0.5 yıl fark normal)
- Aynı uzmanın test-retest tutarlılığı ±0.3 yıl
- Türkiye'de pediatrik radyolog sayısı: ~300 (tahminî)
AI sistemleri:
- 3-5 saniye süre
- %100 tutarlılık (aynı görüntü her zaman aynı sonuç)
- ±0.3-0.5 yıl ortalama mutlak hata (MAE)
- 7/24 erişim, geniş ölçeklenebilir
Lider AI modelleri (2026 itibariyle)
1. BoneXpert (Visiana, Danimarka)
İlk FDA-onaylı AI BA sistemi (2009 Class II). 2026'da v3 sürümünde:
- 6 ay - 17 yaş aralığı
- Greulich-Pyle ve TW2-RUS skorları
- MAE: 0.42 yıl (manuel radyolog: ~0.5 yıl)
- 100.000+ klinik kullanım, 30+ Avrupa hastanesi
- Pediatrik endokrinoloji rutinine entegre
2. RSNA Pediatric Bone Age Challenge (2017)
12.611 etiketli el röntgenden oluşan açık veri seti — derin öğrenme topluluğunun patlaması. Kazanan ekibin (16BitInc) modeli ResNet50 + InceptionV3 ensemble + MAE 4.265 ay (≈0.36 yıl) — bu o yıl en iyi rapor edildi.
3. DeepASA (Stanford, 2020)
- 14.036 el röntgeni eğitim verisi
- Vision Transformer (ViT) tabanlı
- MAE: 0.39 yıl
- Open-source kod (PyTorch)
4. Visual Genome BA Model (Google Research, 2024)
- 50.000+ röntgen (privately curated)
- Multi-task: BA + skeletal anomali tespiti
- MAE: 0.31 yıl (rapor edilen, prospektif klinik validasyon devam ediyor)
5. Türkiye yerel modelleri
Henüz FDA/CE onaylı bir Türk modeli yok. İstanbul Tıp Fakültesi + Bilkent Üniversitesi ortak çalışmaları (2024-2025) 0.45 yıl MAE raporlamış (n=2.300 Türk çocuğu).
Doğruluk metrikleri — nasıl yorumlanır?
MAE (Mean Absolute Error)
Tahmin - gerçek farkının mutlak değerinin ortalaması. 0.4 yıl MAE demek ki tüm tahminlerin yarısı ±0.4 yıl içinde, %95'i ±1.0 yıl içinde.
Population validation
Test set'i farklı yaş gruplarına, etnik kökenlere, hastalık durumlarına yayılmış mı? "Healthy white American boys 5-18" eğitiminde %95 başarı, etnisite değişince %70'e düşer (bias problemi).
Out-of-distribution performance
Pat patolojik (KAH, Turner, akondroplazi) görüntülerde performans dramatik düşer. 2026'da hâlâ "rare disease" performansı zayıf.
Klinik validasyon — ne soruyoruz?
AI'ın "ne kadar doğru" sorusu sadece MAE değildir. Daha kritik sorular:
- Klinisyen karar değişti mi? AI sonucu pediatrik endokrinoloğun karar verme süresini azalttı, kararını değiştirdi mi?
- Kullanılabilirlik: Düşük doz / hareket bulanıklığı olan görüntülerde ne kadar güvenilir?
- Bias: Etnik, yaş, cinsiyet alt gruplarında performans nasıl?
- Adversarial robust: Görüntüye gürültü eklendiğinde dramatik değişiyor mu?
- Explainable AI: Hangi anatomik bölgenin (radius epifizi vs karpal kemikler) modeli yönlendirdiğini gösterebiliyor mu?
Sınırlamalar (2026 itibariyle)
- Pediatrik radyolog yerini almıyor — onun asistanı. Patoloji tespiti (kırık, kist, displazi) hâlâ insan görevi.
- Açıklanabilirlik düşük — siyah kutu. Pediatrik endokrinolog "%neye göre 12.3 yıl?" sorduğunda AI cevap veremez (heat-map dışında).
- Eğitim verisi etnik bias'ı — çoğu model ABD/Avrupa örnekli, Asya/Türkiye popülasyonunda test edilmemiş.
- Regülasyon karmaşası — FDA Class II ≠ CE-MDR Class IIa ≠ Türkiye TİTCK onayı.
- Veri gizliliği — el röntgeni "biyometrik veri" sınıfında, KVKK ve GDPR özel önlem ister.
Türkiye'de AI BA kullanımı — şu an
- Hastane uygulaması: Yok, FDA onaylı bir sistem ithal edilmedi.
- Araştırma: Bilkent, İTÜ, İstanbul Üniversitesi prototip seviyesi.
- Yasal: TİTCK Medikal Cihaz Sınıflandırma — Class IIa onayı için klinik validasyon çalışması şart.
Çocuk Gelişim'in AI önizlemesi
Bizim AI Kemik Yaşı aracımız araştırma önizleme seviyesinde, klinik karar destek değil. Roadmap'imiz:
- ✅ Faz 0 (2026 Mayıs): Mock prediction prototype, kullanıcı deneyimi testi
- 🔄 Faz 1 (2026 Q3): ResNet-50 + RSNA 2017 veri seti ile MAE 0.5 yıl hedef
- 🔄 Faz 2 (2027 Q1): Türk popülasyonu fine-tuning, IRB onaylı klinik validasyon çalışması (n=500)
- 🔄 Faz 3 (2027-2028): TİTCK Class IIa onayı + ticari klinik kullanım
Bu yola çıkmadan önce etik kurul onayı + KVKK uyumu + pediatrik radyolog süpervizyonu şart.
Sık sorulanlar
AI radyologun yerini alacak mı?
Hayır, kısa-orta vadede. AI triage + ön rapor rolünde olacak; pediatrik radyolog onayı klinik karar için zorunlu. NEJM 2024 raporu: AI + radyolog hibrit modelinde hata yalnız radyologdan %30 daha az.
El röntgeni yerine cep telefonu ile kemik yaşı tahmin eden uygulamalar var?
Var ama klinik kullanım için uygun değil. Cilt fotoğrafından kemik yaşı tahmini yapan modeller %60 doğrulukta kalır — radyografi olmadan iç anatomik yapı görülmez.
AI BA Khamis-Roche'tan daha doğru mu?
Karşılaştırma yanlış — farklı veri kullanırlar. AI = el röntgeni (BA), Khamis-Roche = boy + kilo + MPH. Bayley-Pinneau gibi BA-bazlı tahminlere AI BA tahminini girdi olarak verebilirsiniz; tüm zincirin hatası birikir.
Sonuç
2026 itibariyle AI kemik yaşı sistemleri uzman radyolog performansına eşdeğer veya daha iyi doğrulukta. Ama klinik kullanım için validation + regülasyon + explainability + bias kontrolü gerekli. Bizim Bone-Age AI prototipimizi ücretsiz Premium ile deneyebilir, Türkiye'nin ilk validated klinik AI BA sistemini birlikte inşa edebiliriz.