Harvard Medical School ve Beth Israel Deaconess Medical Center ekibinin Science’ta 30 Nisan 2026’da yayımladığı çalışma, acil serviste gerçek hasta verileriyle test edilen bir yapay zekanın, hekimleri bir dizi klinik akıl yürütme görevinde geride bıraktığını gösterdi. Araştırmada OpenAI’nin o1 akıl yürütme modeli; triyaj, tanı ve tedavi planlaması gibi aşamalarda insan performansını yakaladı ya da aştı.
Model, Boston’daki bir hastanede acile başvuran 76 vakanın elektronik sağlık kayıtlarını üç farklı zamanda (karşılama triyajı, hekimle ilk temas ve servise/yoğun bakıma yatış öncesi) değerlendirerek olası tanıları ve bir sonraki adımları önerdi. Değerlendirmeleri, hangisinin yapay zekadan hangisinin deneyimli hekimlerden geldiğini bilmeyen bağımsız doktorlar puanladı.
Nasıl test edildi, ne sonuç çıktı?
Bilgi en azken, yani triyaj anında model, “doğru ya da doğruya çok yakın” tanıyı vakaların %67’sinde yakaladı. Aynı koşullarda insan hekimlerin isabeti %50–55 aralığında kaldı. Vaka ilerledikçe ve veriler arttıkça modelin doğruluğu %82’ye çıktı; uzman hekimlerde bu oran %70–79 aralığındaydı. Araştırmacılar geç evre farkların istatistiksel olarak anlamlı olmadığını da vurguluyor.
Çalışmada dikkat çeken gerçek bir örnekte, akciğere pıhtı atan (pulmoner emboli) bir hasta tedaviye başlangıçta yanıt verip sonra kötüleşiyor. Ekip, ilacın işe yaramadığını düşünüyor. Yapay zeka ise kayıtlardaki lupus geçmişine işaret ederek tabloyu bu bağlamda yorumluyor; sonuçta haklı çıkıyor.
Model sadece tanıda değil, yönetim/tedavi planlamasında da kuvvetli bulundu. Beş klinik olguda daha uzun vadeli tedavi kararlarını kıyaslayan deneyde, modelin planları 89 puan alırken, geleneksel kaynaklarla çalışan 46 doktorun ortalaması 34 puanda kaldı. Ayrıca NEJM olgu sunumları gibi zorlu vakalarda da önceki yapay zekalara ve insanlara göre belirgin ilerleme gösterildi.
Neden önemli, sınırları neler?
Uzmanlar, yapay zekanın “karmakarışık” acil servis kayıtlarıyla bile işe yarayabildiğini; buna karşın verilerin yalnızca metin tabanlı olduğunu, gerçek hayatta görüntü, ses ve muayene bulgularının da kritik rol oynadığını hatırlatıyor. Ekip, bu araçların hekimi dışlamadan “ikinci görüş” şeklinde kullanılması ve ileriye dönük klinik çalışmalarla güvenlik/etki analizlerinin yapılması gerektiğini söylüyor.
Kısacası bulgular, acil serviste hızlı ve doğru karar almak için yapay zekanın güçlü bir destek aracı olabileceğini gösteriyor; ancak yaygın kullanıma geçmeden önce, çeşitli hasta gruplarında ve çok merkezli ortamlarda titiz denemelere ihtiyaç var.
Kaynak: www.techspot.com