ISSN 1016-5169 | E-ISSN 1308-4488
pdf
Büyük Dil Modelleri Aort Darlığı Yönetimine Rehberlik Edebilir mi? ChatGPT ve Gemini Yapay Zekanın Karşılaştırmalı Analizi [Turk Kardiyol Dern Ars]
Turk Kardiyol Dern Ars. 2025; 53(8): 599-606 | DOI: 10.5543/tkda.2025.54968

Büyük Dil Modelleri Aort Darlığı Yönetimine Rehberlik Edebilir mi? ChatGPT ve Gemini Yapay Zekanın Karşılaştırmalı Analizi

Ali Sezgin1, Veysel Ozan Tanık1, Murat Akdoğan1, Yusuf Bozkurt Şahin1, Kürşat Akbuğa1, Vedat Hekimsoy1, Çağatay Tunca1, Erhan Saraçoğlu1, Bülent Özlek2
1Kardiyoloji Kliniği, Ankara Etlik Şehir Hastanesi, Ankara, Türkiye
2Kardiyoloji Anabilim Dalı, Muğla Sıtkı Koçman Üniversitesi Tıp Fakültesi, Muğla, Türkiye

Amaç: Aort darlığı (AD) yönetimi; karmaşık klinik, görüntüleme ve risk sınıflandırma verilerinin entegrasyonunu gerektirir. ChatGPT ve Gemini yapay zeka gibi büyük dil modelleri (LLM’ler) sağlık hizmetlerinde umut verici sonuçlar göstermiştir, ancak kapak hastalıklarında, özellikle de AD’deki performansları yeterince değerlendirilmemiştir. Bu çalışma, AD ile ilişkili kılavuz temelli ve klinik senaryo sorularında ChatGPT ile Gemini yapay zekanın sistematik olarak karşılaştırılmasını amaçlamıştır.

Yöntem: 2021 ESC/EACTS kılavuzları temel alınarak, 20 bilgi temelli ve 20 klinik senaryo sorusundan oluşan toplam 40 açık uçlu AD sorusu geliştirildi. Her iki model de bağımsız olarak sorgulandı. Yanıtlar, ikisi kardiyolog olan iki bağımsız değerlendirici tarafından körleme yöntemiyle, yapılandırılmış 4 puanlık bir sistemle puanlandı. Kompozit puanlar kategorize edildi ve karşılaştırmalar Wilcoxon işaretli sıralar testi ve ki-kare testi ile yapıldı.

Bulgular: Gemini yapay zeka, ChatGPT'ye kıyasla anlamlı derecede daha yüksek ortalama toplam puan elde etti (3,96 ± 0,17 vs. 3,56 ± 0,87; P = 0,003). Kılavuzlara tamamen uyumlu yanıtlar Gemini yapay zeka tarafından daha sık verildi (%95,0 vs. %72,5), ancak genel uyum dağılımı geleneksel anlamlılık düzeyine ulaşmadı (P = 0,067). Gemini yapay zeka her iki soru türünde de daha tutarlı performans sergiledi. Değerlendiriciler arası uyum ChatGPT için mükemmel (κ = 0,94), Gemini yapay zeka için ise orta düzeydeydi (κ = 0,66).

Sonuç: Gemini yapay zeka, doğruluk, tutarlılık ve kılavuz uyumu açısından ChatGPT'ye üstünlük göstermiştir. LLM’ler kardiyovasküler bakımda tamamlayıcı araçlar olarak potansiyel taşısa da, uzman denetimi vazgeçilmezdir ve özellikle AD yönetiminde klinik entegrasyon öncesi modellerin daha da geliştirilmesi gerekmektedir.

Anahtar Kelimeler: Aort darlığı, yapay zeka, klinik karar destek, kılavuz uyumu, büyük dil modelleri


Sorumlu Yazar: Bülent Özlek, Türkiye
Makale Dili: İngilizce
×
APA
NLM
AMA
MLA
Chicago
Kopyalandı!
ATIF KOPYALA


Journal Metrics

Journal Citation Indicator: 0.18
CiteScore: 1.1
Source Normalized Impact
per Paper:
0.22
SCImago Journal Rank: 0.348

Hızlı Arama

Copyright © 2025 Türk Kardiyoloji Derneği Arşivi