Büyük Dil Modelleri Aort Darlığı Yönetimine Rehberlik Edebilir mi? ChatGPT ve Gemini Yapay Zekanın Karşılaştırmalı Analizi

Sezgin, Ali; Tanık, Veysel Ozan; Akdoğan, Murat; Şahin, Yusuf Bozkurt; Akbuğa, Kürşat; Hekimsoy, Vedat; Tunca, Çağatay; Saraçoğlu, Erhan; Özlek, Bülent

Dergi Metrikleri

Impact Factor (2025): 0.6
Scopus: Q3
CiteScore (2024): 1.1
Source Normalized Impact
per Paper:
0.315
SCImago Journal Rank: 0.250

54/2Son Sayı Erken Baskı Arşiv Popüler Makaleler

Hızlı Arama

Yazar ve kurum içinde

Başlık ve özet içinde

Anahtar kelimelerde

Tamamında

pdf

Büyük Dil Modelleri Aort Darlığı Yönetimine Rehberlik Edebilir mi? ChatGPT ve Gemini Yapay Zekanın Karşılaştırmalı Analizi [Turk Kardiyol Dern Ars]

Turk Kardiyol Dern Ars. 2025; 53(8): 599-606 | DOI: 10.5543/tkda.2025.54968

Büyük Dil Modelleri Aort Darlığı Yönetimine Rehberlik Edebilir mi? ChatGPT ve Gemini Yapay Zekanın Karşılaştırmalı Analizi

Ali Sezgin¹, Veysel Ozan Tanık¹, Murat Akdoğan¹, Yusuf Bozkurt Şahin¹, Kürşat Akbuğa¹, Vedat Hekimsoy¹, Çağatay Tunca¹, Erhan Saraçoğlu¹, Bülent Özlek²
¹Kardiyoloji Kliniği, Ankara Etlik Şehir Hastanesi, Ankara, Türkiye
²Kardiyoloji Anabilim Dalı, Muğla Sıtkı Koçman Üniversitesi Tıp Fakültesi, Muğla, Türkiye

Amaç: Aort darlığı (AD) yönetimi; karmaşık klinik, görüntüleme ve risk sınıflandırma verilerinin entegrasyonunu gerektirir. ChatGPT ve Gemini yapay zeka gibi büyük dil modelleri (LLM’ler) sağlık hizmetlerinde umut verici sonuçlar göstermiştir, ancak kapak hastalıklarında, özellikle de AD’deki performansları yeterince değerlendirilmemiştir. Bu çalışma, AD ile ilişkili kılavuz temelli ve klinik senaryo sorularında ChatGPT ile Gemini yapay zekanın sistematik olarak karşılaştırılmasını amaçlamıştır.

Yöntem: 2021 ESC/EACTS kılavuzları temel alınarak, 20 bilgi temelli ve 20 klinik senaryo sorusundan oluşan toplam 40 açık uçlu AD sorusu geliştirildi. Her iki model de bağımsız olarak sorgulandı. Yanıtlar, ikisi kardiyolog olan iki bağımsız değerlendirici tarafından körleme yöntemiyle, yapılandırılmış 4 puanlık bir sistemle puanlandı. Kompozit puanlar kategorize edildi ve karşılaştırmalar Wilcoxon işaretli sıralar testi ve ki-kare testi ile yapıldı.

Bulgular: Gemini yapay zeka, ChatGPT'ye kıyasla anlamlı derecede daha yüksek ortalama toplam puan elde etti (3,96 ± 0,17 vs. 3,56 ± 0,87; P = 0,003). Kılavuzlara tamamen uyumlu yanıtlar Gemini yapay zeka tarafından daha sık verildi (%95,0 vs. %72,5), ancak genel uyum dağılımı geleneksel anlamlılık düzeyine ulaşmadı (P = 0,067). Gemini yapay zeka her iki soru türünde de daha tutarlı performans sergiledi. Değerlendiriciler arası uyum ChatGPT için mükemmel (κ = 0,94), Gemini yapay zeka için ise orta düzeydeydi (κ = 0,66).

Sonuç: Gemini yapay zeka, doğruluk, tutarlılık ve kılavuz uyumu açısından ChatGPT'ye üstünlük göstermiştir. LLM’ler kardiyovasküler bakımda tamamlayıcı araçlar olarak potansiyel taşısa da, uzman denetimi vazgeçilmezdir ve özellikle AD yönetiminde klinik entegrasyon öncesi modellerin daha da geliştirilmesi gerekmektedir.

Anahtar Kelimeler: Aort darlığı, yapay zeka, klinik karar destek, kılavuz uyumu, büyük dil modelleri

Sorumlu Yazar: Bülent Özlek, Türkiye
Makale Dili: İngilizce

ATIF KOPYALA

Tam Metin PDF Atıf dosyası indir RIS EndNote BibTex Medlars Procite Reference Manager Yazara e-posta gönder Benzer makaleler PubMed Google Scholar

Journal Metrics

Journal Citation Indicator: 0.18
CiteScore: 1.1
Source Normalized Impact
per Paper: 0.22
SCImago Journal Rank: 0.348

Hızlı Arama

Yazar ve kurum içinde

Başlık ve özet içinde

Anahtar kelimelerde

Tamamında