Value of Clinical Review for AI-Guided Deep Vein Thrombosis Diagnosis With Ultrasound Imaging by Non-Expert Operators
Speranza G, Mischkewitz S, Al-Noor F, Kainz B. NPJ Digital Medicine. 2025. 8(1):135. doi: 10.1038/s41746-025-01518-0.
Abstrak
Tujuan: Trombosis vena dalam atau deep vein trombosis (DVT) merupakan kondisi dengan angka morbiditas, mortalitas, dan beban biaya yang tinggi secara global. Akuisisi citra ultrasonografi di tempat pelayanan (point-of-care ultrasound/POCUS) oleh tenaga kesehatan yang tidak terlatih dalam bidang ultrasonografi, dengan dukungan sistem panduan berbasis artificial intelligence (AI) dan tinjauan citra jarak jauh, diyakini dapat meningkatkan ketepatan waktu serta efisiensi biaya dalam proses diagnosis.
Metode: Penelitian ini menganalisis basis data dari 381 pasien yang dicurigai mengalami DVT, yang menjalani pemeriksaan ultrasonografi dengan panduan AI oleh perawat tanpa pelatihan khusus dalam ultrasonografi, serta pemeriksaan ultrasonografi kompresi standar yang dilakukan oleh ahli sonografi.
Setiap citra hasil pemeriksaan dengan panduan AI ditinjau secara jarak jauh oleh radiolog yang dibutakan (blinded) atau oleh dokter American Emergency Medicine (EM) bersertifikat POCUS. Diagnosis dari peninjau jarak jauh kemudian dibandingkan dengan diagnosis dari pemeriksaan standar.
Luaran primer dari penelitian ini adalah mengukur sensitivitas sistem panduan AI disertai tinjauan klinis. Luaran sekunder meliputi spesifisitas, nilai prediksi positif (PPV), nilai prediksi negatif (NPV), kualitas citra, kesesuaian penilaian kualitas citra antar peninjau, serta kesesuaian penilaian kompresibilitas vena. Data dianalisis menggunakan metode bootstrapping, bootstrapping dengan pembaca kedua untuk setiap pemeriksaan, serta sistem pemungutan suara mayoritas (majority voting).
Hasil: Sebanyak 80% (n=304) dari citra pemeriksaan dinilai memiliki kualitas diagnostik yang memadai. Sensitivitas peninjau dari kelompok radiolog berkisar antara 90–95%, spesifisitas 74–84%, NPV 98–99%, PPV 30–42%, dan potensi penghindaran pemeriksaan ultrasonografi oleh ahli (expert-led) sebesar 39–50%. Tingkat kesesuaian antar peninjau untuk kualitas citra adalah 0,15 dan untuk penilaian kompresibilitas vena sebesar 0,61.
Sementara itu, sensitivitas peninjau dari kelompok dokter EM berkisar antara 95–98%, spesifisitas 97–100%, NPV 99%, PPV 81–100%, dan potensi penghindaran pemeriksaan oleh ahli sebesar 29–38%. Kesesuaian antar peninjau untuk kualitas citra sebesar 0,59 dan untuk kompresibilitas sebesar 0,67.
Kesimpulan: Mendiagnosis DVT pada ekstremitas bawah melalui akuisisi citra yang dipandu AI dengan tinjauan dokter adalah hal yang memungkinkan. Kinerja dipengaruhi oleh keahlian peninjau. Studi ini menunjukkan adanya potensi dampak positif terhadap efisiensi sistem kesehatan, termasuk pengurangan kebutuhan terhadap pemeriksaan ultrasonografi oleh ahli secara aman.
Ulasan Alomedika
Ultrasonografi memungkinkan deteksi deep vein thrombosis (DVT) yang akurat, cepat, dan mudah diakses, khususnya ultrasonografi POCUS. Selain itu, teknologi USG berpotensi untuk mendapatkan manfaat dari integrasi kecerdasan buatan (artificial intelligence/AI).
Penelitian ini meninjau akurasi diagnosis DVT menggunakan USG yang dipandu AI dan dilakukan oleh perawat non-ahli, kemudian dibandingkan dengan hasil USG standar oleh sonografer ahli. Setiap hasil USG berbasis AI ditinjau ulang secara jarak jauh oleh dokter untuk menilai apakah diagnosis tersebut cukup akurat.
Ulasan Metode Penelitian
Metode penelitian ini menggunakan desain studi prospektif, multisenter, single-arm, dan double-blind yang dilakukan di 11 rumah sakit di Inggris, dengan melibatkan 381 pasien berusia ≥18 tahun yang dicurigai mengalami DVT berdasarkan skor pretes seperti Wells’ score. Setiap pasien menjalani pemindaian USG yang dipandu sistem AI oleh perawat non-ahli setelah pelatihan singkat selama 1 jam, menggunakan perangkat portabel yang terhubung ke aplikasi smartphone.
AI memberikan arahan secara real-time terkait posisi probe dan teknik kompresi vena femoralis dan poplitea. Hasil pemindaian ini kemudian ditinjau oleh 2 kelompok penilai, yakni lima radiolog dari Inggris dan lima dokter spesialis EM bersertifikasi POCUS dari Amerika Serikat, yang masing-masing memberikan penilaian terhadap kualitas citra dan status kompresibilitas vena menggunakan skala ACEP.
Analisis statistik dilakukan dengan pendekatan bootstrapping dan majority voting untuk mengukur sensitivitas, spesifisitas, PPV, NPV, serta tingkat kesesuaian antar penilai. Dalam analisis bootstrapping, satu peninjau dipilih secara acak untuk setiap pemindaian sebanyak 500 kali pengulangan untuk meniru praktik klinis. Pada versi kedua, ditambahkan pembaca kedua untuk mencapai konsensus diagnosis, dan bila tidak sepakat, hasil dianggap “indeterminate”.
Selain itu, pendekatan majority voting mengandalkan kesepakatan minimal 3 dari 5 peninjau. Penilaian diagnostik dibandingkan dengan hasil pemeriksaan standar oleh ahli sonografi lokal sebagai acuan kebenaran (ground truth), dan hasil dilaporkan dalam bentuk nilai rerata, deviasi standar, serta signifikansi statistik menggunakan t-test dan uji Fisher, dengan batas signifikansi p ≤ 0,05.
Ulasan Hasil Penelitian
Analisis data dilakukan dari total 381 pasien. Kohort ini mencakup 294 pasien dengan dugaan DVT proksimal, 15 pasien dengan DVT distal (distal vena poplitea), 10 pasien yang memiliki deviasi protokol (misalnya, tes D-Dimer tidak dapat dilakukan), dan 62 pasien yang direkrut sebelum penyesuaian kecil dilakukan pada aplikasi smartphone, yang tidak memengaruhi perolehan data.
Hasil penelitian menunjukkan bahwa dari 381 pasien, mayoritas memiliki Wells’ score sedang, rata-rata usia 63 tahun, dan indeks massa tubuh (IMT) 31 kg/m2, dengan kadar d-dimer rata-rata 2000 ng/mL FEU. Sebanyak 80% hasil pemindaian (n=304) mencapai skor kualitas citra ACEP ≥3, yang berarti cukup untuk penilaian diagnostik.
Penilaian oleh lima radiolog menunjukkan sensitivitas diagnosis antara 90–95%, spesifisitas 74–84%, NPV 98–99%, dan PPV 30–42%. Sekitar 39–50% pemindaian berbasis AI dinilai cukup andal untuk menghindari kebutuhan pemeriksaan lanjutan oleh sonografer ahli. Namun, kesesuaian antar penilai radiolog dalam menilai kualitas citra hanya sebesar 0,15, sementara kesesuaian dalam menilai kompresibilitas vena sebesar 0,61.
Sementara itu, kelompok peninjau dokter spesialis EM dari Amerika Serikat menunjukkan performa diagnostik yang lebih tinggi. Sensitivitas berkisar antara 95–98%, spesifisitas 97–100%, NPV tetap tinggi di 99%, dan PPV meningkat signifikan menjadi 81–100%. Namun, jumlah pemeriksaan lanjutan yang bisa dihindari sedikit lebih rendah, yaitu 29–38%. Kesesuaian antar penilai dalam menilai kualitas citra lebih baik dibanding radiolog (0,59), begitu juga untuk penilaian kompresibilitas vena (0,67).
Seluruh kelompok penilai berhasil mencapai ambang batas sensitivitas utama sebesar ≥90%, yang menunjukkan bahwa penggunaan sistem AI ini, bila dikombinasikan dengan tinjauan klinis yang memadai, secara ilmiah dan klinis layak untuk membantu diagnosis DVT.
Kelebihan Penelitian
Desain studi yang prospektif, multisenter, dan double-blind menjamin objektivitas hasil serta mengurangi potensi bias. Studi ini juga dilaksanakan di 11 rumah sakit NHS di Inggris, yang memperkuat generalisasi temuan ke dalam praktik klinis nyata.
Pendekatan yang mengintegrasikan AI-guided ultrasound dengan pengguna non-ahli, namun tetap mencapai sensitivitas tinggi (≥90%) dalam diagnosis DVT, menunjukkan potensi teknologi ini untuk mengurangi beban layanan kesehatan melalui penghematan waktu dan sumber daya. Selain itu, penerapan Standards for Reporting of Diagnostic Accuracy (STARD) dan penggunaan bootstrapping sebagai metode statistik meningkatkan akurasi estimasi performa diagnostik.
Limitasi Penelitian
Walaupun desain multisenter memperkaya data, studi ini masih merupakan pilot study dengan jumlah sampel yang relatif terbatas (n=381), yang mungkin belum mencerminkan sepenuhnya variasi populasi pasien di praktik. Selain itu, inter-observer agreement pada penilaian kualitas citra termasuk rendah, yang menunjukkan ketidakkonsistenan dalam interpretasi citra, khususnya pada aspek kualitas gambar.
Hasil PPV yang rendah pada kelompok radiolog (30–42%) juga menunjukkan bahwa meskipun sensitivitas dan NPV tinggi, ada risiko overdiagnosis yang dapat menyebabkan pemeriksaan lanjutan yang tidak perlu. Lebih lanjut, meskipun aplikasi AI ini mengurangi kebutuhan sonografer, masih banyak pemindaian tetap menghasilkan penilaian "indeterminate", yang berarti teknologi ini belum sepenuhnya menggantikan peran pemeriksa ahli pada semua scenario klinis.
Aplikasi Hasil Penelitian di Indonesia
Penelitian ini menunjukkan bahwa USG berbasis AI dapat membimbing pengguna non-ahli untuk melakukan pemeriksaan DVT dengan efektif, sehingga tentu sangat berpotensi untuk diterapkan di Indonesia. Ini berlaku terutama di area terpencil atau fasilitas kesehatan dengan sumber daya terbatas, seperti fasilitas Kesehatan yang kekurangan radiolog dan sonografer terlatih.
Dengan pelatihan singkat dan peralatan yang bersifat portabel, tenaga medis umum seperti perawat atau dokter Puskesmas dapat memanfaatkan teknologi ini untuk skrining awal DVT. Hal ini diharapkan akan mempercepat diagnosis, mengurangi kebutuhan rujukan, serta meningkatkan efisiensi layanan kesehatan secara keseluruhan.