Pemodelan biaya pelayanan kesehatan seringkali bermasalah karena didistribusikan secara tidak normal. Biasanya, terdapat sejumlah besar observasi $0 (yaitu, individu yang tidak menggunakan layanan kesehatan apa pun) dan distribusi biaya yang sangat miring di antara pengguna layanan kesehatan karena jumlah individu yang tidak proporsional dengan biaya layanan kesehatan yang sangat tinggi. Pengamatan ini diketahui oleh para ekonom kesehatan, namun faktor yang menyulitkan para pembuat model adalah memetakan biaya penyakit di negara-negara layanan kesehatan tertentu. Misalnya, meskipun biaya perawatan kanker dapat bervariasi berdasarkan stadium penyakit dan apakah kanker telah berkembang; biaya penyakit kardiovaskular akan berbeda jika pasien mengalami infark miokard.
Makalah oleh Zhou dkk. (2023) memberikan tutorial yang bagus tentang cara memperkirakan biaya dengan status model penyakit menggunakan model linier umum. Tutorial berisi langkah-langkah utama.
Langkah 1: Mempersiapkan kumpulan data:
- Kumpulan data biasanya memerlukan penghitungan biaya untuk periode waktu terpisah. Misalnya, jika Anda memiliki data klaim, Anda mungkin memiliki informasi biaya berdasarkan tanggal, namun untuk tujuan analitis mungkin ingin memiliki kumpulan data dengan informasi biaya berdasarkan orang (baris) dengan kolom biaya berdasarkan tahun (atau bulan). Alternatifnya, Anda dapat membuat unit observasi menjadi orang-tahun (atau orang-bulan) dan setiap baris akan menjadi catatan orang-tahun yang terpisah.
- Selanjutnya, seseorang harus menentukan kondisi penyakitnya. Dalam setiap periode waktu, orang tersebut ditugaskan ke suatu keadaan penyakit. Tantangannya termasuk menentukan seberapa granularnya negara bagian tersebut (misalnya hanya MI vs waktu sejak MI) dan bagaimana menangani skenario multi-negara bagian.
- Ketika data disensor, seseorang dapat (i) menambahkan kovariat untuk menunjukkan bahwa data disensor atau (ii) mengecualikan observasi dengan data parsial. Jika data biaya tidak ada (tetapi pasien tidak disensor), beberapa metode imputasi dapat digunakan. Pembentukan periode waktu analisis memerlukan pemetaan terhadap panjang siklus model keputusan, penanganan sensor yang tepat, dan potensi transformasi data.
- Contoh kumpulan data ditunjukkan di bawah ini.
Langkah 2: Pemilihan model:
- Makalah ini merekomendasikan penggunaan model dua bagian dengan kerangka model linier umum (GLM), karena asumsi OLS seputar normalitas dan homoskedastisitas dalam residu sering kali dilanggar.
- Dengan GLM, nilai biaya yang diharapkan ditransformasikan secara non-linier, seperti ditunjukkan pada rumus di bawah ini. Anda diharuskan memperkirakan fungsi tautan dan distribusi istilah kesalahan. “Yang paling populer (kombinasi fungsi link dan distribusi) untuk biaya layanan kesehatan adalah regresi linier (hubungan identitas dengan distribusi Gaussian) dan regresi Gamma dengan link logaritma natural.)
- Untuk menggabungkan GLM dengan model dua bagian, cukup memperkirakan persamaan di atas pada semua nilai positif dan kemudian menghitung model logit atau probit untuk kemungkinan seseorang mempunyai biaya positif.
Langkah 3: Memilih model akhir.
- Pemilihan model terlebih dahulu harus mempertimbangkan kovariat mana yang termasuk dalam regresi yang dapat diperoleh melalui seleksi bertahap menggunakan signifikansi statistik yang telah ditentukan sebelumnya. Namun hal ini dapat mengakibatkan pemasangan yang berlebihan. Teknik seleksi kovariat alternatif mencakup seleksi bertahap bootstrapping dan teknik penalti (misalnya seleksi sudut terkecil dan operator penyusutan, LASSO). Interaksi antar kovariat juga dapat dipertimbangkan.
- Kesesuaian keseluruhan dapat dievaluasi menggunakan mean error, mean absolute error, dan root mean squared error (yang terakhir paling umum digunakan). Model pemasangan yang lebih baik memiliki kesalahan yang lebih kecil.
Langkah 4: Prediksi model
- Meskipun perkiraan biaya mudah untuk dilakukan, dampak kondisi penyakit terhadap biaya lebih kompleks. Para penulis merekomendasikan hal berikut:
Untuk model nonlinier satu bagian atau model dua bagian, efek marjinal dapat diperoleh dengan menggunakan prediksi daur ulang. Hal ini mencakup dua langkah berikut: (1) menjalankan dua skenario pada populasi sasaran dengan menetapkan status penyakit yang diinginkan menjadi (a) ada (misalnya kanker yang kambuh) atau (b) tidak ada (misalnya tidak ada kanker yang kambuh); (2) menghitung selisih biaya rata-rata antara kedua skenario. Kesalahan standar dari perbedaan rata-rata dapat diperkirakan dengan menggunakan bootstrapping.
Para penulis juga memberikan contoh ilustratif dalam menerapkan pendekatan ini pada pemodelan biaya rumah sakit yang terkait dengan kejadian kardiovaskular di Inggris. Penulis juga menyediakan kode contoh dalam R dan Anda dapat mengunduhnya Di Sini.