Raditio Ghifiardi: “Data sintetis adalah solusi tantangan data dan etika dalam mengelola risiko AI”

TANPA BISA DIPUNGKIRI teknologi kecerdasan buatan (artificial intelligence/AI) terbukti mampu meningkatkan efisiensi di industri jasa keuangan, termasuk perbankan. Otoritas Jasa Keuangan (OJK) dan Bank Indonesia (BI) dalam “Banking AI Day” Senin (9/9) lalu mengingatkan bahwa penerapan teknologi AI punya sejumlah tantangan, juga risiko.

Pihak OJK menyatakan, penerapan AI akan sangat berisiko bila institusi keuangan gahal menjaga keamanan data dan privasi. “Serangan siber, risiko kebohongan data akan berdampak pada kredibilitas kita semua,” ujar Agusman, Kepala Eksekutif Pengawas Lembaga Pembiayaan, Perusahaan Modal Ventura, Lembaga Keuangan Mikro dan Lembaga Jasa Keuangan Lainnya (PVML) OJK.

Tak hanya itu, kata dia, tantangan utama dalam penerapan AI terkait kepatuhan, di mana sistem AI dapat memastikan kepatuhan terhadap berbagai aturan, regulasi, dan standar yang ada. Regulasi yang berkaitan dengan AI, demikian Agusman, perlu adaptif dan progresif agar dapat mengikuti perkembangan teknologi tanpa menghambat inovasi. Selain itu tantangan yang juga perlu dihadapi dengan baik adalah masalah etika.

Sementara itu, Deputi Gubernur Senior Bank Indonesia (BI) Destry Damayanti mengatakan, selain soal keamanan data pribadi, AI akan sangat tergantung dari data dan informasi yang diperoleh yang pada akhirnya mempengaruhi hasil interpretasi. “Sehingga kalau datanya salah, apalagi banyak data besar [big data] ini tentunya akan membuat interpretasi yang menjadi berbeda,” katanya.

Teknologi, apapun bentuknya, bak pedang bermata dua, tentu punya kekurangan dan kelebihan. Termasuk AI. Untuk mengetahui lebih jauh mengenai bagaimana sebuah institusi atau organisasi mengelola risiko AI, Deddy H. Pakpahan dari digitalbank.id mewawancarai Raditio Ghifiardi, profesional IT dan keamanan siber yang diakui serta pemimpin transformatif masa depan dalam strategi AI/ML. Ghifi panggilan akrabnya adalah pakar keamanan IT, pembicara di banyak konferensi global dan internasional [Oktober mendatang dia juga menjadi salah satu pembicara di ajang Gitex Global, Dubai]. Dia juga dikenal sebagai pendorong inovasi dan kepatuhan dalam sektor telekomunikasi dan perbankan. Dikenal karena memajukan standar industri dan menerapkan solusi serta kerangka kerja keamanan mutakhir. Berikut petikan percakapannya yang berlangsung di Lestari Kafe, di kawasan asri di Tebet Timur, Jakarta.

Bagaimana Anda melihat adopsi teknologi AI di Indonesia saat ini?

Penerapan teknologi kecerdasan buatan (AI) semakin mendominasi berbagai sektor industri, mulai dari keuangan hingga kesehatan, dan memberikan peluang besar untuk meningkatkan efisiensi serta produktivitas. Namun, di balik potensi besar tersebut, muncul tantangan yang tidak bisa diabaikan, terutama terkait dengan keamanan data, privasi, dan bias algoritma.

Data yang digunakan untuk melatih model AI sering kali berasal dari sumber-sumber sensitif yang melibatkan informasi pribadi. Ini membuka pintu bagi serangan siber, kebocoran data, dan potensi pelanggaran privasi. Selain itu, ketergantungan pada data asli yang mungkin sudah mengandung bias dapat memperparah masalah keadilan dalam model AI.

Lantas bagaimana Anda menjawab tantangan ini?

Untuk menjawab tantangan ini, saya kira data sintetis muncul sebagai solusi inovatif. Data sintetis adalah data buatan yang meniru karakteristik data asli tanpa menggunakan informasi pribadi atau sensitif. Dengan demikian, data ini dapat digunakan untuk melatih model AI tanpa risiko pelanggaran privasi atau keamanan. Dalam artikel ini, kita akan membahas bagaimana data sintetis dapat membantu mengelola risiko AI secara lebih efektif.

Data yang digunakan untuk melatih model AI sering kali berasal dari sumber-sumber sensitif yang melibatkan informasi pribadi. Ini membuka pintu bagi serangan siber, kebocoran data, dan potensi pelanggaran privasi. Selain itu, ketergantungan pada data asli yang mungkin sudah mengandung bias dapat memperparah masalah keadilan dalam model AI.

Seberapa penting data sintetis dikaitkan dengan pengelolaan risiko AI?

Data sintetis didefinisikan sebagai data yang dibuat secara artifisial menggunakan algoritma, namun dirancang agar memiliki sifat-sifat yang mirip dengan data asli. Data ini tidak berasal dari manusia atau kejadian nyata, melainkan dari simulasi komputer yang menciptakan dataset baru yang menyerupai kondisi nyata.

Bisa Anda jelaskan lebih rinci lagi manfaat data sintetis dalam pengelolaan AI?

Ada beberapa manfaat. Pertama, soal keamanan data dan privasi. Data sintetis memungkinkan pelatihan model AI tanpa mengorbankan privasi individu. Karena data ini tidak mengandung informasi pribadi, risiko kebocoran data menjadi minimal. Misalnya, dalam sektor kesehatan, data medis sintetis dapat digunakan untuk melatih model AI tanpa perlu mengakses data pasien yang sebenarnya. Dengan demikian, keamanan data tetap terjaga, dan model AI tetap dapat dilatih dengan data yang berkualitas.

Kedua, pengurangan bias dalam algoritma. Salah satu tantangan terbesar dalam AI adalah bias yang tertanam dalam data pelatihan. Data sintetis dapat digunakan untuk menciptakan dataset yang lebih representatif dan adil, dengan memastikan bahwa kelompok yang kurang terwakili di dunia nyata tidak diabaikan dalam pelatihan model.

Ketiga, skalabilitas dan fleksibilitas. Pengumpulan data asli sering kali memakan waktu, mahal, dan terkadang tidak mungkin dilakukan dalam skala besar. Dengan data sintetis, dataset dapat dibuat dalam jumlah besar dan disesuaikan dengan kebutuhan spesifik.

Keempat, uji coba dan simulasi yang aman. Data sintetis memungkinkan perusahaan untuk melakukan uji coba dan simulasi secara lebih luas tanpa risiko kerusakan reputasi akibat kebocoran data.

Salah satu tantangan terbesar dalam AI adalah bias yang tertanam dalam data pelatihan. Data sintetis dapat digunakan untuk menciptakan dataset yang lebih representatif dan adil, dengan memastikan bahwa kelompok yang kurang terwakili di dunia nyata tidak diabaikan dalam pelatihan model.

Lalu bagaimana kita menghasilkan data sintetis?

Data sintetis biasanya dihasilkan melalui beberapa pendekatan algoritmik, seperti Generative Adversarial Networks (GANs) dan Variational Autoencoders (VAEs). Kedua teknik ini memungkinkan pembuatan data yang kompleks dan sangat mirip dengan data asli, namun tidak mengandung informasi yang terkait langsung dengan individu.

Apakah data sintetis bebas risiko? Bagaimana dengan etika penggunaannya?

Meskipun data sintetis menawarkan banyak manfaat, penggunaannya tidak bebas dari tantangan dan risiko. Salah satu tantangan terbesar adalah memastikan bahwa data sintetis yang dihasilkan bebas dari bias.

Saya yakin data sintetis merupakan masa depan dalam pengembangan AI yang lebih aman, efisien, dan adil. Dengan semakin ketatnya regulasi privasi dan meningkatnya kebutuhan akan data yang berkualitas, solusi ini menjadi semakin relevan di berbagai sektor industri.

Jika data sintetis dihasilkan dari data asli yang sudah mengandung bias, model AI yang dilatih pada data ini tetap akan rentan terhadap bias yang sama.

Saya yakin data sintetis merupakan masa depan dalam pengembangan AI yang lebih aman, efisien, dan adil. Dengan semakin ketatnya regulasi privasi dan meningkatnya kebutuhan akan data yang berkualitas, solusi ini menjadi semakin relevan di berbagai sektor industri. ■