Privasi diferensial (DP) memberikan jaminan yang kuat dan ketat secara matematis bahwa informasi individu yang sensitif dalam kumpulan data tetap terlindungi, bahkan ketika kumpulan data digunakan untuk analisis. Sejak DP dimulainya hampir dua dekade lalupara peneliti telah mengembangkan versi pribadi yang berbeda dari berbagai metode analisis data dan pembelajaran mesin, mulai dari penghitungan statistik sederhana hingga menyempurnakan model AI yang kompleks. Namun, persyaratan bagi organisasi untuk memprivatisasi setiap teknik analisis bisa jadi rumit, memberatkan, dan rawan kesalahan.
Model AI generatif seperti Gemini menawarkan solusi yang lebih sederhana dan efisien. Daripada memodifikasi setiap metode analisis secara terpisah, mereka membuat satu versi sintetis pribadi dari kumpulan data asli. Data sintetis ini merupakan penggabungan pola data umum, tidak berisi detail unik dari setiap pengguna. Dengan menggunakan algoritma pelatihan privat yang berbeda, seperti DP-SGDuntuk menyempurnakan model generatif pada kumpulan data asli, kami memastikan kumpulan data sintetis bersifat pribadi dan sangat mewakili data sebenarnya. Teknik atau pemodelan analitis non-pribadi standar apa pun kemudian dapat dilakukan pada kumpulan data pengganti yang aman (dan sangat representatif) ini, sehingga menyederhanakan alur kerja. Penyempurnaan DP adalah alat serbaguna yang sangat berharga untuk menghasilkan kumpulan data terkontrol bervolume tinggi dalam situasi di mana akses ke data representatif dan berkualitas tinggi tidak tersedia.
Sebagian besar karya yang diterbitkan tentang pembuatan data sintetis pribadi berfokus pada keluaran sederhana seperti bagian teks pendek atau gambar individual, namun aplikasi modern yang menggunakan data multi-modal (gambar, video, dll.) mengandalkan pemodelan sistem dan perilaku dunia nyata yang kompleks, yang tidak dapat ditangkap secara memadai oleh data teks sederhana dan tidak terstruktur.
Kami memperkenalkan metode baru untuk menghasilkan album foto sintetis secara pribadi sebagai cara untuk mengatasi kebutuhan akan versi sintetis dari kumpulan data berbasis gambar yang kaya dan terstruktur. Tugas ini menghadirkan tantangan unik selain menghasilkan gambar individual, khususnya kebutuhan untuk menjaga koherensi tematik dan konsistensi karakter di beberapa foto dalam album berurutan. Metode kami didasarkan pada penerjemahan data gambar yang kompleks ke teks dan sebaliknya. Hasil kami menunjukkan bahwa proses ini, dengan jaminan DP yang ketat diaktifkan, berhasil mempertahankan informasi semantik tingkat tinggi dan koherensi tematik dalam kumpulan data yang diperlukan untuk aplikasi analisis dan pemodelan yang efektif.