top of page

Come funzionano e come si generano i deepfake?

  • giuliamagnabosco5
  • 14 apr 2025
  • Tempo di lettura: 2 min

Aggiornamento: 9 mag 2025

Partiamo col dire come effettivamente funzionano i deepfake.

I deepfake sono il risultato dell'applicazione di tecniche avanzate di intelligenza artificiale, in particolare l'apprendimento profondo (deep learning), per creare contenuti audiovisivi falsificati ma altamente realistici. Le principali tecnologie impiegate includono:

1. Reti Generative Avversarie (GAN)

Le GAN sono composte da due reti neurali: una generativa, che crea nuovi contenuti, e una discriminativa, che valuta la loro autenticità. Queste reti "competono" tra loro: la generativa cerca di produrre contenuti sempre più realistici, mentre la discriminativa cerca di distinguere tra contenuti reali e falsi. Questo processo iterativo migliora progressivamente la qualità dei deepfake .

2. Autoencoder

Gli autoencoder sono reti neurali utilizzate per comprimere e decomprimere dati. Nel contesto dei deepfake, vengono impiegati per analizzare e ricostruire volti umani. Un autoencoder apprende a rappresentare un volto in uno spazio latente e può manipolare queste rappresentazioni per generare nuove immagini o video con diverse espressioni facciali o angolazioni .

3. Sincronizzazione Labiale e Clonazione Vocale

Per i deepfake audio, vengono utilizzate tecniche di clonazione vocale basate su reti neurali, che analizzano e replicano le caratteristiche vocali di una persona. Questo permette di generare registrazioni audio in cui una persona sembra dire cose che non ha mai detto. La sincronizzazione labiale, invece, abbina l'audio generato al movimento delle labbra nel video, migliorando ulteriormente il realismo del deepfake

E invece come si generano? Ve lo siete mai chiesti?

La creazione di un deepfake coinvolge diversi passaggi:

Raccolta di Dati: Si raccolgono immagini, video e registrazioni vocali della persona da imitare. Maggiore è la quantità e la varietà dei dati, più realistico sarà il risultato finale.

Addestramento del Modello: Utilizzando le tecniche descritte, si addestra un modello di intelligenza artificiale (come una GAN o un autoencoder) sui dati raccolti. Questo processo può richiedere una notevole potenza di calcolo e tempo.

Generazione del Contenuto: Una volta addestrato, il modello può generare nuovi contenuti, come video o audio, in cui la persona sembra compiere azioni o dire cose che in realtà non ha mai fatto.

Post-Produzione: Per migliorare ulteriormente il realismo, i contenuti generati possono essere sottoposti a operazioni di editing, come la correzione dell'illuminazione, la sincronizzazione labiale e l'aggiunta di rumori di fondo realistici.

 
 
 

Commenti


bottom of page