Un accordo da 60 milioni di dollari per la fornitura di tutto quanto hanno scritto gli utenti sulla sua piattaforma: è l’accordo siglato dal noto social network Reddit con un’azienda di AI di cui non si conoscono gli estremi. Questo accordo segue la rotta tratteggiata da OpenAI con l’accordo con gli editori Associated Press e Axel Springer, nell’affermarsi di un nuovo modello di business nell’ecosistema dell’IA: la vendita di licenze di contenuto per l’addestramento di modelli di intelligenza artificiale.

L’importanza di questo accordo risiede non solo nel suo valore finanziario (circa il 7% degli introiti della piattaforma del 2023), ma anche nel timing strategico, dato che Reddit si prepara per la quotazione tramite offerta pubblica iniziale (IPO) nel marzo 2024, dopo un anno segnato da numerose controversie legate proprio ai meccanismi di monetizzazione, sin dalla modifica della politica sui prezzi sull’accesso alle API, che ha suscitato malcontento tra utenti e sviluppatori terzi. Iniziative che comunque hanno avuto un impatto positivo, visto che la piattaforma ha visto aumentare i propri ricavi del 20% anno su anno, raggiungendo i 810 milioni di dollari nel 2023.

Ma la realizzazione di questo tipo di accordi solleva questioni fondamentali riguardo la proprietà e l’uso etico dei dati: la decisione di Reddit di aprire la sua piattaforma ricca di contenuti per l’addestramento dell’IA solleva interrogativi su privacy, copyright e possibili mis-appropriazioni di informazioni proprietarie postate dagli utenti. La questione dell’attribuzione dei contenuti diventa ancora più rilevante in contesti come Reddit, dove la proprietà dei dati è una “zona grigia”.

La posizione di Reddit è chiara già nelle parole del CEO Steve Huffman, che nell’aprile 2023 sottolineava il valore del corpus di dati, rifiutando l’idea di concederlo gratuitamente alle maggiori aziende mondiali, optando invece alla negoziazione di accordi strategici. Questi sviluppi portano alla luce la crescente tensione tra le aziende di IA e i fornitori di contenuti e dati sul web, con un numero significativo dei primi 1.000 siti web che bloccano l’indicizzazione di OpenAI e altri. L’accordo di Reddit potrebbe quindi segnare un momento di svolta, spingendo altre piattaforme a considerare vie simili per monetizzare i loro dati in modo etico e legalmente sostenibile, ridisegnando il paesaggio dell’addestramento dell’IA.

Avatar photo

Professore a contratto (in Corporate Reputation, in CyberSecurity e in Data Driven Strategies) è Imprenditore, ha fondato The Fool, la società italiana leader di Customer Insight, co-fondato The Magician un Atelier di Advocacy e Gestione della Crisi, ed è Partner e co-fondatore dello Studio Legale 42 Law Firm. È Presidente di PermessoNegato APS, l'Associazione no-profit che si occupa del supporto alle vittime di Pornografia Non-Consensuale (Revenge Porn) e co-fondatore del Centro Hermes per la Trasparenza e i Diritti Digitali. È stato Future Leader IVLP del Dipartimento di Stato USA sotto Amministrazione Obama nel programma “Combating Cybercrime”, conferenziere, da anni presenta "Ciao Internet!" una seguita video-rubrica in cui parla degli Algoritmi e delle Regole che governano Rete, Macchine e Umani. Padrone di un bassotto che si chiama Bit, continua a non saper suonare il pianoforte, a essere ostinatamente Nerd e irresponsabilmente idealista.