Anthropic propone alle principali aziende di intelligenza artificiale del mondo di trovare un modo coordinato per sospendere lo sviluppo di sistemi di intelligenza artificiale avanzati, avvertendo che la tecnologia sta migliorando così rapidamente che esiste il rischio che gli esseri umani ne perdano il controllo.
Giovedì, la società dietro il chatbot Claude ha affermato in un post sul blog che, poiché l’intelligenza artificiale all’avanguardia diventa sempre più veloce nell’esecuzione dei compiti, “sarebbe positivo per il mondo avere la possibilità di rallentare o mettere temporaneamente in pausa” il suo sviluppo.
Anthropic ha affermato che il suo istituto di ricerca interno intende esplorare la questione in collaborazione con altri e “intraprendere azioni” per aiutare a costruire sistemi per un rallentamento o una pausa credibili, senza essere più specifici.
Il rivale antropico OpenAI ha sostenuto un approccio diverso in un rapporto pubblicato mercoledì, affermando che “i governi democratici – non le società private che agiscono da sole – devono in ultima analisi determinare le regole, le garanzie e i meccanismi di responsabilità”.
“La nostra opinione è che le decisioni sul ritmo dell’innovazione dell’intelligenza artificiale non dovrebbero essere lasciate a nessun laboratorio, azienda o gruppo di interesse speciale”, ha affermato.
I modelli di intelligenza artificiale stanno diventando sempre più veloci, con rapidi aumenti della velocità con cui possono eseguire autonomamente attività software come la codifica, ha affermato Anthropic nel suo post. Sulla base delle tendenze attuali e con una potenza di calcolo sufficiente, un sistema di intelligenza artificiale potrebbe essere in grado di progettare e sviluppare il proprio successore, in quello che è noto come “auto-miglioramento ricorsivo”.
L’intelligenza artificiale autocostruita rappresenterebbe un’importante pietra miliare tecnologica che porterebbe benefici nella scienza, nella sanità e in altri settori, ha affermato Anthropic, ma “potrebbe anche aumentare il rischio che gli esseri umani perdano il controllo sui sistemi di intelligenza artificiale”.
Alcuni esponenti del settore tecnologico avvertono da tempo di un simile scenario.
Il post di Anthropic arriva dopo un diverso avvertimento di questa settimana da parte di un team di ricercatori dell’Università di Toronto che ha mostrato come gli strumenti di intelligenza artificiale potrebbero essere utilizzati per creare un nuovo tipo di “worm” di intelligenza artificiale che adatta la sua strategia di hacking mentre si diffonde da dispositivo a dispositivo e prende il controllo di una vasta rete informatica.
“Penso che sia davvero importante che le persone capiscano che non sono solo i modelli linguistici più grandi e potenti a porre problemi di sicurezza”, ha detto in un’intervista il ricercatore capo Nicolas Papernot.
Gli autori del post di Anthropic, il cofondatore dell’azienda Jack Clark e Marina Favaro, direttrice del suo istituto di ricerca, hanno affermato che la pausa sarà utilizzata per consentire alle “strutture sociali e alla ricerca sull’allineamento” di tenere il passo con i progressi dell’intelligenza artificiale. L’allineamento è una scorciatoia industriale per garantire che la tecnologia corrisponda ai valori e alle intenzioni umane.
Il coordinamento proposto consentirebbe ai laboratori avanzati di intelligenza artificiale di verificare che i rivali globali abbiano effettivamente fermato o rallentato il loro lavoro, “e che un cattivo attore non potrebbe sfruttare gli auspici di un rallentamento coordinato per andare avanti in segreto”.
La società ha affermato che è necessario un meccanismo globale coordinato perché, senza di esso, un rallentamento nello sviluppo dell’intelligenza artificiale potrebbe consentire agli attori “meno cauti” di recuperare terreno e aumentare la pressione su aziende e governi mentre prendono scelte difficili sulla sicurezza dell’intelligenza artificiale.
I timori che i sistemi avanzati di intelligenza artificiale possano sfuggire al controllo umano e causare danni alla società sono aumentati man mano che la tecnologia diventa sempre più potente. All’inizio di quest’anno, il modello Mythos di Anthropic ha provocato un’onda d’urto in tutti i settori, compresi quello bancario e del software, con la sua capacità di individuare vulnerabilità nel codice esistente.
Ma la regolamentazione è stata lenta, soprattutto negli Stati Uniti, dove hanno sede la maggior parte dei principali laboratori di intelligenza artificiale. Un ordine esecutivo dell’amministrazione Trump all’inizio di questa settimana ha posto l’onere sui laboratori stessi, chiedendo loro di presentare volontariamente i loro modelli più capaci per i test governativi sulla sicurezza informatica prima del rilascio pubblico.
Attenzione alla sicurezza
Anche i ricercatori sull’intelligenza artificiale hanno già sollecitato una pausa, ma hanno avuto scarso successo. Elon Musk, proprietario del laboratorio di intelligenza artificiale xAI, è stato tra i sostenitori di una spinta nel 2023 da parte dell’organizzazione no-profit Future of Life Institute per fermare lo sviluppo dell’intelligenza artificiale per sei mesi per dare tempo ai guardrail di sicurezza.
Anthropic si è da tempo posizionato come un laboratorio di intelligenza artificiale incentrato sulla sicurezza. All’inizio di quest’anno, ha rifiutato di consentire alle forze armate statunitensi di utilizzare i suoi modelli per la sorveglianza interna e armi completamente autonome, provocando una reazione negativa da parte del governo, che l’ha inserito in una lista nera di sicurezza nazionale, che entrerà in vigore più tardi nel 2026.
Il post di Anthropic arriva mentre la società e OpenAI, creatore di ChatGPT, corrono per vendere azioni sul mercato azionario, in un’IPO che potrebbe valutare Anthropic a quasi un trilione di dollari.
Papernot ha informato le autorità canadesi di sicurezza informatica prima di pubblicare il suo rapporto, che mostra come i ricercatori hanno sviluppato il worm in un laboratorio utilizzando uno strumento di intelligenza artificiale “open source” a cui gli sviluppatori di software possono accedere e modificare facilmente a basso costo.
“In passato, gli aggressori informatici si concentravano su obiettivi di altissimo valore”, ha affermato. “Sistemi bancari, ospedali, reti elettriche, sistemi di trattamento delle acque, scuole”.
Papernot ha convenuto che dovrebbe esserci una maggiore collaborazione tra aziende, agenzie governative e ricercatori accademici per sviluppare contromisure mentre gli strumenti di hacking basati sull’intelligenza artificiale potenziano la ricerca delle vulnerabilità dei computer.
“Quel vecchio laptop che hai nel seminterrato e che non controlli regolarmente non sembra un obiettivo di grande valore, ma può essere utilizzato come trampolino di lancio per attaccare questi obiettivi di valore più elevato”, ha detto. “Tutto ciò che è connesso a Internet è ora a rischio a causa di quanto bassi siano diventati i costi per sferrare questi attacchi informatici”.




