[ad_1]
ChatGPT e altri modelli generativi profondi si stanno rivelando imitazioni sorprendenti. Queste top model AI possono sfornare poesie, finire sinfonie e creare nuovi video e immagini imparando automaticamente da milioni di esempi di lavori precedenti. Questi strumenti estremamente potenti e versatili eccellono nel generare nuovi contenuti che assomigliano a tutto ciò che hanno visto prima.
Ma come affermano gli ingegneri del MIT in un nuovo studio, la somiglianza non è sufficiente se si vuole davvero innovare nelle attività di ingegneria.
“I modelli generativi profondi (DGM) sono molto promettenti, ma anche intrinsecamente imperfetti”, afferma l’autore dello studio Lyle Regenwetter, uno studente laureato in ingegneria meccanica al MIT. “L’obiettivo di questi modelli è imitare un set di dati. Ma come ingegneri e designer, spesso non vogliamo creare un progetto che sia già disponibile”.
Lui e i suoi colleghi sostengono che se gli ingegneri meccanici vogliono l’aiuto dell’intelligenza artificiale per generare nuove idee e progetti, dovranno prima focalizzare quei modelli oltre la “somiglianza statistica”.
“Le prestazioni di molti di questi modelli sono esplicitamente legate a quanto statisticamente simile un campione generato è rispetto a ciò che il modello ha già visto”, afferma il coautore Faez Ahmed, assistente professore di ingegneria meccanica al MIT. “Ma nel design, essere diversi potrebbe essere importante se si vuole innovare.”
Nel loro studio, Ahmed e Regenwetter rivelano le insidie dei modelli generativi profondi quando hanno il compito di risolvere problemi di progettazione ingegneristica. In un caso di studio sulla progettazione di telai di biciclette, il team mostra che questi modelli finiscono per generare nuovi telai che imitano i progetti precedenti ma vacillano in termini di prestazioni e requisiti ingegneristici.
Quando i ricercatori hanno presentato ai DGM lo stesso problema del telaio della bicicletta che avevano progettato specificatamente con obiettivi focalizzati sull’ingegneria, piuttosto che solo con la somiglianza statistica, questi modelli hanno prodotto telai più innovativi e con prestazioni più elevate.
I risultati del team mostrano che i modelli di intelligenza artificiale incentrati sulla somiglianza non si traducono del tutto quando applicati a problemi di ingegneria. Ma, come sottolineano anche i ricercatori nel loro studio, con un’attenta pianificazione delle metriche adeguate al compito, i modelli di intelligenza artificiale potrebbero essere un efficace “copilota” di progettazione.
“Si tratta di come l’intelligenza artificiale può aiutare gli ingegneri a essere migliori e più veloci nella creazione di prodotti innovativi”, afferma Ahmed. “Per fare ciò, dobbiamo prima comprendere i requisiti. Questo è un passo in quella direzione”.
Il nuovo studio del team è apparso recentemente online e sarà pubblicato nell’edizione cartacea della rivista di dicembre Progettazione assistita da computer. La ricerca è una collaborazione tra scienziati informatici del Watson AI Lab del MIT-IBM e ingegneri meccanici del DeCoDe Lab del MIT. I coautori dello studio includono Akash Srivastava e Dan Gutreund del MIT-IBM Watson AI Lab.
Inquadrare un problema
Come scrivono Ahmed e Regenwetter, i DGM sono “potenti studenti, che vantano capacità senza pari” di elaborare enormi quantità di dati. DGM è un termine ampio per qualsiasi modello di machine learning addestrato ad apprendere la distribuzione dei dati e quindi a utilizzarlo per generare nuovi contenuti statisticamente simili. Il popolarissimo ChatGPT è un tipo di modello generativo profondo noto come modello linguistico di grandi dimensioni, o LLM, che incorpora funzionalità di elaborazione del linguaggio naturale nel modello per consentire all’app di generare immagini e discorsi realistici in risposta a query conversazionali. Altri modelli popolari per la generazione di immagini includono DALL-E e Stable Diffusion.
Grazie alla loro capacità di apprendere dai dati e generare campioni realistici, i DGM sono stati sempre più applicati in molteplici ambiti ingegneristici. I progettisti hanno utilizzato modelli generativi profondi per disegnare nuovi telai di aerei, progetti di metamateriali e geometrie ottimali per ponti e automobili. Ma nella maggior parte dei casi, i modelli hanno imitato i progetti esistenti, senza migliorare le prestazioni dei progetti esistenti.
“I progettisti che lavorano con i DGM sentono la mancanza di questa ciliegina sulla torta, ovvero l’adeguamento dell’obiettivo formativo del modello per concentrarsi sui requisiti di progettazione”, afferma Regenwetter. “Quindi, le persone finiscono per generare progetti molto simili al set di dati.”
Nel nuovo studio, delinea le principali insidie nell’applicazione dei DGM a compiti di ingegneria e mostra che l’obiettivo fondamentale dei DGM standard non tiene conto dei requisiti di progettazione specifici. Per illustrare ciò, il team invoca un semplice caso di progettazione del telaio di una bicicletta e dimostra che i problemi possono sorgere già nella fase di apprendimento iniziale. Man mano che un modello apprende da migliaia di telai di biciclette esistenti di varie dimensioni e forme, potrebbe considerare due telai di dimensioni simili come aventi prestazioni simili, quando in realtà una piccola disconnessione in un telaio è troppo piccola per essere registrata come una differenza significativa nella somiglianza statistica. metriche: rende il frame molto più debole dell’altro frame visivamente simile.
Oltre la “vaniglia”
I ricercatori hanno portato avanti l’esempio della bicicletta per vedere quali progetti un DGM avrebbe effettivamente generato dopo aver imparato dai progetti esistenti. Per prima cosa hanno testato una rete avversaria generativa convenzionale “vanilla”, o GAN, un modello che è stato ampiamente utilizzato nella sintesi di immagini e testo ed è sintonizzato semplicemente per generare contenuti statisticamente simili. Hanno addestrato il modello su un set di dati di migliaia di telai di biciclette, compresi modelli prodotti commercialmente e telai unici meno convenzionali progettati da hobbisti.
Una volta che il modello ha appreso dai dati, i ricercatori gli hanno chiesto di generare centinaia di nuovi telai di bicicletta. Il modello ha prodotto disegni realistici che somigliavano a telai esistenti. Ma nessuno dei progetti ha mostrato un miglioramento significativo nelle prestazioni, e alcuni erano addirittura leggermente inferiori, con telai più pesanti e strutturalmente meno solidi.
Il team ha poi effettuato lo stesso test con altri due DGM appositamente progettati per compiti di ingegneria. Il primo modello è quello che Ahmed aveva precedentemente sviluppato per generare progetti di profili alare ad alte prestazioni. Ha costruito questo modello per dare priorità alla somiglianza statistica e alle prestazioni funzionali. Quando applicato al compito del telaio della bicicletta, questo modello ha generato progetti realistici che erano anche più leggeri e resistenti dei progetti esistenti. Ma produceva anche telai fisicamente “non validi”, con componenti che non si adattavano perfettamente o si sovrapponevano in modi fisicamente impossibili.
“Abbiamo riscontrato progetti significativamente migliori rispetto al set di dati, ma anche progetti geometricamente incompatibili perché il modello non era incentrato sul rispetto dei vincoli di progettazione”, afferma Regenwetter.
L’ultimo modello testato dal team è stato quello costruito da Regenwetter per generare nuove strutture geometriche. Questo modello è stato progettato con le stesse priorità dei modelli precedenti, con l’aggiunta di vincoli di progettazione e dando priorità ai telai fisicamente praticabili, ad esempio, senza disconnessioni o barre sovrapposte. Quest’ultimo modello ha prodotto i progetti più performanti, che erano anche fisicamente fattibili.
“Abbiamo scoperto che quando un modello va oltre la somiglianza statistica, può produrre progetti migliori di quelli già disponibili”, afferma Ahmed. “È una prova di ciò che l’intelligenza artificiale può fare, se viene addestrata esplicitamente su un compito di progettazione.”
Ad esempio, se i DGM potessero essere costruiti con altre priorità, come prestazioni, vincoli di progettazione e novità, Ahmed prevede che “numerosi campi dell’ingegneria, come la progettazione molecolare e le infrastrutture civili, ne trarrebbero grandi benefici. Facendo luce sulle potenziali insidie del fare affidamento esclusivamente sulla somiglianza statistica, speriamo di ispirare nuovi percorsi e strategie nelle applicazioni di intelligenza artificiale generativa al di fuori dei contenuti multimediali”.
[ad_2]
Source link