banner
Casa / Blog / Apprendimento delle equazioni alle derivate parziali emergenti in uno spazio emergente appreso
Blog

Apprendimento delle equazioni alle derivate parziali emergenti in uno spazio emergente appreso

Dec 20, 2023Dec 20, 2023

Nature Communications volume 13, numero articolo: 3318 (2022) Citare questo articolo

3496 accessi

6 citazioni

1 Altmetrico

Dettagli sulle metriche

Proponiamo un approccio per apprendere equazioni di evoluzione efficaci per grandi sistemi di agenti interagenti. Ciò è dimostrato su due esempi, un sistema ben studiato di oscillatori di forma normale accoppiati e un esempio biologicamente motivato di neuroni accoppiati di tipo Hodgkin-Huxley. Per tali tipi di sistemi non esiste una coordinata spaziale ovvia in cui apprendere leggi di evoluzione efficaci sotto forma di equazioni alle derivate parziali. Nel nostro approccio, raggiungiamo questo obiettivo imparando a incorporare le coordinate dai dati delle serie temporali del sistema utilizzando l'apprendimento multiplo come primo passo. In queste coordinate emergenti, mostreremo quindi come è possibile apprendere equazioni differenziali alle derivate parziali efficaci, utilizzando reti neurali, che non solo riproducono la dinamica dell'insieme di oscillatori, ma catturano anche le biforcazioni collettive quando i parametri del sistema variano. L'approccio proposto integra quindi l'estrazione automatica e guidata dai dati delle coordinate spaziali emergenti che parametrizzano la dinamica dell'agente, con l'identificazione assistita dall'apprendimento automatico di una descrizione PDE emergente della dinamica in questa parametrizzazione.

Modellare il comportamento dinamico di grandi sistemi di agenti interagenti rimane un problema impegnativo nell'analisi dei sistemi complessi. A causa dell’ampia dimensione dello spazio degli stati di tali sistemi, storicamente è stato un obiettivo di ricerca in corso costruire utili modelli di ordine ridotto con cui descrivere collettivamente le dinamiche a grana grossa degli insiemi di agenti. Tali descrizioni collettive a grana grossa sorgono in molti contesti, ad esempio, in termodinamica, dove le particelle interagenti possono essere effettivamente descritte a livello macroscopico dalla temperatura, pressione e densità; o nella teoria cinetica, dove le collisioni nell'equazione di Boltzmann possono portare a descrizioni di continuum, come le equazioni di Navier-Stokes - ma anche in contesti come la chemiotassi o i flussi granulari. Un problema importante in questa grana grossa è trovare osservabili a grana grossa (campi di densità, campi di quantità di moto, campi di concentrazione, campi di frazione di vuoto) che descrivono l'evoluzione del comportamento collettivo nello spazio fisico. I modelli macroscopici ed efficaci vengono quindi spesso approssimati come equazioni differenziali parziali (PDE) per questi campi: le loro derivate temporali sono espresse localmente in termini di derivate spaziali locali del campo o dei campi in ciascun punto. Le chiusure richieste per derivare modelli predittivi possono essere ottenute matematicamente (con opportune ipotesi) e/o semi-empiricamente attraverso osservazioni sperimentali o computazionali.

Quando gli agenti interagenti sono sistemi di oscillatori accoppiati, la loro dinamica a bassa dimensionalità osservata può talvolta essere descritta come un sistema concentrato di poche equazioni differenziali ordinarie (ODE) in termini dei cosiddetti parametri d'ordine1,2,3. Per grandi sistemi eterogenei di oscillatori interagenti osserviamo, in ogni dato momento, una distribuzione degli stati degli oscillatori; poter descrivere utilmente questa evoluzione mediante poche ODE per opportuni parametri d'ordine corrisponde, concettualmente, a descrivere l'evoluzione della distribuzione attraverso un insieme finito e chiuso di equazioni di pochi momenti della distribuzione. I pochi parametri di buon ordine sono qui forniti dai pochi momenti guida in termini dei quali è possibile scrivere un insieme chiuso di ODE del modello (o anche di equazioni differenziali stocastiche). E mentre in alcuni casi una descrizione così ridotta può avere abbastanza successo, ci sono altri casi in cui poche ODE non sono sufficienti e in cui è necessario scrivere equazioni di evoluzione (ad esempio, PDE) per l'evoluzione dei campi del comportamento istantaneo dell'oscillatore ( S).

La domanda allora sorge spontanea: qual è un buon modo per parametrizzare il supporto spaziale di questa distribuzione in evoluzione dei comportamenti? Quali (e quante) sono le poche variabili spaziali indipendenti, nello spazio delle quali cercheremo di derivare modelli evolutivi PDE per l'evoluzione del comportamento collettivo? In altre parole, quando il problema non si evolve nello spazio fisico (ad esempio, quando gli oscillatori sono nodi in una rete interagente) esiste un utile spazio di inclusione del continuum in cui possiamo osservare l'evoluzione del comportamento come campo spaziotemporale? E se sì, come possiamo rilevare questo spazio emergente e le sue coordinate parametrizzanti indipendenti in modo basato sui dati, sulla base delle osservazioni della raccolta delle dinamiche dei singoli agenti accoppiati? Il nostro compito ha quindi due componenti, entrambe realizzate qui in modo guidato dai dati: (a) trovare coordinate spaziali emergenti in cui il comportamento dell'oscillatore può essere (incorporato e) osservato come un'evoluzione regolare del campo spaziotemporale; e (b) una volta ottenute queste coordinate emergenti, apprendere un modello della dinamica evolutiva, se possibile sotto forma di un'equazione differenziale parziale che governa questo campo; cioè, approssimare la(e) derivata(e) temporale(i) del(i) campo(i) in termini di poche derivate spaziali locali del campo nelle variabili indipendenti emergenti.

 γH, a stable fixed point ensues, in which all individual amplitudes of the respective oscillators are zero, also called oscillator death35. We now collect data for training at several γ values, linearly spaced in the interval \(\left[1.7,1.8\right]\), on both sides of the Hopf bifurcation; the γ value was provided as additional input to the model. We again perturbed along the slow stable eigendirections of each attractor, see Methods, collecting transients that inform the model about nearby dynamics. We then learned a PDE of the form/p> γH (right inset). We observe the transient dynamics approaching the fixed point W = 0  ∀ ω for γ = 1.8./p> γH./p> γH ≈ 1.75, and to the limit cycle for γ < γH ≈ 1.75./p> γH to collective oscillations for γ < γH. More quantitatively, we reported the leading spectrum of the linearization of the model evaluated at the fixed point. This was obtained using automatic differentiation of the neural network model with respect to its inputs. Such computations can shed more light on the similarities and differences of agent-based simulations and their emergent PDE descriptions. In this paper, we focused on a particular regime in parameter space. However, our approach can easily be extended to more intricate dynamics that are known in such a Stuart-Landau ensemble; informative examples are included in the videos SI1 and SI2./p>