De Euler-Lagrange-vergelijking

Stel we hebben een functie f1 die bepaald wordt door drie variabelen x, y1 en dy1/dx:
Waarbij y1 een functie van x is, want anders zou dy1/dx gelijk aan nul zijn. Tegelijkertijd is y1 ook een argument van de functie f1 net als x. Een functie die één of meer andere functies als argument heeft noemen we een functionaal. Volgens het boekje dienen we het functievoorschrift dan te geven met vierkante haken in plaats van ronde haken (maar het gros van de mensen doet dat niet, waaronder ondergetekende):
Ik ga de functie f1 integreren van x1 tot x2:
Ik ga ervan uit dat I1 een extreme waarde is (een minimum of een maximum), met andere woorden:
Naast de kromme die beschreven wordt door y1 (x) ligt een andere kromme y2 (x, λ):
Hierin is λ een parameter die niet afhankelijk is van x. Verder eis ik dat y1 (x) en y2 (x) voor x1 en x2 samenvallen (lees: door hetzelfde punt gaan), oftewel:

Dit is aldus de situatie.
De integraal I2 voor de naastliggende kromme is:
Hier ga ik vergelijking (4) in invullen:
Aangezien I1 een extreme waarde is, is I2 dat ook voor λ = 0:
Een extreme waarde vinden we door de afgeleide te bepalen en die nul te stellen:
Dit combineer ik met vergelijking (6):
Omdat we hier te maken hebben met het product van twee functies, f2 en dx, ga ik gebruik maken van de productregel:
De variabelen x en λ zijn onafhankelijk van elkaar en daarom is de afgeleide van x naar λ (of vice versa) gelijk aan nul:
Dit ga ik vervolgens partieel differentiëren:
Omdat x en λ onafhankelijk zijn van elkaar is de eerste term gelijk aan nul:
Het maakt niet uit of je eerst naar x differentieert en daarna naar λ of vice versa:
Hiermee wordt vergelijking (14):
De rechterintegraal ga ik partieel integreren:
De afgeleide van y2 naar λ vind ik door vergelijking (4) te differentiëren:
En omdat de functie ξ (x) nul is bij de grenzen van de integraal (zie de vergelijkingen (5)) valt de linkerterm van het rechterlid van vergelijking (17) weg (die is nul):
Dit resultaat stop ik weer terug in vergelijking (16) en ik ga wat reorganiseren:
En nu komt de grote klapper, want ik kan nu stellen:
En zo ben ik λ helemaal kwijt en heb ik een algemene uitdrukking gevonden voor de voorwaarde die een functie moet hebben zodat de integraal I een extreme waarde is. Ik had helemaal aan het begin ook de volgende functie als uitgangspunt kunnen nemen:
Dan had vergelijking (21) er nu zo uitgezien:
Of met een kleine wijziging in notatie en reorganisatie van termen:
Bovenstaande vergelijking, de Euler-Lagrange-vergelijking, is de voorwaarde voor een functie zodat de integraal I een extreme waarde is. Omdat deze vergelijking vooral toepassing vindt in variatieproblemen en daar vaak wortels voorkomen is het tenslotte van belang om op te merken dat meestal f probleemloos door √f mag worden vervangen.
Hoe werkt dit nou uit in de praktijk? Daarvoor begin ik met een simpel wiskundig voorbeeld: ik wil weten wat de kortste verbinding is tussen de oorsprong O en het punt P (1, 1). Dat is uiteraard een rechte lijn, maar hoe kan ik dat bewijzen? Ik stel als verbindende functie tussen O en P de volgende macht van x voor:

De grafiek van f (x) = xn voor n = 1 (de rode lijn)
en per lijn met een factor 2/3 vermenigvuldigd tot aan de bovenste lijn (de roze lijn)
(dus n = 2/3 = 0.667 voor de groene lijn,
n = 4/9 = 0.444 voor de oranje lijn,
n = 8/27 = 0.296 voor de paarse lijn,
n = 16/81 = 0.198 voor de blauwe lijn, enzovoort)

De grafiek van f (x) = xn voor n = 1 (de rode lijn)
en per lijn met een factor 3/2 vermenigvuldigd tot aan de onderste lijn (de roze lijn)
(dus n = 3/2 = 1.500 voor de groene lijn,
n = 9/4 = 2.250 voor de oranje lijn,
n = 27/8 = 3.375 voor de paarse lijn,
n = 81/16 = 5.063 voor de blauwe lijn, enzovoort)
In de limiet dat n naar nul of oneindig gaat ziet de grafiek er als volgt uit.

De grafiek van f (x) = xn voor n = 1 (de rode lijn),
n → 0 (de blauwe lijn) en n → ∞ (de groene lijn)
Een kind ziet dat de rode lijn de kortste verbinding is, maar daarmee hebben we het nog niet bewezen. Allereerst bepaal ik daarom de afgeleide van y:
En dit stelt mij in staat om de lengte van het lijnstuk uit te rekenen voor x = 0 tot x = 1:
Het resultaat ga ik differentiëren naar n en gelijk aan nul stellen om uit te vinden voor welke waarde van n de lengte van het lijnstuk een extreme waarde heeft:
Dit klinkt als een goed plan, en dat is het ook, maar het praktische probleem is dat de integraal, zoals die neergezet is in vergelijking (27), niet exact op te lossen is (dat lukt alleen voor enkele specifieke waarden van n: n = 0.5, n = 1 en n = 2).

Ik kan de integraal wel numeriek oplossen met behulp van de trapeziummethode:

Trapeziummethode
Het antwoord van vergelijking (27) vormt op die manier onderstaande grafiek.

De grafiek van s (n)
Hieruit blijkt duidelijk dat de lengte van het lijnstuk OP minimaal is voor n = 1, maar dit is uiteraard nog geen wiskundig bewijs.

Een alternatieve aanpak is om in vergelijking (28) van het integreren naar x en het differentiëren naar n de volgorde te verwisselen:
Dit is leuk geprobeerd, maar de integraal wordt er alleen maar ingewikkelder door dus dit is ook geen uitweg.

Taylor

Ik zou desnoods kunnen proberen om de integrand te ontwikkelen in een Taylor-reeks. In de tabel met Taylor-reeksen vinden we:

Vergelijking (28) wordt dan:
Ik heb het juiste antwoord gevonden, want voor n = 0 en n = ∞ is de route van O naar P maximaal, en voor n = 1 is de route minimaal. Kortom, deze extrema kloppen, maar ik heb wel vals gespeeld omdat de Taylor-reeks over een (heel) klein deel van het traject convergeert (alleen voor β < 1) en voor de rest hopeloos divergeert.

De grafiek van (1 + β)1/2 (de rode lijn)
met daaroverheen de Taylor-reeks met 10 termen (de oranje lijn),
20 termen (de paarse lijn), 50 termen (de grijze lijn)
en 100 termen (de blauwe lijn)
Dit ogenschijnlijk simpele probleem is duidelijk niet zo simpel op te lossen als dat het eerst leek. Nu gaan we de kracht van de Euler-Lagrange-vergelijking in werking zien. Om te beginnen ga ik de functie die O en P verbindt, vergelijking (25), parametriseren:

Voor een infinitesimaal stukje van het traject OP geldt dan:
Ik ga mijn notatie iets wijzigen:
De integraal waarmee ik de lengte van OP bereken ziet er dan zo uit:
Zo kan ik een functie L in het leven roepen:
Aldus vind ik voor de diverse partiële afgeleiden van L:



Volgens de Euler-Lagrange-vergelijking moet gelden (C1, C2, C3 en C4 zijn constanten):

Het feit dat de functie y (x) door het punt O (0, 0) gaat stelt mij in staat de constanten C2 en C4 te bepalen:

En omdat de functie y (x) ook door het punt P (1, 1) gaat kan ik de constanten C1 en C3 bepalen:

Dit brengt ons bij het resultaat:
Oftewel, de kortste verbinding tussen de punten O en P is inderdaad een rechte lijn.

Ik heb mijzelf eerst in allerlei wiskundige bochten gewrongen zonder een overtuigend resultaat, een bewijs, om uiteindelijk via de Euler-Lagrange-vergelijking rechtstreeks en redelijk eenvoudig tot het juiste antwoord te komen. Dit waren mijn pogingen: Merk op dat de variabelen x en y en de afgeleiden daarvan weliswaar een functie zijn van t, maar dat t niet expliciet genoemd wordt. Daar zit een potentiële bron van verwarring, want in plaats van y met een punt erboven zou je dy/dt kunnen denken en dan komt vergelijking (38c) (de afgeleide van L naar y) er zo uit te zien:
Dan ontstaat er een tweede afgeleide! Dat is iets waar je eerst even gek tegenaan kijkt (ik tenminste wel), maar de punt-variabelen (de afgeleiden) moet je beschouwen als onafhankelijke/zelfstandige variabelen. Dus de afgeleide van y-punt naar y is niet y-punt-punt, maar nul!

De variabele t zou je een soort primaire variabele kunnen noemen, maar juist die wordt doorgaans helemaal niet genoemd in het functievoorschrift. En in de literatuur gaan de andere variabelen doorgaans door het leven als q en q-punt. Ik kwam met vergelijking (24) tot de Euler-Lagrange-vergelijking:
In de literatuur zul je vaker dit aantreffen:
Meestal heeft men het trouwens over de Euler-Lagrange-vergelijking (ik ook) in plaats van over de Euler-Lagrange-vergelijkingen (meervoud), want strikt genomen heb je een Euler-Lagrange-vergelijking voor n = 1, een Euler-Lagrange-vergelijking voor n = 2, een Euler-Lagrange-vergelijking voor n = 3, enzovoort. Over het algemeen is n een laag getal, in het voorbeeld hierboven met de kortste verbinding was n = 2 (een vergelijking voor x en een vergelijking voor y), maar dat neemt niet weg dat een purist over Euler-Lagrange-vergelijkingen (meervoud) zou moeten spreken.

In vergelijking (44) gebruik ik L als functieaanduiding in plaats van f, wat ik in het voorbeeld hierboven ook al deed, en dat komt omdat de Euler-Lagrange-vergelijking vaak ingezet wordt bij analyse van een Lagrangiaan en dat is precies wat ik ga doen in het tweede voorbeeld. Ik ga de baanvergelijking opzoeken van een hemellichaam. Daartoe beschouw ik een ster waar een of ander hemellichaam omheen beweegt, hetzij eenmalig, hetzij periodiek. Ik ga ervanuit dat de massa van dat hemellichaam veel kleiner is dan de massa van de ster.
De afstand tussen de beide middelpunten noem ik de voerstraal r.
Wanneer dat hemellichaam een infinitesimaal stukje aflegt in zijn baan dan kunnen we die beweging ontbinden in een radiële component (in het verlengde van r) en een laterale component (loodrecht op r). Die radiële component is:
De laterale component is:
Hierin is dφ het infinitesimale hoekje waarover de voerstraal opschuift.
De radiële snelheid is de afgeleide naar de tijd van de radiële verplaatsing:
De laterale snelheid is de afgeleide naar de tijd van de laterale verplaatsing:
Daarmee wordt de totale snelheid:
Hetgeen ons brengt bij de kinetische energie van het hemellichaam (m is de massa van het hemellichaam):
De ster en het hemellichaam oefenen uiteraard zwaartekracht uit op elkaar (M is de massa van de ster):
De potentiële energie van het hemellichaam is de integraal hiervan, berekend vanaf r = ∞ (daar is de potentiële energie per definitie nul):
De Lagrangiaan is het verschil van de kinetische energie en de potentiële energie (ook weer per definitie):
Moeder Natuur heeft de Kosmos zo ingericht dat de Lagrangiaan over een bepaald traject minimaal is, oftewel, we hebben weer een extremaprobleem en dat gaan we uiteraard aanpakken met de Euler-Lagrange-vergelijking. Het recept is inmiddels bekend, eerst bepaal ik de partiële afgeleiden van L:



Volgens de Euler-Lagrange-vergelijking moet gelden:

Om met vergelijking (55b) te beginnen, die bewegingsconstante die we gevonden hebben is het impulsmoment:
Daarvan gebruiken we ook vaak de massaloze variant:

Kepler

Ik gebruik hier de letters J en h, maar daar is totaal geen vaste conventie voor. In vergelijking (57) lezen we trouwens rechtstreeks de perkenwet van Kepler af.

Vergelijking (57) kan ik ook als volgt schrijven:
Dit vul ik in in vergelijking (55a):
Ik introduceer u als de reciproke van r en ik werk de afgeleiden naar t om naar afgeleiden naar φ middels de kettingregel:


Hiermee wordt vergelijking (59):
En zo heb ik een hele eenvoudige differentiaalvergelijking gevonden die de baan van het hemellichaam beschrijft. In het simpelste geval dat het hemellichaam een cirkelvormige baan beschrijft om de ster kan ik rechtstreeks het antwoord opschrijven:
In alle andere gevallen is de oplossing van de differentiaalvergelijking ook niet heel ingewikkeld (A en B zijn nog onbekende constanten):
De eerste en tweede afgeleiden hiervan zijn:

Hiermee wordt vergelijking (61):
En dat brengt ons tenslotte bij de baanvergelijking van het hemellichaam:
Ik stel:


Waarmee vergelijking (66) deze mooie vorm krijgt:
Enkele opmerkingen zijn hier op hun plaats: Het is ook nog wel illustratief om in vergelijking (66) de massa van de ster gelijk aan nul te stellen:
Dit is de vergelijking van een rechte lijn in poolcoördinaten hetgeen waarschijnlijk een stuk duidelijker wordt wanneer ik vergelijking (70) omschrijf naar Cartesische coördinaten (waarbij ik gebruik maak van de som-/verschilformules uit de goniometrie):
Merk op dat indien van een tweetal variabelen, qn en qn-punt, de eerste ontbreekt in het functievoorschrift dat er dan een speciaal geval ontstaat. Dit is de Euler-Lagrange-vergelijking:
Indien qn ontbreekt in het functievoorschrift dan wordt het rechterlid gelijk aan nul:
Waaruit onmiddellijk volgt:
In woorden: voor iedere niet-puntvariabele, iedere qn, die ontbreekt in het functievoorschrift vinden we een constante van de beweging, een behouden grootheid. In het eerste voorbeeld was dat het hellingsgetal van de lijn die de punten O en P verbindt, voor een rechte lijn is het hellingsgetal immers constant (zie de vergelijkingen (39), dy/dx = constant). In het tweede voorbeeld was dat het impulsmoment (zie vergelijking (56)) die gedurende het hele traject van het hemellichaam onveranderd blijft.

Tot slot wil ik nog even terugkomen op mijn opmerking dat indien het functievoorschrift een wortel bevat dat die dan meestal probleemloos weggelaten mag worden. Dat is uiteraard een vage opmerking waar je in de praktijk eigenlijk niets mee kunt. Laten we dat eens nader onderzoeken door uit te gaan van een functievoorschrift dat gedomineerd wordt door een wortel:
Hier ga ik de Euler-Lagrange-vergelijking op toepassen:
Indien de linkerterm nul zou zijn dan heb ik de Euler-Lagrange-vergelijking weer terug, maar dan met de functie K in plaats van L:
Die linkerterm is in twee gevallen gelijk aan nul:
Die tweede voorwaarde zou wel heel toevallig zijn, dus we moeten het hebben van de eerste voorwaarde:
Dit geldt indien √K (= L) een lijnelement is van een kromme die geparametriseerd is met de booglengte, want in het geval van parametrisering met de booglengte is de kromme zélf de as waarop de maatstreepjes staan en maakt het niet meer uit hoe de ‘buitenwereld’ eruit ziet (Cartesische coördinaten, poolcoördinaten, bolcoördinaten, kromlijnige coördinaten, of wat dan ook). Samengevat: het wortelteken mag overboord indien L een lijnelement is van een kromme die geparametriseerd is met de booglengte.

Zo heb ik twee voorbeelden uitgewerkt en dat bracht ons deze bevindingen: De Euler-Lagrange-vergelijking hoort gewoon in de gereedschapskist van iedere natuurkundige te zitten.