Uitleg artikel algemene relativiteitstheorie: paragraaf 6

Trefwoorden: algemene relativiteitstheorie, Annalen der Physik, Die Grundlage der allgemeinen Relativitätstheorie/De grondslag van de algemene relativiteitstheorie, Königlich Preussischen Akademie der Wissenschaften/Koninklijke Pruisische Academie der Wetenschappen

Hoofdstuk B:
Wiskundige hulpmiddelen voor de opstelling van algemeen covariante vergelijkingen.


Paragraaf 6:
Tensoren van tweede en hogere rang.


In paragraaf 5 hebben we het uitgebreid gehad over vectoren en hoe die transformeren als we overgaan van het ene coördinatenstelsel naar het andere coördinatenstelsel. In paragraaf 4 heb ik al verteld wat een vector is en wat die voorstelt, maar over bewerkingen met vectoren heb ik tot nu toe nog met geen woord gerept. Nu is het een goed moment om dat te gaan veranderen. Stel dat ik twee vectoren heb, A (a1, a2, a3, a4) en B (b1, b2, b3, b4) (vectoren worden vet gedrukt en tussen haakjes staan de componenten). Vervolgens kunnen we uit die twee vectoren A en B de tensor C bouwen als volgt (tensoren worden normaliter niet vet gedrukt):



Inderdaad, dit komt volledig uit de lucht vallen. Daarom moet er ook van alles gezegd worden over tensoren, want wat is nou in vredesnaam een tensor? Maar daarvóór zetten we dus eerst onze tanden in die heerlijke vectoren. Vectoren kunnen op drie manieren met elkaar ‘vermenigvuldigd’ worden en die gaan we hier apart doornemen. Daarbij richten we ons eerst op de wiskundige systematiek en hoe je in die drie gevallen alle vectorcomponenten moet verwerken om tot een antwoord te komen. Daarna kijken we wat de zin is van al die hocus-pocus. Oftewel, wat is de betekenis van al dit wiskundige geknutsel in de ‘echte wereld’.

Allereerst is er het inwendig product, ook wel genoemd het inproduct, scalair product of het cosinus product. Dit product wordt aangegeven met een punt tussen de vectoren (daarom lees je in Engelse literatuur ook wel de term dot product, dot is Engels voor punt). Het resultaat van het inwendig product is simpelweg een getal, en omdat scalar een ander woord voor getal is praten we ook wel over scalair product. De definitie van het inwendig product is:

Hierin is φ de hoek tussen de twee vectoren. Als α de hoek is die A met de x-as maakt en β de hoek die B met de x-as maakt, dan is φ = α − β. | A | is de lengte van de vector A, dus wat je meet als je er een duimstok langs legt. Of netjes gezegd: | A | is de absolute waarde van de vector A. En | B | is dan uiteraard de absolute waarde van de vector B. Met behulp van de stelling van Pythagoras volgt dan (ervan uitgaande dat we een orthogonaal assenstelsel hebben, dus dat de assen loodrecht op elkaar staan, want anders mogen we Pythagoras niet gebruiken):





Die cos φ kunnen we ook anders schrijven (we gaan voor het gemak even uit van vectoren met twee componenten):



Die overstap van de som van twee hoeken naar een product van sinussen en cosinussen gaat met behulp van een hulpregel uit de goniometrie. Voor de duidelijkheid nog een keer het toelichtende plaatje, en daarop zijn de sinus en cosinus van de somhoek (α + β) zo af te lezen. De sinus en cosinus van de verschilhoek (α − β) verkrijg je door β te vervangen door −β, en daarna de sinussen van β een minteken mee te geven.


Figuur 6.1
We zijn in vergelijking (6.4) uitgegaan van vectoren met twee componenten. Voor vectoren met een willekeurig aantal componenten wordt het dan:



En als we vervolgens vergelijking (6.5) in vergelijking (6.2) stoppen, dan krijgen we:



Vergelijking (6.6) geeft een tweede methode (vergelijking (6.2) is de eerste methode) om het inwendig product te berekenen.

Vervolgens is er het uitwendig product, ook wel genoemd het uitproduct, vector product of het sinus product. Dit product wordt aangegeven met een kruisje tussen de vectoren (daarom lees je in Engelse literatuur ook wel de term cross product). Het resultaat van het uitwendig product is een vector, vandaar de naam vector product. De definitie van het uitwendig product is:



Hierin is φ weer de hoek tussen de twee vectoren. De toevoeging n is een eenheidsvector (zijn lengte is één) en die staat loodrecht op het vlak waar de vectoren A en B zich in bevinden. Een dergelijke vector die loodrecht op een vlak staat noemen we een normaalvector (vandaar de letter n). | A | | B | sin φ geeft de lengte van de resulterende vector en n geeft aan waar die vector dan heen wijst. Dit gaat volgens de kurkentrekkerregel: als je een denkbeeldige kurkentrekker van A naar B draait dan wijst n in de richting waar de punt van de kurkentrekker heen beweegt. Een ander ezelsbruggetje hiervoor is de rechterhandregel. Die vind ik zelf wat minder vanzelfsprekend, maar het idee is dat het grijpen van de vingers de draaiing voorstelt van A naar B en dan wijst je duim in de richting van n. Het uitwendig product is dan ook een bewerking die alleen in een driedimensionale ruimte kan bestaan.

De logische volgende vraag is dan natuurlijk hoe je het uitwendig product in de praktijk uitrekent, want je weet sin φ niet (maar die is eventueel te berekenen met vergelijking (6.5)) en je weet n niet.

Wel, kijk en huiver (dit ziet er best wel ingewikkeld uit), maar we hoeven dit maar één keer te doen. Daarna weten we het voor alle volgende keren. Het uitgangspunt bestaat uit twee vectoren A en B met ieder drie componenten, (a1, a2, a3) en (b1, b2, b3), in een orthogonale vectorbasis i, j, k. Deze i, j, k kun je zien als de assen van het coördinatenstelsel en orthogonaal wil zeggen dat ze allemaal loodrecht op elkaar staan. Ik dien hier nog wel te vermelden dat bij een vectorbasis bestaande uit eenheidsvectoren officieel de term orthonormaal gebruikt wordt, maar bij het woord orthogonaal weet iedereen ook heus wel waarover je het hebt. Orthogonaal betekent dat de assen loodrecht op elkaar staan en dit is ook het geval bij een orthonormaal stelsel, maar een orthonormaal stelsel kent tevens de eis dat de basisvectoren allemaal eenheidsvectoren zijn. Het uitwendig product is dan:



We hebben nu 9 mini-uitwendige producten. Het uitwendig product van een vector met zichzelf is nul, want de hoek tussen de vectoren is dan uiteraard nul graden en dus is sin φ ook nul. De uitwendige producten i × i, j × j en k × k vallen er dus uit (die zijn nul):



En vervolgens gaan we kurkentrekkertje spelen (teken maar even een assenstelsel i, j, k op een kladblaadje en pak een kurkentrekker uit de keukenla). Als je het goed doet komt dit er uit:













En dit vullen we in in vergelijking (6.8):



En tenslotte is er het dyadisch product, ook wel genoemd het directe product of het tensor product. Dit product wordt aangegeven met een kruisje met een cirkeltje er omheen tussen de vectoren. Om de onduidelijkheid te bevorderen wordt dit symbool vaak weggelaten! Tot overmaat van ramp hebben ze het in de Engelse literatuur (en vrijwel alle literatuur over relativiteitstheorie is in het Engels) over outer product, en dit is dus iets heel anders dan het Nederlandse uitwendig product! Het resultaat van het dyadisch product is een tensor, vandaar de naam tensor product. De definitie van het dyadisch product is:



Ik heb hier de indices r en k gebruikt om rijen respectievelijk kolommen aan te duiden. Laten we nu even alles overzichtelijk in een tabel zetten:
Symbolische aanduiding Naam Resultaat
inwendig product of
inproduct of
scalair product of
cosinus product of
dot product (Engels)
Scalar (getal):
uitwendig product of
uitproduct of
vector product of
sinus product of
cross product (Engels)
Vector:
dyadisch product of
directe product of
tensor product of
outer product (Engels)
Tensor:
Tabel 6.1
Je ziet hier wellicht een bepaalde systematiek in. Het scalair product levert een getal op (zie dit als een punt), het vector product levert een rij getallen (zie dit als een lijn) en het tensor product levert een veld met getallen (zie dit als een vlak). De tensor zoals die hierboven staat is een tensor van de tweede rang. Een dergelijke tensor kan op zijn beurt weer een tensor product ondergaan met een vector en dan vormt zich een tensor van de derde rang: een kubus met getallen. Of twee tensoren van de tweede rang kunnen door middel van een tensor product een tensor vormen van de vierde rang (inderdaad, die getallenbrij is niet meer te visualiseren). In principe is the sky the limit voor de rang die een tensor kan hebben. En in lijn met deze systematiek is een vector te beschouwen als een tensor van de eerste rang en een getal als een tensor van de nulde rang. Om wat preciezer te zijn wordt de rang van een tensor vaak onderverdeeld in covariant en contravariant. Bijvoorbeeld de tensor Kαβγδε heeft als rang (2,3), hij is covariant in α en β, en contravariant in γ, δ en ε. Een ‘gewone’ vector heeft aldus als rang (0,1) en een getal (scalar) de rang (0,0).

Maar wat heb je hier nou allemaal aan? Laten we om te beginnen eens een plaatje bekijken om het inwendig product aanschouwelijk te maken.


Figuur 6.2
Het inwendig product is heel handig om de hoek tussen twee vectoren te berekenen (via een simpele korte notatie, want daar houden we van in de wiskunde). En met die hoek kun je weer andere dingen berekenen zoals projecties. In figuur 6.2 is | A | cos φ de projectie van de vector A op de vector B. Stel de lengte van A is | A | = 8 en de hoek φ = 30°. Dan is | A | cos φ = 8 × cos 30° = 8 × ½ √ 3 = 4 √ 3, dus de projectie van A strekt zich 4 √ 3 uit in de B richting. En die projectie wordt vaak weer gebruikt om afstanden te berekenen. Het gaat te ver om hier de complete vectorwiskunde te behandelen, daarom laat ik het hier bij voor wat betreft het inwendig product. Geloof me, het inwendig product is waardevol.

Laten we nu eens naar een plaatje kijken om meer inzicht te krijgen in het uitwendig product.


Figuur 6.3
Het uitwendig product is heel handig om een normaalvector van een vlak te berekenen, in dit plaatje de vector C. En de grootte van A × B, dus | A × B |, is de oppervlakte van het parallellogram dat door de vectoren A en B gevormd wordt. Vaak zijn we in de wiskunde geïnteresseerd in datgene wat ergens aan raakt, en dan gebruiken we de afgeleide, of datgene wat er juist haaks op staat, en dan gebruiken we het uitwendig product. Het gaat te ver om hier de complete vectorwiskunde te behandelen, daarom laat ik het hier bij voor wat betreft het uitwendig product. Geloof me, het uitwendig product is waardevol.

Tja, en dan die tensoren, hoe maak je die nou duidelijk? Stel je wilt ergens op een bepaald punt in huis de temperatuur weergeven. Nou, dat is simpelweg een getalletje. En als je dat voor de hele keukentafel zou willen doen, dan kun je de hele keukentafel volschrijven met getalletjes en ieder getalletje geeft aan wat op dat punt de temperatuur is van het tafelblad. En stel je vervolgens eens voor dat je ergens de zwaartekracht wilt weergeven. Zwaartekracht heeft een bepaalde sterkte maar ook een richting. Zwaartekracht geef je dus aan met een vector. De richting van de vector geeft aan in welke richting de zwaartekracht werkt en de lengte van de vector geeft aan hoe sterk de zwaartekracht daar is. En als je dat wilt doen voor de keukentafel, dan teken je de hele keukentafel vol met pijltjes en kun je trots tegen je moeder vertellen hoe de zwaartekracht in jullie keuken zich gedraagt daar waar de keukentafel staat (al vrees ik dat je moeder daar niet blij mee zal zijn). Wellicht is de keukentafel een houten tafel waarvan het tafelblad bestaat uit afzonderlijke planken. Omdat er weleens met eten wordt gemorst zijn de planken hier en daar vochtig en er ontstaan daardoor spanningen in het tafelblad. De planken schuren langs elkaar, werken zich omhoog of gaan juist krom staan naar beneden toe. Elk punt van het tafelblad is een mini-wereldje op zich waar getrokken, geduwd en langs elkaar geschuurd wordt. Dit krachtenspel leggen we systematisch vast middels een tensor.


Figuur 6.4
We kunnen elk mini-wereldje in het tafelblad beschouwen als een heel klein kubusje, een infinitesimaal (oneindig klein) kubusje. En van iedere zijde van dat kubusje kunnen we opschrijven hoe er daar in elke richting getrokken, geduwd en geschuurd wordt. Mechanische spanningen (zoals in dit tafelblad) geven we aan met de letter σ. Voor de twee indices in figuur 6.4 geldt: de eerste index geeft aan in welke richting de normaal wijst van het vlak waar het om gaat en de tweede index geeft aan in welke richting de spanning zich uit. De spanningen die afgebeeld zijn in figuur 6.4 kunnen we opschrijven als de spanningstensor:



De spanningstensor was de allereerste tensor die gedefinieerd werd. Daar is ook de benaming tensor van afgeleid, want spanning is in het Latijn tensus (Engels: tension). De σ-componenten op de diagonaal, σxx, σyy en σzz, zijn de optredende trekspanningen (het trekken en duwen). Alle σ’s die niet op de diagonaal liggen zijn schuifspanningen (het schuren).

Het gaat te ver om hier de complete tensorwiskunde te behandelen, daarom laat ik het hier bij voor wat betreft het tensor product. Geloof me, het tensor product is waardevol.

Maar dit is wel een goed moment om naar de essentie van tensoren toe te gaan. De spanningstensor die ik net beschreven heb geeft de spanningen weer onafhankelijk van het coördinatenstelsel. De componenten van de tensor zijn natuurlijk wel afhankelijk van het coördinatenstelsel, maar wanneer ik overstap van het ene coördinatenstelsel naar het andere dan kan ik die componenten volgens de transformatieregels uit paragraaf 5 omrekenen. Indien de componenten niet op deze manier transformeren dan heb ik niet te maken met een tensor! Ik vertelde net dat een scalar (een getal) te zien is als een tensor van rang nul. Hierbij moet de belangrijke aantekening gemaakt worden dat een tensor van rang nul altijd een scalar is, maar een scalar niet altijd een tensor is.

Neem bijvoorbeeld de temperatuur. De temperatuur is ‘gewoon’ een getal (temperatuur heeft geen richting), een scalar dus. Cowboy Jan staat voor een spoorwegovergang te wachten en cowboy Piet zit in de trein die langskomt. Dit zijn twee coördinatenstelsels die bewegen ten opzichte van elkaar, maar de temperatuur die Jan en Piet meten op een bepaald punt is precies gelijk, dus de temperatuur is een tensor van rang nul. De spoorbomen zijn dicht, omdat de trein met Piet erin langskomt, en de bellen bij de spoorwegovergang rinkelen. De frequentie van het geluid van die bellen is ook een scalar, maar Jan hoort een constante frequentie terwijl Piet de frequentie eerst hoort toenemen (wanneer de trein de spoorwegovergang nadert) en daarna hoort hij de frequentie afnemen (wanneer de trein de spoorwegovergang gepasseerd is en zich van de spoorwegovergang verwijdert). Frequentie is dus geen tensor van rang nul.

De afstand tussen de spoorbomen aan weerszijden van de spoorwegovergang is voor te stellen als een vector, maar dit is geen tensor van de eerste rang omdat deze afstand voor Jan en Piet niet gelijk is (Lorentz-contractie). De ruimtetijdafstand tussen Jan en Piet is ook voor te stellen als een vector en dit is wel een tensor van de eerste rang, want die is voor Jan en Piet gelijk. Als een beschrijving van ‘iets’ onafhankelijk is van het coördinatenstelsel van waaruit beschreven wordt, dan hebben we te maken met een tensor. In alle andere gevallen degradeert de beschrijving tot slechts een getal of een vector of een matrix.

Nu kunnen we de draad weer oppakken van het artikel van Einstein. Hij laat het tensor product los op twee viervectoren (vectoren met vier componenten):



Oorspronkelijke vergelijking uit het artikel van Einstein:



Het symbool voor het tensor product wordt consequent overal door Einstein weggelaten, wij sluiten ons daar enigszins morrend bij aan. De indices staan boven, dus het gaat hier om contravariante vectoren die een contravariante tensor vormen. En de tensor heeft twee indices, dus het betreft een tensor van de tweede rang met 4 × 4 = 16 componenten. In paragraaf 5 hebben we ons uitgebreid bezig gehouden met de vergelijking voor contravariante transformatie:



Oorspronkelijke vergelijking uit het artikel van Einstein:



Deze vergelijking gaan we gebruiken om de tensor van vergelijking (6.13/E8) te transformeren:



Oorspronkelijke vergelijking uit het artikel van Einstein:



Het spreekt voor zich dat dit rijtje differentialen telkens wat langer wordt voor tensoren van de derde rang, vierde rang, enzovoort. Zo ziet de transformatie eruit van een tensor van de derde rang:



En dit hele verhaal geldt natuurlijk ook voor covariante vectoren en tensoren (vectoren en tensoren met lage indices):



Oorspronkelijke vergelijking uit het artikel van Einstein:



Dit is de covariante transformatievergelijking uit paragraaf 5:



Oorspronkelijke vergelijking uit het artikel van Einstein:



Waaruit de transformatievergelijking volgt voor een covariante tensor van de tweede rang:



Oorspronkelijke vergelijking uit het artikel van Einstein:



Einstein merkt nog op dat vectoren als tensoren van de eerste rang gezien kunnen worden en getallen als tensoren van de nulde rang. Hier voegt hij ook nog aan toe dat het wel handig is om getallen zowel als contravariante tensor en als covariante tensor van de nulde rang te behandelen. Prima, zolang we maar in ons achterhoofd houden of we werkelijk met een tensor te maken hebben.

Het begint een beetje flauw te worden, maar een tensor van de tweede rang kan natuurlijk ook gevormd worden door het tensor product van een covariante vector en een contravariante vector:



Oorspronkelijke vergelijking uit het artikel van Einstein:



De tensor die zo ontstaat heet een gemengde tensor. De transformatievergelijking voor een dergelijke tensor is:



Oorspronkelijke vergelijking uit het artikel van Einstein:



Ook voor gemengde tensoren kan het aantal rangen naar believen uitgebreid worden en zal er in de transformatievergelijking dan telkens een differentiaal bijkomen zoals bijvoorbeeld in vergelijking (6.15). Contravariante tensoren en covariante tensoren zijn eigenlijk speciale gevallen van de gemengde tensor.

Een tensor waarbij twee willekeurige indices verwisseld kunnen worden, zonder dat de inhoud verandert, heet een symmetrische tensor. Voor een tensor van de tweede rang betekent dit dat de componenten gespiegeld kunnen worden ten opzichte van de diagonaal. In formulevorm ziet een dergelijke spiegelsymmetrie er als volgt uit:



Oorspronkelijke vergelijking uit het artikel van Einstein:





Oorspronkelijke vergelijking uit het artikel van Einstein:









Uitgeschreven met alle componenten ziet een symmetrische tensor van de tweede rang er bijvoorbeeld als volgt uit:



De getallen 18, −37 en 7 vormen de diagonaal. Voor de componenten aan de ene kant van de diagonaal is het net alsof ze in de spiegel kijken. Daarom de term spiegelsymmetrie. Maar hiervan wil Einstein toch wel even bewezen hebben dat dit symmetrieverhaal onafhankelijk is van het coördinatenstelsel. Hij gaat daarbij uit van vergelijking (6.14/E9) en bewijst het op deze manier:



Oorspronkelijke vergelijking uit het artikel van Einstein:



En als er symmetrische tensoren zijn, dan zijn er uiteraard (?) ook anti-symmetrische tensoren. Dit zijn tensoren waarbij door verwisseling van twee willekeurige indices alle componenten met −1 vermenigvuldigd worden, als volgt in formulevorm:



Oorspronkelijke vergelijking uit het artikel van Einstein:





Oorspronkelijke vergelijking uit het artikel van Einstein:











Hieronder zie je een voorbeeld van een anti-symmetrische tensor. Als de componenten ‘in de spiegel (= de diagonaal) kijken’ dan zien ze zichzelf vermenigvuldigd met −1.



Alle componenten op een rijtje gezet: A11 = 0, A12 = 27, A13 = −3, A21 = −27, A22 = 0, A23 = 12, A31 = 3, A32 = −12 en A33 = 0. Als ik vervolgens de indices verwissel en alle componenten met −1 vermenigvuldig, dan krijg ik het volgende rijtje: A11 = 0, A12 = 27, A13 = −3, A21 = −27, A22 = 0, A23 = 12, A31 = 3, A32 = −12 en A33 = 0. Klopt, precies hetzelfde rijtje (want fysiek mag er natuurlijk niets veranderen). Hieruit wordt gelijk duidelijk dat A11 gelijk moet zijn aan −A11, A22 = −A22 en A33 = −A33. En dat kan alleen als die componenten nul zijn. De componenten op de diagonaal van een anti-symmetrische tensor zijn dus altijd nul.

Bij anti-symmetrische tensoren zijn de componenten met twee gelijke indices dus altijd nul. Einstein noemt het dat die componenten ‘verdwijnen’. Ze zijn er natuurlijk wel, maar ze hebben de waarde nul. Van de 16 componenten van een anti-symmetrische tensor zijn er dus vier componenten gelijk aan nul (de componenten op de diagonaal), en de overige twaalf componenten bestaan uit zes paren waarbij voor elk componentenpaar geldt Aωλ = − Aλω. Einstein zegt dat er aldus (maximaal) slechts zes numeriek verschillende componenten zijn (zes getallen die gelijk zijn afgezien van hun teken).

Het aantal componenten van een tensor is ‘het aantal dimensies’ tot de macht ‘de rang van de tensor’. In de ruimtetijd zijn er vier dimensies. Een tensor van de tweede rang heeft dus 42 = 16 componenten. Een tensor van de derde rang heeft dan 43 = 64 componenten. Einstein beweert dat een dergelijke tensor, indien die anti-symmetrisch is, slechts vier numeriek verschillende componenten bezit. Dat gaan we natuurlijk effe checken. Ja, ik weet het, dit is totaal niet relevant voor ons verhaal over relativiteitstheorie, maar wij laten ons toch niet kisten door zo’n wiskundig geintje van Einstein? En we kunnen dit nu wel laten zitten, maar dan liggen we er vannacht toch wakker van, daarom lossen we het nu maar gelijk op.

Laten we eerst alle componenten ‘even’ opschrijven:



Zoals we hierboven zojuist geleerd hebben zijn alle componenten van een anti-symmetrische tensor met twee gelijke indices gelijk aan nul. Laten we die er dan maar gelijk uitgooien:



Kijk, dat ruimt lekker op, er zijn al 40 componenten weg. En nu is het zaak om hieruit de componenten bij elkaar te zoeken die een ‘−1 vermenigvuldiging’ vormen door telkens twee indices te verwisselen. Zoeken maar:









En inderdaad, er zijn vier verschillende rijtjes te maken (niet meer en niet minder). Dat betekent dat er maximaal vier numeriek verschillende waarden in een anti-symmetrische tensor van de derde rang met vier dimensies aanwezig zijn.

Vervolgens roept Einstein ook nog dat een anti-symmetrische tensor van de vierde rang met vier dimensies slechts één numerieke waarde kent. Dat controleren we dan ook nog maar even (want we willen vannacht wel lekker slapen toch?). We schrijven eerst alle 44 = 256 componenten op:



Wat een zooitje he? We gaan weer dezelfde strategie gebruiken, dus eerst alle componenten verwijderen die twee gelijke indices hebben. Dan houden we dit over:



Dat gaat heel lekker, 232 componenten zijn er weg! Nu gaan we weer proberen rijtjes te maken, telkens twee indices verwisselen en tegelijk met −1 vermenigvuldigen:



Alle niet-nul componenten passen precies in één rijtje, dus in deze tensor komt maar één numerieke waarde voor. Einstein heeft (uiteraard) gelijk.

En voor anti-symmetrische tensoren met een rang hoger dan vier? Niet schrikken, dat ga ik heus niet uitschrijven. Omdat we het hier over vier dimensies hebben is er in dat geval geen enkele component waarvan er niet minstens twee indices gelijk zijn. Oftewel, een dergelijke tensor bestaat niet (alle componenten zijn nul). Pas als het aantal dimensies minstens zo groot is als de rang van de tensor wordt het pas weer een zinvolle oefening. Maar zoals je hebt gezien neemt het schrijfwerk exponentieel toe met het aantal dimensies. Een tensor van de vijfde rang met vijf dimensies heeft 55 = 3125 componenten...