Variační principy

Variační počet

Pierre-Louis Moreau de Maupertuis
Pierre-Louis Moreau de Maupertuis , 1698-1759, francouzský fyzik a teolog.

Konfigurace těles ve Sluneční soustavě (přinejmenším těch, které zde pobývají dostatečně dlouhou dobu) nejsou a nemohou být náhodné. Nabízí se vysvětlení, že se veškerý pohyb děje tak, aby byla určitá (sumární) charakteristika extrémní.

Podle de Maupertuise příroda realizuje určitý účel a chová se tak, že jisté kvantity minimalizuje (tj. šetří). Je zde tedy něco navíc oproti obvyklému příčinnému chápání věcí.  Navrhl univerzální zákon přírody podle kterého se tělesa pohybují tak, že celková spotřeba jisté veličiny (tzv. "akce") je co nejmenší možná.


Tato myšlenka není nová - je základem variačního počtu, matematické disciplíny, která se používá k obecné formulaci fyzikálních úloh již od 17. století.
U zrodu variačního počtu stáli: ital Galileo Galilei (1564-1642) a francouz Pierre de Fermat (1601-1665).

Galileo Galilei
Galileo Galilei , 1564-1642, itaslský fyzik a astronom. Ukázal, že příčinou změny rychlosti je síla.
Fermat, Pierre de
Fermat, Pierre de [ferma], 1661-1665, francouzský matematik, "král amatérů", povoláním právník.
Bernoulli, Jacob
Bernoulli, Jacob [bernuli], 1654-1705, Bernoulli, Johann [bernuli], 1667-1748 švýcarští matematici. Výrazně přispěli k rozvoji variačního počtu.
Variační principy

Problém brachystochrony vyřešil (r.1696) Johann Bernoulli. Je také autorem obecné formulace principu virtuálních posunů. Spolu s bratrem Jacobem nastudovali Leibnitzův diferenciální počet a aplikovali jej na celou řadu fyzikálních problémů.

O dalším rozvoj se zasloužili Leonard Euler (1707-1783), D'Alembert, Jean-Baptiste Le Rond (1717-1783), Karl Friedrich Gauss (1777-1855), Pierre Simon Laplace (1749-1827), Ampere (1775-1836), Jacobi (1804-1851), J.A.Serret (1819-1885), M.V.Ostrogradský (1801-1861), Weierstrass (1815-1897), Ritz (1878-1909), ...

Lagrange, Josepf Louis
Lagrange, Josepf Louis, Comte [lagránž], 1736-1813, italsko-francouzský matematik a fyzik, známý svým přínosem k rozvoji mechaniky a astronomie.

Variační principy se dělí na diferenciální a integrální .

Hamilton W.Rowan , 1805-1865, matematik a fyzik. Povšiml si souvislosti mezi mechanikou a optikou, Vyšetřoval integrály jako funkce jejich mezí.

Aplikace v astronomii

Poincaré, Jules Henri , 1854-1912, francouzský matematik, fyzik, astronom a filozof. Je považován za jednoho z posledních univerzálních matematiků. Ukázal (r.1895) existenci jistých extrémů v rezonančních gravitačních soustavách.

H.Poincaré zjistil, že rušící funkce v rezonančním gravitačním systému (průměrovaná s ohledem na kritický nebo rezonanční parametr) má lokální minimum.

Možnost postupného vzniku rezonančních konfigurací byla ukázána pomocí numerických integrací pohybu těles (Hills, 1970). K synchronizaci musí přitom podle některých analýz dojít i při působení velmi slabých sil mezi tělesy (A.M.Molčanov).

Michael William Ovenden
Michael William Ovenden , 1926-1987, kanadský astronom. Předložil domněnku, že asteroidy jsou části bývalé velké planety (zvané Azték). Rozpracoval princip minimální interakce na příkladě Jupiterových měsíců.

M.Ovenden, (?inspirován myšlenkami R.Basse z r.1958?), navrhl (před r.1972) funkci, jejíž extrém by se měl hledat - průměrnou potenciální energii. Tento tzv. Ovendenův princip minimální interakce se ale podařilo aplikovat jen na určité skupin těles (pro měsíce s Laplaceovou rezonancí,...).

Mechanizmus ovlivňování

Zdá být zřejmé, že tělesa mají skutečně tendenci se vzájemně vyhýbat. Vcelku jasný je i mechanismus, který tuto tendenci působí: V okamžiku konjunkcí jsou tělesa - v důsledku zachování momentu hybnosti - podle okolností urychlována nebo bržděna, aby pak další konjunkce proběhla již v jiném místě dráhy.

Oproti tomu ale nevíme, do jakých konfigurací (v případě více těles,..) vývoj vede, v jakých musí skončit, existují-li konečné konfigurace vždy apod.

Nevíme ani, jak přesně máme vzájemného působení těles chápat: Zatímco gravitační síly působí vždy na spojnicích zúčastněných těles, působí odpuzování v okamžiku konjunkcí spíše ve směru tečen k příslušným oběžným drahám. Takové odpudivé síly mohou docela jistě ovlivnit umístění (vzájemný fázový posun) těles na drahách s pevně danými charakteristikami.

Otázkou ale je, zda 'odpudivé síly' nemohou působit i změny samotných orbitálních charakteristik (vzdálenost od centra, excentricita, sklon, oběžná perioda). Tato otázka má zásadní význam. Z možnosti ovlivnění orbitálních charakteristik by např. mohlo plynout, že tzv. Titus-Bodeova řada, která ukazuje na přibližně exponenciální rozložení vzdáleností planet Sluneční soustavy, nemusí být náhodná.

Pokud bychom připustili, že odpudivé síly jsou reálné a působí na spojnicích těles, museli bychom je započítat do pohybových rovnic.

Např. Mějme 2 tělesa pohybující se okolo centra. Mezi tělesy působí nepřetržitě odpudivé síly I01(t), I02(t) a I12(t) závislé na čase t. Pro jednoduchost odhlédněme od proměnlivosti těchto sil a nahraďme je jejich průměrnými hodnotami I01, I02 a I12. Pro každou oběžnici napíšeme podmínku rovnováhy dostředivé (Fd) a odstředivé síly (Fo):

·   Fd1-Fo1+I12-I01 =0

·   Fd2-Fo2+I12-I02 =0

Oběžná rychlost tělesa (1) pak vyjde o něco větší a tělesa (2) o něco menší než v případě bez uvažování odpudivých sil.

Akční funkce

Funkci, jejíž (průměrná) hodnota má nabývat extrému, nazveme akční funkcí.



Example

Představme si, že jsme ve svém bytě a potřebujeme se dostat na nádraží na druhém konci města. Máme na výběr 4 možnosti:

    Cesta                     Hledisko      
    ------------------------------------------- 
    1/ Pěšky přes park      nejlevnější cesta
    2/ Autobusem            levná rychlá cesta
    3/ Taxikem              nejrychlejší cesta
    4/ Vrtulníkem           nejkratší cesta

Jakou cestu zvolíme záleží na hledisku, tj. na naší "akční funkci".

Ovendenův princip je založen na předpokladu, že akční funkcí je potenciální energie. Pokusme se ověřit i jiné možnosti, např. funkce, v nichž figurují mocniny vzdálenosti  rijk (k=2,3,1/2,...) nebo logaritmické funkce hmotností ln(mi∙mj) apod. Akční funkce (tj. obecně funkce f(mi,mj,rij))) značíme malým písmenem f().

Rozlišíme 3 varianty funkcí podle zacházení se vzdálenostmi:

·   Funkce závislé na vzdálenosti (lineárně, kvadraticky, obecnou mocninou,..)
Jsou-li r1 a r2 vzdálenosti oběžnic P1 a P2 od centra S a φ12 jejich úhlová vzdálenost v daném okamžiku, je aktuální vzdálenost:
r12 = r(1,2) = sqrt(r1²+r2²-2r1r2 cos φ12) (tj. kosinová věta v trojúhelníku SP1P2)

·   Funkce nezávislé na vzdálenosti ,
tj. funkce, jejichž hodnota se mění jen s úhlem φ1212, např. f() = mi∙mj/g(φ12). V takovém případě ale musí funkce g() odstranit singularitu při konjunkci těles (tj. pro φ12=0); např. g()=sin(φ12/2),g()=1+cos(φ12), apod.)

·   Funkce deformující vzdálenosti (logaritmicky,...)
Povšimneme-li si rozvrstvení hmoty v prostoru mezi Sluncem a Jupiterem, získáme dojem, že má-li mít Slunce i Jupiter vliv nepřímo úměrný vzdálenosti, nelze nijak zdůvodnit, proč jsou planety Venuše a Země tak blízko Slunci. Zdá se, že akční funkce pro Slunce se nějak musí lišit od akční funkce pro Jupiter. Nebo musíme použít jiné předpoklady k měření vzdálenosti ve Sluneční soustavě: Kdybychom například všechny vzdálenosti od centra nahradili jejich logaritmy, dostali bychom Venuši i Zemi - v číselném světě logaritmů - blíže k Jupiteru.

Závislost na hmotnosti - Lineární, logaritmická ...

Centrální těleso

Jakkoli se může zdá interakce jen věcí oběžnic, bude zřejmě nutné (přinejmenším v určitých případech) počítat akční funkce i pro vztah mezi centrálním tělesem a oběžnicí. Opačný případ totiž může vést k výsledku, kdy jako optimální konfigurace n těles se ukáže taková, která má n-1 těles v těsné blízkosti centrálního tělesa. (V případě, že centrální těleso vynecháme z výpočtů, chybí totiž 'síla', která by tělesa donutila zdržovat se od centra dále...)

Integrály akční funkcí

Zajímá nás součet všech hodnot akčních funkcí během určitého intervalu. Integrály akční funkcí (tj. funkcionály) budeme značit velkým písmenem F(), průměrné hodnoty akčních funkcí označíme (). Průměrnou hodnotu ‹f›() akční funkce f() získáme dělením integrálu F() šířkou intervalu integrování w (zpravidla w=2π): ‹f›()= ∫ f()/w = F()/w

f

‹f›=(1/2π) ∫ f

Poznámka

1/r12

ln((r1+r2)/|r2-r1|)/2/min(r1,r2)

‹r12›=2r1/ln((r1+r2)/(r2-r1), pro r1<r2

1/r12²

1/|r2²-r1²|

‹r12²›=|r2²-r1²|

Náhrada za integrály

Integrací akčních funkcí můžeme dostat obecně velmi složité funkce. K dalším výpočtům budeme proto užívat i některých jednodušších funkcí F(), které sice nevznikly integrací, ale jsou v jistém smyslu analogické se složitějšími funkcemi. Tyto náhradní funkce musí být (stejně tak jako integrály) symetrické vzhledem k odpovídajícím si proměnným jednotlivých oběžnic.
Např. funkce F=1/|r1k-r2 k | je symetrická vzhledem k r1 a r2, kεR.


Optimální konfigurace

Extrémy akčních integrálů

Předpokládejme soustavu n těles s centrem 0 a (n-1) oběžnicemi 1,2,..,n-1. Hledáme takové konfigurace těles, při kterých nabývá integrál akční funkce extrému. Podle hledaných parametrů určujících konfiguraci rozlišíme následující případy:

·   Polohy na dráze
Jsou dány dráhy všech těles, ale polohy na dráze jen u jednoho nebo několika vybraných těles. Hledají se vhodné polohy (fázové posuny) těles ostatních.

·   Vzdálenosti těles
Je dána dráha (vzdálenost od centra) jednoho nebo několika těles. Hledají se vhodné dráhy těles ostatních.


Při pohybu po eliptických drahách akční funkce kolísají v závislosti na aktuálních hodnotách rij. Místo hledání extrému průměrné akční funkce by pak mohlo dávat smysl např. hledat, za jakých okolností průměrná akční funkce nejméně kolísá.

Největší plocha

Vyřešíme nejprve jednodušší problém, který má povahu podobnou hledání poloh (fázových posunů) těles na dráze.
Budeme hledat pro jaký fázový posun φ je křivkami sin(x) a sin(x-φ) vymezena největší plocha (v intervalu 0-2π). Vertikální vzdálenost křivek je určena akční funkcí f(x,φ)=|sin(x)-sin(x-φ)|. Integrálem této funkce je plocha a my hledáme pro kterou hodnotu φ je hodnota integrálu extrémní.

Řešení: Nejprve najdeme souřadnice bodů P1 a P2 (jsou vždy nejvýše dva), kde se dané křivky protínají, tj. kde sin(x)=sin(x-φ). Řešením je: x=(φ+;π+2kπ)/2. Celkový obsah je součtem tří ploch, tj. tří integrálů akční funkce v intervalech (0,(φ+π)/2),((φ+π)/2,(φ+3π)/2) a (φ+3π)/2,2π).
Po integraci a úpravě dostaneme: F() = S1+S2+S3 = 4∙[cos((φ-π)/2)-cos((φ+π)/2)]
Tato funkce nabývá extrému pro: dF()/dφ = 0, tj. pro sin((φ-π)/2)-sin((φ+π)/2) = 0.
Křivky vymezí extrémní plochu v případě φ=k∙π.

Zobecnění

V předchozím příkladu měly obě funkce stejnou periodu. Uvažujme nyní funkce sin(n1.x) a sin(n2.x-φ) (tj. funkce s periodami 2π/n1 resp. 2π/n2). Získáme tak (n1+n2) průsečíků členících celou plochu na (n1+n2+1) částí. Souřadnice průsečíků: x=(φ+;π+2kπ)/(n1+n2).
Např. planety Jupiter a Saturn, n1:n2≈5:2, n1+n2 =7. Celý (synodický) cyklus (2π) trvá průměrně (J,S)=19.859 let. V případě φ=0 dostaneme následujících 7 bodů: π/7( 1.418 let), 3π/7( 4.255 let),  5π/7( 7.092 let),  7π/7( 9.930 let),  9π/7(12.766 let), 11π/7(15.603 let),13π/7(18.440 let)

(π/7 = 1.418 let = 517.93 dní činí přibližně 2 Mayské cykly tzolkin, tj 2∙260 dní).

Numerické integrování

Některé akční funkce je obtížné integrovat, nebo je integrál tak komplikovaný, že je těžké hledat jeho extrém. V takovém případě můžeme řešení odhadnout numericky (počítačovým programem).

Uvažujme např. 2 oběžnice pohybující se s oběžnými periodami T1, T2 po excentrických kružnicích se vzdáleností středů Dx12 (Dy12=0). Poloměry drah nechť ve vztahu k oběžným periodám respektují Keplerův 3.zákon, tj.: r³/T² = konst.


Pro daný počáteční fázový posun Fi12 se počítá celková hodnota (integrál) sumF akční funkce f()=1/r12 v průběhu časového intervalu Time.

Program
        #define cDIVISION 100
        #define c23 0.66666666667
        float numIntg(float aTime, float aT1, float aT2, float aFi12, float
        aDx12) {
           int i;
           float sumF=0;
           float r1 = pow(aT1,c23);   /* Kepler */
           float r2 = pow(aT2,c23);   /* Kepler */
           float limit = aTime*cDIVISION;
           for (i=0;i<limit;i++) {
           float t = (float)i/cDIVISION;
           float angle1 = 2*pi*(t/aT1);
           float angle2 = 2*pi*(t/aT2+aFi12);
           float
        f1x=r1*cos(angle1);  float
        f1y=r1*sin(angle1);
           float
        f2x=r2*cos(angle2)+aDx12;  float f2y=r2*sin(angle2);
           float dx12 =
        fabs(f2x-f1x);  float dy12 = fabs(f2y-f1y);
           float r12 =
        sqrt(dx12*dx12+dy12*dy12);
           if (r12!=0)
            
        sumF=sumF+(1.0/r12);
             }
             return F;
        }

Numerickou integraci provedeme opakovaně pro různé hodnoty počátečního fázového posunu φ12 a vyhledáme pro které φ12 nastává extrém.

Dvě tělesa okolo centra

Funkce typu 1/r12k

Nechť F() = 1/(r2k-r1k) +1/r1k + 1/r2 k, r1!= Z rovnice dF()/dr1 = k.r1k-1/(r2k -r1 k)²- k/r1k+1 =0, dostáváme r1=r2/21/k.
Např. pro r2=100:

k

1/2

1

3/2

2

3

r1

25.0

50.0

63.0

70.7

79.4

Funkce typu 1/r12

Nechť F()=ln((r1+r2)/(r1-r2))/2/r1 +1/r1+ 1/r2, r1 Označme q=r1/r2. Pak (r1+r2)/(r2-r1)=(1+q)/(1-q) a ln((1+q)/(1-q))= 2 argtgh q.

Přepíšeme funkci na F()=(argtgh(r1/r2)+1)/r1 + 1/r2.

Z rovnice dF()/dr1=0 plyne q/(1-q²)-argtgh(q)-1 = 0 (*).

Funkce argtgh(q)=q+q³/3+q5/5+...; v prvním přiblížení argtgh(q)=q a rovnice (*) přejde do tvaru q³+q²-1 = 0.

Numericky zjistíme, že funkce F() nabývá minima pro q≈0.7865; tj. pro r1=100 je r2≈78.7.

Tři tělesa okolo centra

Funkce typu 1/r12k

Nechť F() = ∑∑ 1/(rj k -ri k) + ∑ 1/rik, r1<R2. Numerické řešení, např. pro r3=100:

k

1/2

1

2

3

r1

10

32

57

68

r2

46

68

83

88



Tyto hodnoty jsou bez ohledu na hmotnosti těles, tj. za předpokladu, že hmotnost centra je stejná jako hmotnost oběžnice.

Mějme nyní: F() = ∑∑ mimj/(rjk -ri k) + ∑ m0mi/rik. V případě m0 = 10, m1=m2=m3=1 dostáváme

K

½

1

2

3

R1

37

61

78

85

R2

69

83

91

94

Čím je větší hmotnost centra, tím jsou oběžnice tlačeny dále od centra, tj. jinými slovy, čím jsou oběžnice (relativně k centru) lehčí, tím se shlukují blíže k sobě.

Případ k=1

Nechť F() = 1/(r2-r1)+1/(r3-r2)+1/(r3-r1)+1/r1+1/r2+1/r3, r1<r2
Z rovnic
dF()/dr1 = 1/(r2-r1)²+1/(r3-r1)²-1/r1² = 0,  dF()/dr2 = -1/(r2-r1)²+1/(r3-r2) ²-1/r2² = 0
plyne:
1/(r3-r1) ² + 1/(r3-r2)² = 1/r1² + 1/r2². Rovnici vyhovuje r1+r2 = r3. Označme q=r1/r2. Odtud musí platit (1-q²)(1-q) ² = q², tj. q4-2q³+q²+2q-1=0.

Numericky dostáváme řešení q=0.47 (tj.32/68, viz předchozí tabulku).

Nyní rovnice ještě zjednodušíme.
Předpokládejme, že má platit: [dF()/dr1 =] 1/(r2-r1)+1/(r3-r1)-1/r1 = 0,  [dF()/dr2 =] -1/(r2-r1)+1/(r3-r2)-1/r2 = 0.
Odtud 1/(r3-r1) + 1/(r3-r2) = 1/r1 + 1/r2. Obdobně i zde rovnici vyhovuje r1+r2 = r3. Z první rovnice je 1/(r2-r1) = 1/r1-1/r2, tj. r1²-3r1r2+r2². Při označení q=r1/r2: q²-3q+1=0. Odtud q=0.382 (=((√5-1)/2) ².

Znázornění rovnic

Uvedené rovnice připomínají v principu Kirchofovy zákony známé z elektřiny. Také k nim existuje jednoduché grafické znázornění. f(r1,r2)+f(r1,r3)-f(r1) = 0

          0           1               2            3
          *- f(r1)---→*←-- f(r1,r2) --* 
                      *←----------- f(r1,r3) ------+
f(r2,r3)-f(r1,r2)-f(r2)=0
          0            1              2             3
          *            *---f(r1,r2)--→*←--f(r2,r3)--* 
          *------------- f(r2)-------→*
Geometrický průměr period

Uvažujme funkci F() = ∑(mi∙(x+ri)/(x-ri), i=1,2 a hledejme takové x=r3, aby platilo dF()/dx= 0. Dostáváme rovnici m1.r1/(x²-r1²) + m2.r2/(x²-r2²) = 0.

Jejím řešením je:

x=r3 = √(r1r2 (r1m2+r2m1)/(r1m1+r2m2)), speciálně pro m1=m2=1: x=r3 = √(r1r2).
Ve Sluneční soustavě najdeme např. tyto analogické vztahy:

·   T(Europa)=3.5518 dní ≈ √(Tio∙Tganymed) = 3.5577 dní

·    4∙S = 117.83 let ≈ √(U∙N) = 117.67 let

·   4∙Mr = 234.6 dní ≈ √(V∙Vr) = 233.7 dní (≈ 2∙(V,E)/5 = 233.6 dní)