Derivarea transformărilor Lorentz se poate face în multe feluri, pornind de la diverse premise.
Transformările Lorentz pot fi obținute în mod abstract, din considerente de grup (în acest caz se obțin cu un parametru nedefinit ), ca o generalizare a transformărilor galileene (care a fost făcută de Poincaré - vezi mai jos ). Cu toate acestea, pentru prima dată au fost obținute ca transformări față de care ecuațiile lui Maxwell sunt covariante (care nu schimbă forma legilor electrodinamicii și opticii la trecerea la un alt cadru de referință). Transformările pot fi obținute din ipoteza liniarității lor și postulatul aceleiași viteze a luminii în toate cadrele de referință (care este o formulare simplificată a cerinței de covarianță a electrodinamicii în raport cu transformările dorite și extinderea principiului de egalitate a cadrelor de referință inerțiale (ISR) - principiul relativității - la electrodinamică), așa cum se face într -o teorie specială a relativității (SRT) (în acest caz, parametrul din transformările Lorentz se dovedește a fi definit și coincide cu viteza luminii).
Trebuie remarcat faptul că, dacă clasa transformărilor de coordonate nu se limitează la cele liniare, atunci prima lege a lui Newton este valabilă nu numai pentru transformările Lorentz, ci și pentru o clasă mai largă de transformări liniare fracționale (cu toate acestea, această clasă mai largă de transformări - cu excepția: desigur, pentru cazul special al transformărilor Lorentz - nu păstrează metrica constantă).
Pe baza mai multor ipoteze naturale (care este principala ipoteza existenței unei viteze maxime de propagare a interacțiunilor) , se poate demonstra că la modificarea IFR, valoarea
numit interval . Această teoremă implică direct forma generală a transformărilor Lorentz ( vezi mai jos ). Aici luăm în considerare doar un caz special. Pentru claritate, la trecerea la IFR deplasându-se cu viteza , alegem în sistemul inițial axa co-dirijată cu , iar axele și vor fi plasate perpendicular pe axa . Axele spațiale ale ISO la momentul respectiv vor fi alese pentru a fi co-direcționale cu axele ISO . Cu o asemenea transformare
Vom căuta transformări liniare Lorentz, deoarece pentru transformări infinit de mici ale coordonatelor, diferențialele noilor coordonate depind liniar de diferențele vechilor coordonate, iar din cauza omogenității spațiului și timpului, coeficienții nu pot depinde de coordonate, doar de orientarea relativă și viteza IFR-ului.
Faptul că coordonatele transversale nu se pot schimba este clar din considerentele izotropiei spațiului. Într-adevăr, valoarea nu se poate schimba și în același timp nu depinde de (cu excepția rotației în jurul valorii de , pe care o excludem din considerare), ceea ce este ușor de verificat prin înlocuirea unor astfel de transformări liniare în expresia intervalului. Dar dacă depinde de , atunci punctul cu coordonată va avea o coordonată diferită de zero , ceea ce contrazice prezența simetriei rotației sistemului în raport cu izotropia spațiului. La fel pentru .
Cea mai generală formă de astfel de transformări:
unde este un parametru numit viteza . Transformările inverse au forma
Este clar că un punct de repaus în IFR va trebui să se deplaseze în IFR cu o viteză . Pe de altă parte, dacă punctul este în repaus, atunci
Ținând cont de faptul că orientarea spațiului nu ar trebui să se schimbe la schimbarea ISO, obținem asta
Prin urmare, ecuația vitezei este solubilă în mod unic:
iar transformările Lorentz au forma
Parametrul se numește factor Lorentz [1] .
Acceptăm postulatele SRT , care se rezumă la principiul extins al relativității, care afirmă că toate procesele fizice decurg exact la fel în toate cadrele de referință inerțiale (principiul constanței vitezei luminii în SRT, care o rafinează). , înseamnă o extindere a principiului relativității la electrodinamică, împreună cu o afirmație clarificatoare că nu există un mediu fizic fundamental (eter), care ar evidenția unul dintre sistemele de referință din experiment - adică chiar dacă eterul există, atunci prezența sa nu ar trebui să încalce principiul relativității în practică). În plus, este util să subliniem în mod explicit că principiul constanței vitezei luminii înseamnă prezența tocmai a vitezei finale (din experiment egală cu viteza luminii în vid), încorporată în legile fundamentale (ecuații), la fel pentru toate cadrele de referință inerțiale, iar în fiecare cadru de referință viteza luminii este aceeași pentru orice direcție de propagare a acesteia și nu depinde de viteza sursei. Principiul constanței vitezei luminii constituie al doilea postulat al SRT, care este folosit mai jos.
Să fie două plane infinite perpendiculare pe axa y . Distanța dintre aceste planuri, evident, nu ar trebui să depindă de viteza planurilor de-a lungul lor, ceea ce înseamnă că nu depinde de cadrul de referință care se mișcă față de celălalt de-a lungul axei . (Într-adevăr, în fiecare astfel de sistem, timpul de trecere a unui fascicul de lumină care se mișcă de-a lungul axei de la un plan la altul este același, conform postulatelor SRT.)
De asemenea, vă puteți imagina cum un corp care se mișcă de-a lungul unei axe zboară într-o gaură fixă de aceeași dimensiune. Dacă nu există egalitate , atunci, în funcție de sistemul de referință în care se efectuează măsurarea, corpul poate fi mai mare sau mai mic decât gaura. În realitate, corpul trece sau nu prin gaură, indiferent de alegerea cadrului de referință.
Același lucru este, desigur, valabil și pentru axa . Prin urmare, excluzând pentru simplitate cazul neinteresant din punct de vedere fizic de rotație cu un unghi constant al celui de-al doilea sistem de coordonate față de primul, obținem:
Să arătăm că orice proces (de exemplu, cursul unui ceas) dintr-un cadru de referință care se mișcă în raport cu acesta decurge mai lent decât în propriul cadru de referință (față de care nu se mișcă).
Luați în considerare un „ceas de lumină” format dintr-o sursă punctiformă și un receptor de lumină pe axă , la distanță unul de celălalt la o distanță și care măsoară intervalul de timp pentru trecerea unui impuls (bliț) de lumină de la sursă la receptor, egal la .
Dacă cadrele de referință se mișcă unul față de celălalt de-a lungul axei , atunci distanța dintre două puncte de pe axă , măsurată într-un cadru care este staționar față de aceste puncte, este aceeași cu cea măsurată într-un cadru de referință în mișcare, deoarece există nicio mișcare relativă a sistemelor de-a lungul axei. Acest lucru va asigura că unitățile de lungime sunt consecvente între sisteme. Unitățile de timp vor fi, de asemenea, consistente, deoarece unitățile de lungime sunt consistente, iar viteza luminii nu depinde de sistemul de coordonate.
Astfel, același ceas de lumină poate fi setat în fiecare cadru de referință.
Să comparăm intervalul de timp al trecerii pulsului în cadrul de referință în care ceasul luminos este în repaus și intervalul de timp al aceluiași ceas, măsurat de ceasuri identice în cadrul de referință în mișcare.
Lăsați ceasul de lumină să fie în repaus în cadrul de referință (diagrama din stânga în figură), iar cadrul de referință se deplasează spre dreapta de-a lungul axei cu o viteză de . Sursa în momentul emiterii impulsului se află la originea A a sistemului de referință (punct roșu în figură), iar receptorul se află în punctul B (albastru) pe axă . În cadrul de referinţă , impulsul luminos emis ajunge în timp la receptorul B de pe axa .
În cadrul de referință, un impuls luminos este emis de la origine în momentul în care coincide cu originea sistemului (punctul A ) și intră în receptorul B după un timp , care este măsurat de ceasurile care se deplasează cu sistemul . Coordonata punctului B este offset-ul indicat pe diagrama din dreapta din figură printr-o linie punctată, egală cu , punctul A indică locul din care a fost emis pulsul, traiectoria pulsului în este indicată printr-o linie verde.
Deoarece viteza luminii în orice cadru de referință inerțial este aceeași (nu depinde de viteza sursei și de direcția radiației), sursa A în momentul impulsului poate fi considerată staționară în cadrul de referință .
Calea parcursă de impulsul luminos de la A la B în cadrul de referință este egală cu ipotenuza unui triunghi dreptunghic. Conform teoremei lui Pitagora
ținând cont de faptul că și , găsim o expresie pentru
De aici rezultă că atunci când
Astfel, intervalul de timp al oricărui proces care are loc în cadrul de referință , măsurat de un ceas într-un cadru de referință în mișcare , este mai mare decât intervalul de timp , măsurat de același ceas în propriul său cadru de referință . Factorul de creștere a intervalului este constant la viteză constantă.
Deoarece cadrul de referință se mișcă în raport cu cadrul cu o viteză , atunci spunem că timpul în cadrul de referință în mișcare din punctul de vedere al sistemului curge lent. De exemplu, durata de viață în laborator a particulelor cu viață scurtă produse la viteze mari este mai lungă decât durata de viață a acestora în propriul cadru de referință.
Mai clar, încetinirea timpului se manifestă în încetinirea (tempo-ul) ceasurilor care se mișcă împreună cu cadrul de referință . Dacă sursa și receptorul sunt prevăzute cu oglinzi care reflectă pulsul luminii, atunci un interval de orice durată poate fi măsurat prin numărul de perioade dintre reflexii. Frecvența de oscilație a unui astfel de pendul ușor caracterizează viteza de trecere a timpului. Perioada unui proces care se repetă este legată de frecvența acestuia prin egalitate . O perioadă mai mare corespunde unei frecvențe mai mici, iar inegalitatea se transformă într-o inegalitate pentru frecvența , unde este frecvența pendulului luminos al ceasului care se mișcă împreună cu sistemul , măsurată de ceasul sistemului , este frecvența pendul ușor în propriul cadru de referință (față de care ceasul este în repaus). Un ceas în mișcare ticăie mai rar decât unul staționar.
Deoarece toate cadrele de referință inerțiale sunt egale, atunci, măsurând durata trecerii unui impuls în ore care se mișcă împreună cu cadrul de referință , ceasul cadrului de referință , se obține inegalitatea inversă pentru , deoarece în acest caz este momentul potrivit. Din punctul de vedere al sistemului de referință , ceasul în mișcare al sistemului rulează mai lent decât ceasul propriu al sistemului .
Pe lângă încetinirea timpului într-un cadru de referință în mișcare (încetinirea tuturor ceasurilor dintr-un laborator în mișcare în comparație cu ceasurile dintr-un laborator staționar), se dovedește că originea timpului într-un cadru de referință în mișcare, de asemenea, nu coincide cu aceea într-unul staționar, iar deplasarea acestei origini este diferită în puncte diferite - depinde de x . Ceasurile din propriul cadru de referință care păstrează aceeași oră arată timpi de avans/întârziere diferiți în funcție de locația lor atunci când sunt privite din cadrul de referință în care se mișcă propriul cadru de referință.
Pentru a înțelege însăși esența problemei, va trebui să ne gândim la întrebare într-un fel sau altul și ce înseamnă că ceasurile din diferite puncte ale spațiului îndepărtate unele de altele (de exemplu, în diferite orașe) rulează în același mod (sincron), așa cum se poate vedea în aceasta, sau cum (folosind ce procedură) puteți sincroniza ceasurile în locuri diferite dacă nu au fost sincrone inițial.
Deja cea mai simplă metodă de sincronizare, care constă în faptul că toate ceasurile sunt sincronizate într-un singur loc și apoi sunt transferate în puncte diferite, face posibilă asigurarea că ceasurile sincronizate într-un singur cadru de referință vor arăta ca arătând timpuri diferite. dintr-un alt cadru de referință. Faptul este că pentru ceasurile pe care le transferăm în puncte diferite de-a lungul axei x , viteza lor în raport cu un alt cadru de referință va fi în mod necesar diferită, astfel încât timpul în diferite puncte ale axei x va fi deplasat diferit.
Aceasta ar putea fi cuantificată cu atenție, obținându-se astfel rezultatul dorit. Dar acest lucru poate fi realizat mai simplu, luând în considerare sincronizarea cu ajutorul semnalelor luminoase (și principiul relativității spune că orice metodă corectă de sincronizare ar trebui să dea același rezultat, care, totuși, poate fi verificat explicit dacă se dorește).
Deci, să luăm în considerare sincronizarea cu ajutorul semnalelor luminoase. Acest proces poate consta, de exemplu, în schimbul de semnale luminoase între două cronometre la distanță: dacă semnalele sunt emise în același timp, atunci va trece același timp înainte de a primi un semnal pentru fiecare ceas. Dar și mai simplă este o metodă puțin diferită (echivalentă cu aceasta): puteți face un fulger de lumină exact în mijlocul segmentului care leagă cronometrele și să afirmați că lumina va veni la ambele cronometre simultan.
În propriul cadru de referință (în care cronometrele sunt staționare), imaginea este simetrică. Cu toate acestea, în orice alt cadru de referință, ambele cronometre se mișcă (pentru claritate, vom presupune că spre dreapta), iar apoi lumina de la mijlocul segmentului care le conectează în momentul inițial va dura mai puțin timp pentru a ajunge la stânga. cronometru (deplasându-se spre lumină) decât spre dreapta (pe care pulsul luminii trebuie să-l prindă din urmă).
Astfel, cronometrele care rulează sincron în propriul cadru de referință, conform ceasurilor altui cadru de referință, arată asincron. Simultaneitatea evenimentelor este relativă: evenimentele care sunt simultane într-un cadru de referință nu sunt simultane în altul.
Calculele geometrice simple permit (înfățișând mișcarea impulsurilor de lumină și a cronometrelor pe planul xt ) să obțină o expresie pentru deplasarea originii timpului:
(pentru simplitate, am considerat aici doar ceasurile distanțate de-a lungul axei x , dar, desigur, totul poate fi calculat pentru cazul general).Astfel, reunind rezultatele punctelor 2 si 3, obtinem pentru conversia in timp
.Acest efect poate fi dovedit și prin contradicție: dacă nu ar exista, sau dacă schimbarea originii referinței temporale nu s-ar ridica la , atunci așa-numitul paradox geamăn ar exista .
Luând în considerare mișcarea unui impuls de lumină de-a lungul axei x (și nu de-a lungul axei y , așa cum a fost în paragraful 1) și solicitând (pe baza postulatului aceleiași viteze a luminii în toate cadrele de referință inerțiale) ca distanța între două puncte ar trebui să fie întotdeauna egal cu timpul pentru care lumina trece de la un punct la altul, înmulțit cu viteza (constantă) a luminii, puteți obține factorul de reducere a distanței de-a lungul axei x și având în vedere că offset-ul origine este egală cu , puteți obține transformarea pentru coordonata x :
.Este și mai ușor acum de înțeles ceea ce este exprimat în acest fel, observând că în plan graficul mișcării [2] al pulsului luminos ar trebui să fie drept, înclinat la 45 ° (datorită faptului că viteza luminii este întotdeauna c ), și, prin urmare, scara de-a lungul axelor și ar trebui să fie aceeași, iar expresiile din sistemul de unități ar trebui să fie simetrice.