La tercera ley de Kepler

En la proposición 15 de los Principia Newton demuestra que la ley de gravedad, es decir el hecho de que la fuerza de atracción sea inversamente proporcional al cuadrado de la distancia, implica la tercera ley de Kepler. (Que implica las dos primeras leyes quedó demostrado en las proposiciones 1 y 13.1).

Proposición 14
“Si varios cuerpos giran en torno a un centro común y la fuerza centrípeta es inversamente como el cuadrado de la distancia de los lugares al centro, digo que los lados rectos de las órbitas son como los cuadrados de las áreas barridas en tiempos iguales por los radios trazados al centro”.
Esta es la proposición 14 de los Principia, que demostramos a continuación de forma distinta a como lo hace Newton.
Si F_P es la fuerza en P, y \tau es el área barrida por unidad de tiempo, por la observación de la entrada anterior F_P \propto \dfrac{\tau^2}{ PV \cdot SY^2}.
Si F_P \propto \dfrac{1}{SP^2}, las trayectorias serán secciones cónicas, pero vimos que en una cónica PV \cdot SY^2 = 2\ SL \cdot SP^2, entonces F_P \propto \dfrac{\tau^2}{ SL \cdot SP^2}, y como está dada la proporción F_P \propto \dfrac{1}{SP^2}, será necesariamente SL \propto \tau^2, ó \tau \propto \sqrt{SL}, es decir las áreas barridas por unidad de tiempo en las diferentes cónicas son proporcionales a las raíces de los lados rectos de esas cónicas.

Corolario 14.1
Si la órbita es una elipse, el punto móvil vuelve a la misma posición tras un periodo T. Entonces el área E de la elipse será E = \tau \cdot T, porque \tau es el área barrida por unidad de tiempo, y en el periodo T se barre toda la superficie de la elipse. Por tanto E \propto T \cdot \sqrt{SL}. Como esa área es proporcional al producto M \cdot m de los ejes mayor y menor de la elipse, será M \cdot m \propto T \cdot \sqrt{SL}.

Proposición 15
“Supuesto esto (la ley de gravedad), digo que los tiempos periódicos en las elipses son como los ejes mayores elevados a la potencia 3/2″.
Porque, por Apolonio I.15, m^2 = M \cdot LL', donde LL' es el lado recto, y por tanto m = M^{1/2} \sqrt{LL'}, y sustituyendo en la proporción del corolario 14.1 tenemos M^{3/2} \sqrt{2\ SL} \propto T \sqrt{SL}, es decir M^{3/2} \propto T como queríamos demostrar.

Tasa de barrido y fuerzas centrales

La proposición 6 de los Principia de Newton es válida para fuerzas ejercidas en puntos de la misma o de diferentes trayectorias, pero las proporciones obtenidas en los corolarios de esa proposición solo comparan fuerzas en puntos de una misma trayectoria, o de trayectorias diferentes siempre que el área barrida (por el radio entre el centro de fuerzas y el punto móvil) sea la misma en tiempos iguales en las diferentes trayectorias. (Porque en la demostración de esos corolarios se supone que las áreas barridas son proporcionales a los tiempos).

Como una fuerza central obliga a barrer áreas iguales en tiempos iguales en cada trayectoria, pero no a que esas áreas barridas sean iguales en distintas trayectorias, para comparar fuerzas en diferentes trayectorias introducimos un factor \tau , la tasa de barrido, que es el área barrida por unidad de tiempo, \tau = \dfrac{\text{area}}{\Delta t} \ \Longrightarrow \ \Delta t = \dfrac{\text{area}}{\tau}.

Los corolarios de la proposición 6 se obtuvieron sustituyendo \Delta t por el área en el factor \dfrac{1}{\Delta t^2}. Si sustituimos teniendo en cuenta el factor \tau, el numerador de las fórmulas obtenidas en los corolarios 6.1-3 queda multiplicado por \tau^2 y el corolario 6.3 se convierte en F_P \propto \dfrac{\tau^2}{PV \cdot SY^2}, donde SY es la distancia del centro de fuerzas a la tangente y PV es la cuerda de la circunferencia osculatriz a la trayectoria en P que pasa por el centro de fuerzas S.

De la misma forma generalizamos el corolario 1 de la proposición 1 que dice que la velocidad v_P es inversamente proporcional a la distancia SY si las áreas barridas son iguales en tiempos iguales.
Como el área barrida es claramente proporcional a la velocidad, tendremos la nueva proporción v_P \propto \dfrac{\tau}{SY}, que es válida para puntos en diferentes trayectorias producidas por una fuerza central.

Entonces el corolario 6.4: F_P \propto \dfrac{v_P^2}{PV} es válido sin modificaciones para comparar fuerzas en puntos de diferentes trayectorias producidas por una fuerza central.

La ley de gravedad produce cónicas

Consideremos en el espacio un punto fijo S y otro punto móvil P, situado inicialmente en P0.
Si en P0 aplicamos un impulso a P, en una dirección P0T diferente de la de P0S, por la ley de la inercia P se móverá en la dirección del impulso en línea recta a una velocidad uniforme v0, si no se ejerce ninguna fuerza sobre él.
Pero si a partir del impulso inicial se ejerce sobre P una fuerza continua en la dirección de S cuya magnitud varíe de forma inversamente proporcional al cuadrado de la distancia entre el punto P y S, entonces el punto P, sujeto a la inercia y a esa ley central de fuerzas, describirá una trayectoria curva que será siempre una sección cónica de la que S es un foco.

Demostramos aquí ese teorema, que Newton presenta como corolario tras la proposición 13 del primer libro de los Principia, y que, gracias a Halley, originó su escritura.
El teorema es el recíproco del presentado en la entrada anterior.

Están dadas la posición P0 inicial del punto, la dirección y magnitud v0 de la velocidad , y la posición del centro de fuerzas S y la fuerza FP que se ejerce en cada punto, que, por hipótesis, es inversamente proporcional al cuadrado de la distancia SP.

Por el corolario 6.4, como están dadas la magnitud de la velocidad en P0 y de la fuerza, está dada la cuerda P0V de la osculatriz en P0 que pasa por el centro de fuerzas.

Pero podemos construir una cónica que pase por P0 y tenga como tangente la tangente a la trayectoria en P0, tenga a S como foco, y tenga la cuerda P0V de la osculatriz, de cualquier tamaño, en la dirección P0S. (La perpendicular a la normal desde el punto medio M de P0V nos da G. Entonces SG es el eje de la cónica y SG/SP0 la excentricidad).

Si un punto P describe esa cónica partiendo de P0 con velocidad inicial v0, y modula su velocidad de forma que el radio SP barra áreas iguales en tiempos iguales (es decir de forma que la velocidad sea inversamente proporcional a la distancia del foco a la tangente), entonces, por las proposiciones 11,12,13 de los Principia el punto se mueve sometido a una fuerza, en la dirección del foco, inversamente proporcional a SP2, y que será igual en P0 (y por tanto en el resto de los puntos) a la fuerza asumida como hipótesis, porque produce en ese punto la misma curvatura con la misma velocidad.

Y como la trayectoria está determinada unívocamente por la fuerza que se aplica en cada punto junto con la posición y velocidad iniciales del punto móvil, la trayectoria a partir de esas condiciones iniciales será siempre la cónica que hemos construido a partir del foco, la tangente en un punto y la cuerda de curvatura focal en ese punto.

Si la fuerza central está dirigida hacia S, la trayectoria será una elipse, o un trozo de parábola o de hipérbola segun el valor de la excentricidad SG/SP0, y si la fuerza está dirigida en dirección contraria la trayectoria será parte de una hipérbola y SG será mayor que SP0.
La circunferencia es un caso particular de elipse, en la que que los focos y el centro coinciden.

La ley de fuerzas focal

Supongamos que un punto P se mueve sobre una cónica con foco S de forma que el segmento SP barre áreas iguales en tiempos iguales. Entonces, por la proposición 2 de los Principia de Newton, la trayectoria de P es la que produciría la ley de la inercia junto con una determinada fuerza ejercida sobre P en la dirección de la recta SP.
Si la trayectoria es una parábola, una elipse, o la rama próxima al foco de una hipérbola, la fuerza será dirigida hacia el foco, y si es la otra rama de la hipérbola la fuerza será dirigida en dirección opuesta.

Demostramos aquí que la magnitud de esa fuerza, que hace que el punto móvil P describa esa trayectoria, es inversamente proporcional al cuadrado de la distancia SP del foco S a los diferentes puntos de la cónica.

Este es el resultado que Newton obtiene en las proposiciones 11, 12, y 13 de los Principia para la elipse, hipérbola y parábola respectivamente. Newton escribe que, aunque la prueba para la elipse se puede generalizar para cualquier cónica, “dada la dignidad del problema y su utilidad en lo sucesivo confirmaré mediante demostración los demás casos”.

En la segunda edición de los Principia, Newton da dos demostraciones para cada caso, una basada en el corolario 6.1 y otra basada en 6.3, que además usan las proposiciones 7 y 10. En la nota 268 de la llamada “edición de los jesuitas” (en realidad a cargo de los franciscanos Le Seur y Jacquier) se da otra demostración más directa, en la que está inspirada la siguiente, que es un poco más simple:

Por el corolario 6.3 una fuerza central es, en la trayectoria que produce, inversamente proporcional a la cuerda de la osculatriz que pasa por el centro de fuerzas y al cuadrado de la perpendicular desde el centro de fuerzas a la tangente, es decir, con las letras de la figura: F_P \propto \dfrac{1}{PV \cdot SY^2}.
Pero se demostró que en una cónica la cuerda focal de curvatura es PV = \dfrac{2 \ PG^2}{SL}, y también que \dfrac{PG}{SL}  = \dfrac{SP}{SY} , y entonces PV=  \dfrac{2 \ SL \cdot SP^2}{SY^2}.
Sustituyendo PV en la proporción anterior para F_P, y teniendo en cuenta que SL es fijo para una cónica, tenemos que F_P \propto \dfrac{1}{SP^2}.

Es decir, la fuerza ejercida en la dirección del foco que hace que un punto móvil describa una cónica dada cualquiera es inversamente proporcional al cuadrado de la distancia al foco.


Esta entrada participa en la Edición 5.5: Ronald Fisher del Carnaval de Matemáticas cuyo anfitrión es el blog pimedios.

Unas fórmulas para la fuerza central

Siguen los corolarios que da Newton en la proposición 6 de los Principia.

Usaremos la notación A \propto B para expresar que A es proporcional a B, es decir que la razón entre magnitudes A, tomadas en diferentes situaciones, es igual a la razón entre las magnitudes B, tomadas en las mismas situaciones. Esas situaciones son en nuestro caso puntos situados en trayectorias producidas por una fuerza central.   Hoy diríamos A = k \cdot B para una constante k, pero para eso hay que admitir en geometría a los números reales, cosa que no hace Newton en los Principia, que se mantienen en el marco conceptual de la antigua teoría griega de la proporción.

En la entrada anterior vimos que, si P es un punto de una trayectoria de un punto móvil producida por la inercia y una fuerza central ejercida desde S, la fuerza en P, F_P, es últimamente directamente proporcional al desplazamiento RQ desde la tangente, paralelo a SP, e inversamente proporcional al cuadrado del tiempo \Delta t en que se recorre PQ, es decir \displaystyle F_P \propto  \lim_{Q \to P } \frac{RQ}{\Delta t ^2}   para una posición fija del centro de fuerzas S.

Corolario 1.
Como, por la proposición 1, \Delta t es proporcional al área barrida por SP, y ese área es últimamente como la del triángulo SQP, que es igual a la del SRP, \Delta t será proporcional a la base SP por la altura QT de ese triángulo y entonces \displaystyle F_P \propto \lim_{Q \to P } \ \frac{RQ}{SP^2 \cdot QT^2}.

Corolario 2.
Como el área del triángulo SRP también es igual a la base PR por la altura SY y \displaystyle \lim_{Q \to P}  \frac{PR}{PQ} = 1, tendremos también \displaystyle F_P \propto \lim_{Q \to P } \ \frac{RQ}{SY^2 \cdot PQ^2}.

Corolario 3.
Consideremos la circunferencia que pasa por P y Q, y que comparte en P la tangente PR con la trayectoria. Sea PU la cuerda de esa circunferencia que pasa por el centro de fuerzas S.
Por igualdad de ángulos inscritos en la circunferencia, y \angle RPQ = \angle PUQ. Como RQ y PU son paralelas, \angle RQP = \angle QPU , y los triángulos PUQ y QPR son semejantes, y PQ/QR = PU/PQ, es decir PU = PQ^2 / QR.
El límite de las circunferencias PQU cuando Q \to P (sobre la trayectoria del punto móvil) es la circunferencia osculatriz a la curva en P, y el límite de las cuerdas PU es la cuerda PV de la osculatriz en P que está en la recta PS. Entonces \displaystyle PV = \lim_{Q \to P} \frac{PQ^2}{QR}, y por tanto, sustituyendo en el corolario anterior, F_P \propto \dfrac{1}{SY^2 \cdot PV}.

Corolario 4.
Si v_P es la velocidad del punto móvil cuando pasa por P, por el corolario 1 de la proposición 1, v_P \propto \dfrac{1}{SY}. Entonces, por el corolario anterior, F_P \propto \dfrac{v_P^2}{PV}.

Corolario 3′.
Este no aparece en los Principia, sino en la nota 212 (vol I, pag 81). de la edición de Le Seur y Jacquier, que dicen que fue propuesto por Johann Bernouilli, De Moivre y Guido Grandi.
Si la circunferencia de la figura es la osculatriz en P, como \angle YSP = \angle VPP', los triángulos VPP' y YSP son semejantes y PV/PP' = SY/SP, o PV= SY \cdot PP'/ SP, y sustitutuyendo en la fórmula del corolario 3, F_P  \propto \dfrac{SP}{SY^3 \cdot OP}.

Corolario 5.
En palabras de Newton:
“De aquí que, si se da una figura curvilínea APQ y se da también en ella el punto S al que se dirige continuamente la fuerza centrípeta, se puede hallar la ley de la fuerza centrítepa por la que un cuerpo P es retenido en el perímetro de dicha figura, desviado continuamente de la trayectoria recta, y que describirá una órbita.
Efectivamente, se puede hallar calculando, o bien el sólido \dfrac{SP^2 \cdot QT^2}{QR}, o bien el sólido SY^2 \cdot PV, inversamente proporcional a dicha fuerza.”


Esta entrada participa en la Edición 5.5: Ronald Fisher del Carnaval de Matemáticas cuyo anfitrión es el blog pimedios.

Newton, Principia, Proposición 6

Sean AC y FG arcos de la misma o diferentes trayectorias de un punto que se mueve sujeto a una fuerza central ejercida desde un punto fijo S, recorridos en intervalos de tiempo Δt1 y Δt2 y sean B y D las intersecciones de la trayectoria con las semirectas que pasan por S y los puntos medios b,d de las cuerdas AC,FG.
La proposición 6 de los Principia demuestra que si FB es la fuerza ejercida desde S en el punto medio del arco AC, y FD es la fuerza ejercida desde S en el punto medio del arco FG, entonces la razón FB/FD entre las fuerzas es igual al límite, cuando Δt1 y Δt2 tienden a cero, de la razón (Bb·Δt22)/(Dd·Δt12), o, dicho de otra forma, las fuerzas son últimamente proporcionales directamente a las ‘sagitas’ Bb y Dd e inversamente a los cuadrados de los tiempos.

Porque, por un lado, si los intervalos Δt1, Δt2 son iguales, el límite de la razón entre las sagitas es igual a la razón entre las fuerzas. Este es el corolario 4 del teorema 1, que Newton justifica observando que en un paralelogramo de fuerzas, la sagita Bb, en la figura, es la mitad del vector que representa la fuerza ejercida en B hacia S.

Por otro lado, dada una fuerza, al decrecer el intervalo de tiempo (es decir, la longitud del arco AC) hacia cero, la sagita es últimamente proporcional al cuadrado del arco, lo que Newton demostró en el lema 11, observando que llegando al límite podemos sustituir la curva por la circunferencia osculatriz en el punto medio B’ del arco y que entonces, en la figura, B’C2 = B’b·B’H, por ser B’CH un triángulo rectángulo. Pero la sagita B’b es proporcional a la B’b’ que últimamente es igual a la Bb y la longitud de la cuerda B’C es últimamente la del arco B’C, y entonces la sagita es últimamente como el cuadrado del arco, es decir como el cuadrado de los tiempos.

Alternativamente se puede argumentar que el movimiento de B a C es la suma de un componente inercial BR en la dirección de la tangente y un componente RC, igual últimamente a Bb, debido a la atracción desde S, y el lema 10 dice que los desplazamientos iniciales RC, producidos por una fuerza, son como los cuadrados de los tiempos.

Entonces las sagitas son directamente proporcionales a las fuerzas y al cuadrado de los tiempos, y por tanto las fuerzas son directamente proporcionales a las sagitas e inversamente a los cuadrados de los tiempos.

Como veremos en la entrada siguiente, en los corolarios de esta proposición Newton obtiene unas ‘formulas’ que dan geométricamente la razón entre las fuerzas en diferentes puntos de la(s) trayectoria(s) de un punto móvil sujeto a la ley de la inercia y una fuerza continua cualquiera, ejercida desde un mismo centro de fuerzas.

La ley de áreas y la velocidad

Si, en la figura, el punto S está fijo y el punto P se mueve sobre la curva azul, obligado por la ley de la inercia y una fuerza de atracción desde S, es decir, de forma que el radio SP barre áreas iguales en tiempos iguales, entonces la velocidad de P en cada instante es inversamente proporcional a la distancia desde S a la tangente a la trayectoria (en la posición de P en ese instante), y si la velocidad es inversamente proporcional a la distancia a la tangente, SP barre áreas iguales en tiempos iguales.
En la figura , la velocidad de P en B será a su velocidad en D como Sd es a Sb.

El resultado anterior es el primer corolario del primer teorema de los Principia, que Newton enuncia así:
“Corolario 1. La velocidad de un cuerpo atraído hacia un centro inmóvil en un espacio no resistente es inversamente como la perpendicular trazada desde tal centro a la tangente de la curva.”

Porque se cumple para trayectorias poligonales, como la trayectoria ABCD de la figura, donde el movimiento inercial del punto se altera por impulsos instantáneos dirigidos hacia el centro S aplicados en B y C:
Si ab y cd son espacios recorridos en tiempos iguales, por el primer teorema de los Principia las áreas de los triángulos Sab y Scd son iguales. Entonces las bases ab, cd de esos triángulos son inversamente proporcionales a sus alturas. Pero esas bases ab, cd, recorridas en tiempos iguales, son proporcionales a las velocidades del punto móvil cuando recorre los segmentos AB y CD de la trayectoria poligonal.

Como una trayectoria curva producida por una fuerza central es el límite de trayectorias poligonales cuando la duración de los intervalos entre impulsos tiende a cero, en esa curva la velocidad en cada punto será inversamente proporcional a la distancia desde el centro de fuerzas a la tangente en ese punto.

Newton, Principia, Proposiciones 1 y 2

En el primer teorema de los Philosophiae Naturalis Principia Mathematica, Newton demuestra que si la dirección de las fuerzas que se ejercen sobre un punto que se mueve, sujeto a esas fuerzas y a la ley de la inercia, pasa por un punto inmóvil, entonces las áreas barridas por el radio entre ese punto, o centro de fuerzas, y el punto que se mueve son proporcionales a los tiempos.
Y en el segundo teorema demuestra la recíproca, es decir si las áreas barridas desde un centro fijo son proporcionales a los tiempos, entonces las fuerzas, que hacen que el punto móvil se desvíe de la línea recta, se ejercen en la dirección de ese centro.

A continuación doy el argumento de Newton, con una presentación algo diferente de la original. (El original latín se puede ver aquí o en la traducción inglesa de Motte aquí).

Es claro que si un punto se mueve a velocidad constante en línea recta desde A hacia H , las áreas barridas por el radio trazado desde el punto móvil a un punto fijo S, que no esté en esa recta, son proporcionales a los tiempos, porque los espacios recorridos AB, GH son proporcionales a los tiempos, y las áreas de los triángulos barridos ABS,GHS son proporcionales a las bases AB, GH, pues la altura de esos triángulos es fija e igual a la distancia entre S y la recta de la trayectoria (Euclides I.38).

Supongamos ahora que, moviéndose el punto desde A hacia B a velocidad uniforme representada por el vector BD, al llegar a B se le aplica un impulso instantáneo BE que modifica su velocidad al vector BF, continuando el punto moviéndose uniformemente hacia C con la nueva velocidad BF, compuesta de la que tenía antes y de la producida por el impulso.

Si S es un punto situado en la recta BE, distinto de B, las áreas barridas por el segmento entre S y el punto móvil son también son proporcionales a los tiempos en la trayectoria ABC quebrada en B por ese impulso BE.

Porque si el punto llega a B en el momento t con velocidad BD, donde BD es el espacio recorrido en un intervalo Δt, y en t-Δt estaba en A, si no se ejerciese ninguna fuerza llegaría a D en el instante t+Δt, con AB=BD, y las áreas de los triángulos SAB,SBD son iguales.
Con el impulso aplicado en B en el instante t, en t+Δt el punto móvil llega a F desde B con la nueva velocidad BF, y el área barrida en ese intervalo entre t y t+Δt será el triángulo SBF. Pero las áreas de SBF y SBD son iguales pues esos triángulos tienen la misma base SB y la misma altura. Por tanto las áreas de SBA y SBF, barridas en tiempos iguales, son iguales.

Recíprocamente, si las áreas SBA, SBF, barridas en tiempos iguales, son iguales, DF será paralela a SB (Euclides I.39) y, como también es paralela a BE, S está en la recta BE.

Por tanto si un punto se mueve sujeto a la ley de la inercia y a fuerzas aplicadas en diferentes instantes, cuyas direcciones estén en las rectas que unen un punto fijo S con el punto de la trayectoria en que se aplica la fuerza, el punto móvil describe unas trayectoria poligonal y el radio que lo une al punto fijo barre áreas proporcionales a los tiempos.

Recíprocamente si ese radio barre áreas proporcionales a los tiempos, los impulsos están en la dirección de la recta que une S con los puntos en que cambia la trayectoria.

Si disminuimos hacia cero la duración de los intervalos entre los instantes en que se aplican los impulsos, en el límite tendremos una fuerza ejercida continuamente y el límite de las trayectorias poligonales será una curva en la que las áreas barridas por el radio desde el centro de fuerzas S al punto móvil serán proporcionales a los tiempos.

Y recíprocamente, si ese radio barre áreas proporcionales a los tiempos, la fuerza se ejerce en la dirección de la recta que une S con los puntos de la trayectoria curva.

Una curva plana puede ser la trayectoria de un punto P que se mueve sujeto a la ley de la inercia y a una fuerza, modulada adecuadamente en el tiempo, ejercida desde un punto fijo S del plano, con la condición de que podamos mover un punto, en un mismo sentido alrededor de S (es decir sin que la trayectoria ‘vuelva hacia atrás’) sobre la curva de forma que las áreas barridas por el radio SP sean proporcionales a los tiempos.