El método de la falsa posición pretende conjugar la seguridad del método de la bisección con la rapidez del método de la secante. Este método, como en el método de la bisección, parte de dos puntos que rodean a la raíz f(x) = 0, es decir, dos puntos x0 y x1tales que f(x0)f(x1) < 0. La siguiente aproximación, x2, se calcula como la intersección con el eje X de la recta que une ambos puntos. La asignación del nuevo intervalo de búsqueda se realiza como en el método de la bisección: entre ambos intervalos, [x0,x2] y [x2,x1], se toma aquel que cumpla f(x)f(x2) < 0.
Figure: Representación geométrica del método de la falsa posición.
[scale=0.9]eps/falpos
La elección guiada del intervalo representa una ventaja respecto al método de la secante ya que inhibe la posibilidad de una divergencia del método. Por otra parte y respecto al método de la bisección, mejora notablemente la elección del intervalo (ya que no se limita a partir el intervalo por la mitad).
Figure: Modificación del método de la falsa posición propuesta por Hamming. La aproximación a la raíz se toma a partir del punto de intersección con el eje X de la recta que une los puntos ( x0,f(x0)/2) y (x1,f(x1)) si la función es convexa en el intervalo (figura a) o bien a partir de la recta que une los puntos (x0,f(x0)) y (x1, f(x1)/2) si la función es cóncava en el intervalo (figura b).
[scale=0.9]eps/hamming
Sin embargo, el método de la falsa posición tiene una convergencia muy lenta hacia la solución. Efectivamente, una vez iniciado el proceso iterativo, uno de los extremos del intervalo tiende a no modificarse. Para obviar este problema, se ha propuesto una modificación del método, denominada método de Hamming. Según este método, la aproximación a una raíz se encuentra a partir de la determinación del punto de intersección con el eje X de la recta que une los puntos ( x0,f(x0)/2) y (x1,f(x1)) si la función es convexa en el intervalo o bien a partir de la recta que une los puntos (x0,f(x0)) y (x1, f(x1)/2) si la función es cóncava en el intervalo. Como hemos comentado, el método de Hamming requiere determinar la concavidad o convexidad de la función en el intervalo de iteración. Un método relativamente sencillo para determinar la curvatura de la función consiste en evaluar la función en el punto medio del intervalo, f(xm) (en donde xm se calcula como en el método de la bisección) y comparar este valor con la media de los valores de la función en los extremos del intervalo, . Tenemos entonces que:
El método de la secante, es otro método para aproximar el cero de una función en el que en cada iteración se evalúa la función y no la derivada. A continuación se presenta este método.
Utiliza la misma fórmula del Método de Newton:
pero en lugar de utilizar la derivada f ´(xn), este valor se aproxima por
Al reemplazar esta aproximación de f ´(xn) en la fórmula de Newton resulta:
Ya que el cálculo de xn+1 requiere conocer xn y xn-1 , se debe dar al principio dos aproximaciones iniciales x0 y x1.
La interpretación geométrica del método de la secante es similar a la del método de Newton. La recta tangente a la curva se reemplaza por una recta secante. El cero de f se aproxima por el cero de la recta secante a f. Si x0y x1 son las aproximaciones iniciales, la aproximación x2 es la intersección de la recta que une los puntos (x0, f(x0)) y (x1,f(x1)). La aproximación x3 es la intersección de la recta que une los puntos (x1, f(x1)) y (x2, f(x2)) y así sucesivamente.
Ejemplo.
Efectúe tres iteraciones del método de la secante para la función f(x) = xsenx - 1 con x0=1 y x1=2.
Solución:
Para este caso f(x4) = -0.000896772969
|f(x4)| < 0.0009.
Este ejercicio se resolvió con el método de bisección en la sección anterior y en la novena iteración |f(x9)| = 0.001216...
El método de la secante converge a la solución más lentamente que el método de Newton, pero tiene la ventaja de no usar la derivada en cada iteración.
El método de Newton o también llamado método de Newton-Raphson es uno de los métodos mas útiles y mejor conocido para aproximar el cero de una función. Suponga que c es un cero de f , es decir, f(c)=0 y que x0 es una aproximación dec. El polinomio de Taylor de grado uno para f alrededor de x0 y su correspondiente residuo es:
(1)
z esta entre x0 y x.
Si en la ecuación (1) se reemplaza x por c y usando el hecho que f(c) = 0, se obtiene:
(2)
si x0 está suficientemente cerca de c, entonces en el último sumando de la ecuación (2) el término (c - x0)2será pequeño, comparado con la suma de los dos primeros términos.
Si se desprecia este término se puede usar la expresión (2) para encontrar una aproximación al cero de f.
0 f(x0) + f'(x0)(c - x0)
Despejando c en la ecuación anterior, resulta:
El método de Newton comienza con una aproximación inicial x0 del cero de la función a partir de la cual se define una sucesión {xn} de aproximaciones definida por
, n0 (3)
Desde un punto de vista geométrico, lo que hace el método de Newton es construir la recta tangente a la gráfica de f en un punto cercano x0 a c y encontrar el cero de la recta tangente, x1(véase la figura 5.2). La aproximación x2 es el cero de la recta tangente a la gráfica de f en el punto x1 y así sucesivamente.
Ejemplo 1.
Para aproximar una solución de la ecuación 3x + senx - ex, se puede tomarf(x)=3x+senx-ex. Observe que f(0) = -1 y f(1) = 1.123189, según el teorema del valor intermedio existe un cero de f en el intervalo [0,1].
Si se aplica el método de Newton comenzando con x0 = 0 se tiene:
Los criterios de parada mencionados en el método de bisección también se pueden usar en el método de Newton.
A continuación se escribe un algoritmo para el método de Newton (N = Número máximo de iteraciones, E = Tolerancia o margen de error).
Cualquier programa para computadora que se base en el algoritmo anterior necesitará subprogramas o procedimientos para calcular f(x) y f´(x).
ANÁLISIS DE ERRORES
A continuación se analizará los errores del método de Newton. Entendiéndose por errores las cantidades en = xn- c, xn: aproximación del cero de f, c: cero de f
Observe que :
(4)
Por el teorema de Taylor.
donde zn esta entre xn y c ( ya queen=xn- c, c = xn- en).
Ahora,
reemplazando este resultado en la ecuación (4), se tiene
Este resultado indica que cada error es proporcional a la segunda potencia del error previo. Es decir, que si se comienza con una aproximación del cero de f con 1 dígito correcto, después de una iteración se tendría dos dígitos correctos; después de dos iteraciones cuatro dígitos correctos; y después de tres iteraciones ocho dígitos correctos, etc.
Ejemplo 2.
Halle una expresión para aproximar la raíz cuadrada de un número R>0. Use la expresión para aproximar
Solución:
Se puede aplicar el método de Newton a la función f(x)=x2-R
Para aproximar , se usa la fórmula con R=5 y si se toma x0=2 entonces
en una calculadora = 2.236067977
Notas:
Uno de los inconvenientes del método de Newton es la posibilidad de que se divida entre cero en la fórmula (3), lo que ocurriría si f’(xn)=0.
Existen funciones y puntos iniciales para los que el método de Newton fracasa. En la figura 5.3 se muestra una función en la que la gráfica tiene una forma que para ciertos valores iniciales la sucesión {xn} diverge.
En el método de Newton hay que evaluar dos funciones en cada iteración,f(xn) y f’(xn). Para algunas funciones f’(xn) no es una expresión sencilla y se requieren más operaciones aritméticas para evaluarla que para la función. Esto hace que el método de Newton sea más costoso, por ejemplo que el método de bisección, en el que en cada iteración la función se evalúa una vez.
El Método de Punto Fijo (también conocido como iteración de punto fijo), es otro método para hallar los ceros de f(x). Para resolver f(x) = 0, se reordena en una forma equivalente:
f(x) = 0 x - g(x) = 0 x = g(x)
Observe que si c es un cero de f(x), f(c)=0 y c=g(c). (Siempre que se tenga c=g(c) se dice que c es un punto fijo de la función g). Para aproximar un cero de f se utiliza la iteración de punto fijo (1) xn+1 = g(xn) , n = 0, 1, 2, 3, . . .
donde x0 es una aproximación inicial del cero de f.
Ejemplo.
f(x) = x2 - 2x - 3 = 0, tiene dos ceros. x = 3 y x = -1
Supóngase que se reordena para lograr la forma equivalente:
Si se comienza con x0 = 4 y se itera con la iteración de punto fijo (1), los valores sucesivos de x son:
parece que los valores convergen a x = 3.
Otro reordenamiento de f(x) = 0 es :
Si nuevamente se comienza con x0 = 4, los valores sucesivos de x son:
parece que ahora x converge al otro cero de f, x = -1.
Considérese un tercer reordenamiento
Comenzando de nuevo con x0 = 4 se obtiene:
x0 = 4 x1 = 6.5 x2 = 19.625 x3 = 191.070
resulta evidente que las iteraciones son divergentes.
La diferencia en el comportamiento de los tres reordenamientos se puede apreciar considerando las gráficas en los tres casos. El punto fijo de x = g(x) es la intersección de la recta y = x, y la curva y = g(x). En la figura 5.5 se presentan los tres casos. Se comienza en el eje x con x0, se efectúa un desplazamiento vertical hacia la curva, luego uno horizontal hacia la recta y = x, luego uno vertical hacia la curva y nuevamente una horizontal hacia la recta. Este proceso se repite hasta que los puntos en la curva convergen a un punto fijo o bien divergen. Parece que los diferentes comportamientos dependen de que la pendiente de la curva sea mayor, menor o de signo opuesto a la pendiente de la recta (que es igual a 1)
Cuando se tiene la ecuación f(x) = 0, existen muchas formas de reordenarla en la forma x = g(x), por ejemplo para la ecuación anterior x2-2x-3 = 0 otras alternativas son: **
Una pregunta que surge en este momento es ¿cuál de las funciones g sirve para aproximar el punto fijo de g? (o en forma equivalente el cero de f) . A continuación se presenta un teorema que da condiciones suficientes para la existencia y unicidad del punto fijo de una función.
Teorema 1.
Si g es continua [a,b] y g(x) [a,b] para toda x [a,b], entonces g tiene un punto fijo en [a,b]. Y si además g’(x) existe en (a, b) y existe una constante positiva K < 1 con |g'(x)| K, para todo x (a,b), entonces el punto fijo en [a,b] es único.
Ejemplo.
La función g(x)=(x2-3)/2 en el intervalo [2,4] tiene un punto fijo único. c=3 es un punto fijo de g porque
Observe que g'(x)=x y en el intervalo [2,4] g'(x)>0. g es creciente y g(x) [1/2 ,6.5], además |g'(x)| 1. (ya que g'(x)=x y x (2,4)).
Esto demuestra que las hipótesis del teorema 1 son suficientes para garantizar un punto fijo único, pero no son necesarias.
El siguiente resultado da algunas pistas sobre los procedimientos que se deben seguir y algunos que se deben excluir para escoger funciones que produzcan sucesiones que converjan a un punto fijo.
Teorema 2
Sea g una función continua en [a,b] tal que g(x) [a,b] para toda x en [a,b].Además suponga que existe g' en (a,b) y una constante positiva K<1 tal que|g'(x)|K, para toda x (a,b), entonces para cualquier número x0en (a,b), la sucesión definida por xn+1=g(xn), converge al único punto fijo x en [a,b].
Corolario.
Si g satisface las hipótesis del teorema 2, una cota para el error al aproximar el punto fijo x de g por xn es:
Ejercicio 1.
Aplique el teorema 2 para demostrar que tiene un punto fijo único en [2,4]. Use el corolario para estimar la cantidad de iteraciones necesarias para lograr una exactitud de 10-2 y después compare esta estimación teórica con la cantidad que realmente se requiere, use x0=3.5.
Solución:
Luego, g(x) [g(2),g(4)] = [2.65, 3.32]
Por lo tanto g(x) [a,b] = [2,4]
Además , porque g'(x) es decreciente y x (2,4)
Como |g'(x)| K = 0.378 < 1 el punto fijo de g es único en [2, 4].
Para determinar aproximadamente el número de iteraciones necesarias para lograr una exactitud de 10-2 se usa el corolario ,
a = 2
b = 4
x0 = 3.5
|xn - x| (0.378)nmáx {1.5, 0.5}
k = 0.378
|xn - x| (0.378)n(1.5)
Como el error debe ser menor que 10-2 entonces
(0.378)n(1.5) < 10-2
n > 5.15042...
Por lo tanto se necesitan unas seis iteraciones para lograr una aproximación exacta dentro de 10-2.
Este ejercicio ya se resolvió al comienzo de esta sección y se obtuvo x5=3.00381.
Observe que el error real es | x5 - x| = |3.00.81 - 3| = 0.00381 < 10-2 = 0.01.
Cabe señalar que el corolario no da más que una cota del número de iteraciones necesarias. En la mayoría de casos se requiere un número menor de iteraciones.