domingo, 3 de junio de 2012

El nuevo problema de la inducción (2)


Con tanta economía me estoy olvidando de completar la serie de entradas sobre el problema de la inducción. Aquí se presentaba el problema y mi visión de él, aquí se hablaba del nuevo problema de la inducción. Básicamente viene a decir que no hay manera de distinguir entre la Física tal como la conocemos y la Física que es igual a ella excepto porque las leyes se acaban en el solsticio de invierno de 2012. Llamémoslas Física I y Física II. Más concretamente diríamos que, no importa qué probabilidades a priori tuviéramos para cada una de estas dos posibilidades, los datos habrán ido rechazando la Física aristotélica y la newtoniana y habrán aumentado las la Física I y la Física II y además lo habrán hecho en igual proporción. Esto es así porque los datos son tan compatibles con una como con la otra.

Normalmente la razón de elegir como más probable la Física I es que es más sencilla. Física II requiere de los axiomas de Física I y, además, de la desaparición del mundo en plan profecía maya inventada. Esto permite justificar el tener una creencia a priori de que Fisica I es, digamos, 100 veces más probable que Física II, pero no para justificar que esta proporción cambie con los datos.

Voy a argumentar que esto no es necesariamente así.

Junto con los datos que nos sirven para decir cosas exclusivamente acerca de la Física, tenemos en nuestro quehacer científico datos sobre cómo se van siendo las teorías que construimos para explicar la realidad. Y, entre otras cosas, vamos aprendiendo que las hipótesis innecesarias no aportan nada a la teoría, y esto es algo de lo que cada vez tenemos más datos, de manera que cada vez podemos poner menos peso relativo en la creencia de que las teorías con hipótesis innecesarias sean ciertas. La hipótesis del fin de las leyes de la física tal como las conocemos dentro de unos meses y dentro del modelo de Universo que tenemos para explicar lo observado es totalmente innecesaria.

Lo anterior no es una demostración lógica de nada, porque bien podría ser que la realidad fuera como Física II y simplemente nuestros datos sobre cómo hemos construido otras teorías no se aplican a la Física, en donde esta hipótesis findelmundesca sí es necesaria para explicar el mundo. Lo anterior es una manera de ilustrar que no es lógicamente imposible tener un modelo de cómo construimos teorías en el que quepa decir que cada vez que tenemos más datos Física II pierde terreno frente a Física I.

Creo que esto es lo más que podemos llegar a decir. Y creo que no es poco (y algo parecido hice con el problema clásico de la inducción), considerando que el nuevo problema de la inducción se suele presentar como irresoluble. Lo que vendo a decir es que, según el modelo epistemológico que se elija será irresoluble o no. ¿Cómo elegir entre modelos epistemológicos? Igual que elegimos entre teorías sobre el mundo, escogiendo aquellos que explican mejor su objeto de estudio. En este caso, cómo se elaboran las teorías científicas. Y el modelo epistemológico que tiene en cuenta nuestro proceder científico en todas las materias explica mejor el quehacer científico que el que propone una epistemología para cada ciencia.

------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------

10 comentarios:

  1. Hola José Luis:



    Se trata de un problema absurdo que parece que vas a plantear como yo.

    Si consideramos los datos que tenemos y lo que podemos verificar con ellos, lo irrelevante en una teoría es aquello que podemos cambiar por su opuesto y que deja una teoría tan verificable como la primera.

    Un ejemplo.

    De noche, oímos el ruido de un escape de motocicleta, por lo tanto dado el ruido es altamente probable que haya una motocicleta. ¿Es igualmente probable que se trate de una moto blanca? ¿Y una moto blanca con una pegatina del Sporting de Gijón?


    Un saludo, y a ver si me libero y puedo escribir algo en tus otras entradas.

    ResponderEliminar
    Respuestas
    1. Hace falta el hacer el hincapié en cómo hemos ido acumulando evidencia de que las hipótesis irrelevantes para los datos que tenemos ahora nos parecen cada vez menos probables. De esto el ejemplo no es del todo bueno. La moto será blanca o no. Ambas hipótesis son irrelevantes dados los datos, pero ambas no pueden ser menos probables cada vez.

      Eliminar
  2. "Física II requiere de los axiomas de Física I y, además, de la desaparición del mundo en plan profecía maya inventada."

    No, no es un ademas, es en vez de, son axiomas incompatibles. El conjunto de mundos donde Fisica II es cierta NO es un subconjunto de los mundos donde Fisica I es cierta. Asignar mayor probabilidad a priori a Fisica I es un sesgo no justificado hacia la simplicidad.

    "Esto permite justificar el tener una creencia a priori de que Fisica I es, digamos, 100 veces más probable que Física II"

    De nuevo, en mi opinion _no_ existe razon para asignar mayor probabilidad a priori a Fisica I que II, a no ser que sea una suposicion explicita, un sesgo hacia la simplicidad.

    Sore la justificacion empirica que luego haces me parece que caes en el mismo problema pero con otros terminos. El hecho de que las teorias simples en el pasado hayan tenido mayor exito no indica que en el futuro tambien lo seguiran teniendo, a no ser que presupongas un universo sencillo en el que el futuro es como el pasado, cosa que es precisamente lo que estas intentando determinar.

    "Lo anterior es una manera de ilustrar que no es lógicamente imposible tener un modelo de cómo construimos teorías en el que quepa decir que cada vez que tenemos más datos Física II pierde terreno frente a Física I."

    Claro que no es _logicamente_ imposible, como digo antes, solo tienes que asignar mayor probabilidad a priori a teorias simples. Pero que algo no sea logicamente imposible no implica que este justificado.

    En resumen, no hay forma de sustentar el sesgo a priori hacia la simplicidad empiricamente (por definicion de a priori) ni logicamente (bueno, sobre esto hay algo mas que decir pero no cabe aqui, a ver si escribo las entradas pendientes!)

    ResponderEliminar
    Respuestas
    1. "El conjunto de mundos donde Fisica II es cierta NO es un subconjunto de los mundos donde Fisica I es cierta."

      Tienes razón, solo intentaba poner en otros términos la idea de que Física II es un mundo más complejo que Física I. No sé si es posible expresarlo rigurosamente para alguna definición de complejo y poder aplicar la navaja de Ockham con completo rigor. Pero en realidad esta no es la parte importante, sino la siguiente, que trata de la disminución de su probabilidad de Física II con respecto a Física I.

      "Claro que no es _logicamente_ imposible, como digo antes, solo tienes que asignar mayor probabilidad a priori a teorias simples. Pero que algo no sea logicamente imposible no implica que este justificado."

      Pero, como decía antes, falta mostrar también que Física I es más simple. A nosotros nos lo parece, pero habría que formalizar eso. Lo que digo que no es lógicamente imposible no es el asignar una probabilidad a priori menor a Física II, sino tener un modelo epistemológico en el que disminuya relativamente respecto a Física I. No es justificado en el sentido de que eso demuestre que sea así (eso está claro y nunca lo pretendía) sino en el sentido de tener un modelo en el que sea coherente lógicamente y concorde con nuestra interacción con la realidad no solo en Física sino en el resto de las teorías.

      Míralo de otra forma: no es posible mostrar lógicamente que la Tierra es redonda (ahora, sin mojarse en que lo seguirá siendo en el futuro). Lo que es posible es formular una teoría de la Tierra redonda que sea lógicamente coherente y que sea concorde con nuestra interacción con la realidad. Lo mismo hago para la epistemología de la inducción.

      Estoy contigo en que no hay demostraciones formales de la inducción, pero creo que con lo anterior podemos avanzar algo más que el punto en que se suele dejar el problema, evitando la consideración de los argumentos como circulares.

      Eliminar
  3. "Lo que digo que no es lógicamente imposible no es el asignar una probabilidad a priori menor a Física II, sino tener un modelo epistemológico en el que disminuya relativamente respecto a Física I."

    En un esquema bayesiano las dos cosas son inevitablemente la misma. La unica manera de que disminuya relativamente (dado que las predicciones son indistinguibles) es a traves de una menor probabilidad a priori.

    "Pero en realidad esta no es la parte importante, sino la siguiente, que trata de la disminución de su probabilidad de Física II con respecto a Física I."

    Por lo que digo antes, es precisamente esta la parte importante, de hecho es la unica que el formalismo bayesiano permite dados los likelihoods P(E|H) iguales.

    "No sé si es posible expresarlo rigurosamente para alguna definición de complejo y poder aplicar la navaja de Ockham con completo rigor."

    "A nosotros nos lo parece, pero habría que formalizar eso"

    Si, es posible, por ejemplo a traves de la longitud de la descripcion algoritmica de la teoria. Esta complejidad algoritmica es asimptoticamente unica. (Ver kolmogorov complexity y solomonoff induction)

    Pero de nuevo, el hecho de poder aplicar la navaja rigurosamente no quiere decir que su aplicacion no sea una suposicion, suposicion que damos por hecha claro.

    ResponderEliminar
  4. "En un esquema bayesiano las dos cosas son inevitablemente la misma. La unica manera de que disminuya relativamente (dado que las predicciones son indistinguibles) es a traves de una menor probabilidad a priori."

    Es lo que he intentado decir que no tiene por qué ser así. La probabilidad de que las hipótesis superfluas no sean ciertas aumenta a medida que encontramos teorías en las que esto es así. En un modelo más amplio en que tratamos estas hipótesis, claro.

    Sobre la complejidad, conozco varias medidas, cada una con su interés, pero no hay una manera única de medir la complejidad como para poder deducir que la teorías más complejas según esa medida son menos probables. De nuevo, será posible construir un modelo epistemológico en el que eso sea así, lo cual es suficiente para decir que es lógicamente coherente y, a partir de ahí, mostrar que se adapta bien al quehacer científico, pero no para demostrar lógicamente que la epistemología tenga que ser así. En esto segundo estamos de acuerdo, creo, tanto en esto como en lo del modelo de la inducción. Lo que intento añadir en estas entradas es lo primero. Nada más. Y nada menos.

    ResponderEliminar
  5. "Es lo que he intentado decir que no tiene por qué ser así. La probabilidad de que las hipótesis superfluas no sean ciertas aumenta a medida que encontramos teorías en las que esto es así. En un modelo más amplio en que tratamos estas hipótesis, claro."

    O la diferencia en el posterior viene de diferencias en los likelihoods P(E|H) o viene de diferencias en los priors P(H). Si las teorias con "hipotesis superfluas" deben ser penalizadas, pero tienen los mismos likelihoods, solo pueden ser penalidas via los priors. Creo que lo que propones es matematicamente imposible en el un esquema bayesiano, asi que lo voy a dejar aqui.

    "pero no hay una manera única de medir la complejidad como para poder deducir que la teorías más complejas según esa medida son menos probables."

    Claro que no se puede _deducir_, se puede _formalizar_ de manera que se pueda aplicar la navaja de manera rigurosa (y universal dada la naturaleza asimptotica de kolmogorov). Pero aun siendo algo formalizado no se _deduce_ de nada, es un _acto de fe_, que es lo que estoy intentando establecer; que el conocimiento cientifico esta sustentado en ultimo termino por una creencia.

    Escribire algo sobre aspectos tecnicos que quedan por decir, gracias por la entrada!

    ResponderEliminar
    Respuestas
    1. "O la diferencia en el posterior viene de diferencias en los likelihoods P(E|H) o viene de diferencias en los priors P(H)."

      Completamente de acuerdo. Lo que digo es que sí puede haber diferencia en las likelihoods (probabilidades condicionales de que la teoría sea cierta dadas las observaciones), si uno tiene un modelo más amplio en el que la observación de que en otras teorías las hipótesis superfluas tienden a desaparecer y eso le hace disminuir la probabilidad a las hipótesis superfuas de la teoría de que se trata.

      Eliminar