Análisis en profundidad

Computación cuántica e inteligencia artificial

Las tecnologías de la información cuántica y los sistemas de aprendizaje inteligente son tecnologías emergentes que tendrán un impacto transformador en nuestra sociedad. Los investigadores han examinado la cuestión de hasta qué punto estos campos pueden realmente aprender y beneficiarse unos de otros. Recientemente, hemos visto avances significativos en ambas direcciones de influencia: por un lado, la computación cuántica está encontrando una aplicación vital para proporcionar aceleración a los problemas de aprendizaje automático, y por otro lado, el aprendizaje automático puede llegar a ser instrumental en las tecnologías cuánticas avanzadas. Los trabajos que exploran el uso de la inteligencia artificial para diseñar experimentos cuánticos por sí mismos y realizar auténticas partes de la investigación de forma autónoma han reportado sus primeros éxitos

24 Mar 2022
computación cuántica

Las tecnologías de la información cuántica y los sistemas de aprendizaje inteligente son tecnologías emergentes que tendrán un impacto transformador en nuestra sociedad. Ya se han construido pequeñas computadoras cuánticas como prueba de concepto en los que se están investigando a fondo los principales obstáculos de la computación cuántica a gran escala. Entre sus posibles usos: el control de calidad permitirá descifrar códigos criptográficos clásicos, simular sistemas cuánticos a gran escala y acelerar la búsqueda y la optimización. Por ejemplo, se pueden aprovechar variantes del algoritmo Grover para conseguir aceleraciones cuadráticas en problemas de búsqueda, y algunos desarrollos recientes en el aprendizaje automático cuántico han permitido obtener ganancias exponenciales en algunas tareas de aprendizaje. Estas ideas tienen el potencial de ejercer un efecto transformador en la investigación de la IA. Además, los aspectos técnicos del control de calidad, que imponen algunas limitaciones físicas a la observación del funcionamiento interno de una máquina cuántica y dificultan la verificación de los cálculos cuánticos, pueden suponer un reto adicional para los problemas de alineación de la IA. La computación cuántica (QC) es capaz de analizar fácilmente los datos de frecuencia (FFT), lo que permite resolver el problema de la factorización de forma exponencialmente más rápida que incluso la supercomputadora clásica más potente hasta la fecha.

Computación Cuántica

Criterios de DiVincenzo

Una computadora cuántica tiene características técnicas muy diferentes a las de una computadora clásico. Los criterios de DiVincenzo deben tenerse en cuenta a la hora de diseñar una computadora cuántica. Esto nos permite establecer las directrices generales que deben seguirse, en particular definiendo las cuatro características fundamentales que debe poseer una máquina de este tipo:

  1. Debe ser capaz de representar los QuBits;
  2. Capaz de realizar un grupo de transformaciones unitarias sobre las mismas;
  3. Preparar un estado inicial con suficiente confianza;
  4. Ser capaz de medir el resultado final;

La velocidad a la que se realizan los distintos cálculos en el QuBit, entre el momento en que se inicializa el estado y el momento en que se mide, debe ser tal que no se pierda información debido a la decoherencia (véase el párrafo siguiente). Así, sólo se puede realizar un número finito de operaciones antes de perder la información.

Otro detalle importante para el uso eficiente de una computadora cuántica es la escalabilidad. Un procesador de este tipo no debería presentar problemas ni costos insoportables a medida que aumenta el número de QuBits utilizados. Es la contrapartida de lo que ocurre en lass computadoras clásicas, en las que es posible aumentar la potencia y la velocidad de los cálculos que se pueden realizar miniaturizando cada vez más los procesadores, sin pérdida de rendimiento. Esto es así hasta que se alcanzan escalas físicas para las que la miniaturización está permanentemente limitada.

Decoherencia

Un fenómeno que hay que tener en cuenta a la hora de desarrollar un QuBit es la decoherencia, que provoca la pérdida de información. Similar en algunos aspectos al ruido de la electrónica clásica, no está relacionado con una perturbación externa, sino que depende en gran medida de la metodología utilizada para desarrollar el QuBit. Se trata de un acontecimiento probabilístico que provoca una pérdida espontánea e inevitable de información. Del mismo modo que un electrón en un estado excitado tiende a perder energía espontáneamente, para volver al estado fundamental. Esto no ocurriría en un sistema completamente aislado y se debe a las interacciones incontroladas con el entorno cuya función de onda no está completamente aislada de la del sistema. Cabe señalar que la decoherencia sigue siendo un fenómeno cuántico, representado mejor por la Esfera de Bloch (Figura 1), que también es una excelente representación para un QuBit. Este fenómeno conduce a la pérdida del estado de superposición entre dos estados, convirtiéndose en una mezcla estadística, que puede ser descrita por el operador de densidad.

Diagrama Descripción generada automáticamente

Figura 1 – Esfera de Bloch, representación geométrica del Qubit. Esfera de radio unitario. El radio, que se obtiene uniendo cualquier punto de la superficie con el centro de la esfera, representa el estado que puede asumir el qubit. Cuando el radio apunta al norte de la esfera, por definición el estado del qubit coincide con “0”. Cuando el rayo apunta al sur de la esfera, el estado del qubit coincide con “1”. En todos los demás casos, con el rayo que atraviesa la superficie de la esfera, el estado relativo del qubit puede definirse por referencia a dos cantidades específicas: los ángulos formados por el rayo con respecto al eje vertical de la esfera y su proyección sobre el plano que pasa horizontalmente por la esfera en su centro.

Qubit

Suponiendo un átomo con un solo electrón en la última órbita ocupada, el electrón puede ser desplazado (excitado) a una órbita más externa iluminándolo con una luz de una frecuencia y duración determinadas. En este caso, el electrón realiza un salto cuántico a un estado energético superior. Si el estado es estable, puede utilizarse, junto con el estado de menor energía, para representar los números 0 y 1 respectivamente.

Si el átomo “excitado” es alcanzado por otro pulso de luz, similar al anterior, el electrón vuelve a su estado de menor energía, liberando un fotón.

En el caso particular de que la duración del primer pulso de luz dure la mitad del tiempo necesario para cambiar el estado del electrón, éste estará en ambas órbitas simultáneamente. El electrón estará entonces en una “superposición” de los dos estados.

Según esta lógica, se puede almacenar una unidad de información, el qubit.

Así, las leyes de la mecánica cuántica implican que, además de los estados 1 y 0, también es posible un tercer estado, un estado intermedio o indeterminado, que no puede ser considerado como 1 o 0. Esto significa que un qubit (el equivalente cuántico del bit) no sólo puede estar en dos estados correspondientes a los valores lógicos 0 y 1, sino que puede estar simultáneamente en el estado 0 y en el estado 1. De ello se desprende que dos qubits pueden estar simultáneamente en los cuatro estados 00, 01, 10 y 11. Esto hace que el qubit sea mucho más versátil en los problemas computacionales que el bit real.

Un qubit puede definirse mediante notación matemática, lo que significa que si se mide, podrá ser 0 con probabilidad |a|2 y 1 con probabilidad |b|2, siendo a y b números complejos.

El símbolo | ⟩ representa un vector orientado. El estado – es diferente del estado +, como puede verse en la figura 3. El estado de un qubit se representa mediante un vector que llega a cualquier punto del círculo.

Diagrama Descripción generada automáticamente

Figura 3 – a y b números reales.

Suponemos que los dos estados son equiprobables (todos los resultados posibles son probables). En el caso de que el átomo se encienda durante la mitad del tiempo, en comparación con el tiempo necesario para la conmutación, se obtiene una superposición de estados. Así, si el bit es |0>, se convierte en |0> + |1>. Al recibir otro impulso igual al anterior, el bit pasa al estado |1>. Un pulso completo equivale al operador NOT, mientras que un medio pulso equivale a la raíz cuadrada de NOT. La relación se aplica:

x

Además del operador NOT existen otros tipos de operadores en la mecánica cuántica, que se pueden aplicar a las cantidades |0> y |1> y a sus combinaciones para transformarlas. Uno de ellos es el operador de Hadamard (H).

Analizar el circuito cuántico propuesto por Deutsch como circuito universal para construir una computadora cuántica, indicando con:

c – entrada de control;

t – entrada del objetivo;

se puede deducir que si medimos c y obtenemos 0 también t estará en 0; viceversa si medimos c obtenemos 1 t también estará en 1. Esto es porque el valor 0 de c no hace conmutar a t, mientras que el valor 1 lo hace conmutar. Entra en juego el principio de entrelazamiento: fenómeno cuántico, no reducible a la mecánica clásica, por el que, en determinadas condiciones, dos o más sistemas físicos representan subsistemas de un sistema mayor cuyo estado cuántico no puede describirse individualmente, sino sólo como una superposición de varios estados.

Imagen que contiene reloj Descripción generada automáticamente

Figura 4 – Circuito cuántico que implementa el algoritmo de Deutsch. La U indica la transformación.

Si dos qubits están ambos en la superposición de 0 y 1 se definen como enredados si el resultado de la medición de uno de ellos está siempre correlacionado con el resultado de la medición del otro qubit.

El entrelazamiento, junto con la superposición, es la piedra angular de todo el funcionamiento de la computadora cuántica. Porque sin el entrelazamiento, ¿cómo podrían correlacionarse los resultados obtenidos con los valores de entrada?

Con los tres mecanismos fundamentales de superposición, entrelazamiento e interferencia, es posible construir toda una lógica de circuito cuántico, al menos a nivel conceptual, con la que se puede destacar la extraordinaria capacidad de cálculo de una computadora cuántica.

Aplicaciones de la computación cuántica en la IA

La investigación resultante de la interacción entre la teoría cuántica y la IA puede clasificarse a grandes rasgos en dos categorías:

  1. utilizando algunas ideas de la teoría cuántica para resolver algunos problemas de la IA;
  2. la aplicación de ciertas ideas desarrolladas en la IA a la teoría cuántica.

En algunas investigaciones se han observado similitudes entre la estructura matemática utilizada por la comunidad de IA en el análisis semántico del lenguaje natural y las utilizadas en la mecánica cuántica. La observación de estas similitudes es útil, ya que puede aportar sugerencias sobre cómo se pueden tomar prestadas algunas ideas de la mecánica cuántica en el análisis semántico o incluso de forma más general en la IA. Además, si algunos aspectos semánticos de las lenguas naturales pueden expresarse correctamente en el marco de la teoría cuántica, por ejemplo la ambigüedad por superposición, el hecho de que los algoritmos cuánticos sean adecuados para simular sistemas cuánticos sugiere que la informática cuántica podría acelerar enormemente el procesamiento de las lenguas naturales.

Nelson, McEvoy y Pointer señalaron que las asociaciones de palabras en las lenguas naturales pueden mostrar “acciones espectrales a distancia”. Bruza et al. propusieron un modelo de asociaciones de palabras en términos de productos tensoriales para poder describir la “activación espectral remota” de forma similar al entrelazamiento cuántico.

Entre los diversos puntos en los que se encuentran la computación cuántica y la IA, tenemos:

Redes bayesianas cuánticas

Los problemas en los que el mundo es realmente aleatorio, y los problemas en los que el mundo no es aleatorio, pero no es perfectamente conocido, pueden modelarse utilizando redes de creencias (o redes de Bayes) y redes de decisión (o diagramas de influencia). Una red de creencias es un grafo sin ciclos directos en el que:

  • Los nodos están formados por un conjunto de variables aleatorias.
  • Los nodos están conectados por un conjunto de arcos que representan influencias causales mutuas.
  • Cada nodo se caracteriza por una tabla de probabilidad condicional que cuantifica los efectos que los padres tienen sobre él.

El mecanismo de inferencia sobre redes de creencias calcula la distribución de probabilidad a posteriori para un conjunto de variables de consulta, dados los valores exactos de algunas variables de prueba. Una vez construida la red que modela el sistema, el objetivo de su análisis es recoger pruebas y modificar su comportamiento en función de ellas.

Para modelar este comportamiento, se requiere una teoría estadística de la evidencia, que se basa en el teorema de Bayes:

Dónde:

  • la probabilidad de que la hipótesis sea verdadera dada la evidencia E;
  • la probabilidad a priori de que la hipótesis sea cierta en ausencia de pruebas específicas.

Esta ecuación es la base de todos los sistemas modernos de Inteligencia Artificial para la inferencia probabilística, ya que permite expresar la independencia condicional entre variables sin recurrir a una tabla de distribuciones de probabilidad conjuntas, lo que simplifica enormemente el cálculo de los resultados de las consultas.

En efecto, una vez definida la topología de una red de creencias, basta con especificar la tabla de probabilidades condicionales de cada nodo, y el proceso de actualización bayesiano (inferencia) incorpora las evidencias de una en una modificando la creencia previa en las variables desconocidas. Las redes de decisión amplían las redes de creencias incorporando acciones y utilidades: las preferencias de un agente entre los estados del mundo se resumen en una función de utilidad, que asocia a cada estado un único número que expresa su deseabilidad. Las utilidades se combinan con las probabilidades de las acciones para proporcionar una utilidad esperada de cada acción.

Al maximizar una función de utilidad que refleja correctamente las medidas de rendimiento por las que se juzga su comportamiento, un agente obtiene el mejor rendimiento posible.

Tucci introdujo una generalización cuántica de las redes bayesianas en la que a sus nodos se les asignan amplitudes complejas en lugar de probabilidades y la utilizó para calcular las probabilidades de algunos experimentos físicos. Pearl introdujo la noción de redes bayesianas causales que aumenta las redes bayesianas con un conjunto de operaciones locales que especifican cómo se comportan las distribuciones de probabilidad con respecto a las intervenciones externas. Para proporcionar un modelo gráfico de la causalidad en el mundo cuántico, Laskey definió una noción de redes causales cuánticas en las que las operaciones locales están representadas por superoperadores, que es un popular formalismo matemático de la dinámica de los sistemas cuánticos abiertos.

Reconocimiento y discriminación de estados cuánticos y operaciones cuánticas

El reconocimiento de patrones es el reconocimiento automático de patrones y regularidades en los datos y tiene aplicaciones en el análisis estadístico de datos, el procesamiento de señales, el análisis de imágenes, la recuperación de información, la bioinformática, la compresión de datos, los gráficos por computadora y el Machine learning. Es un área importante de la IA y la discriminación de objetos puede considerarse un caso especial de reconocimiento de patrones. Sin embargo, los investigadores de la IA sólo han considerado el reconocimiento y la discriminación de objetos clásicos. En los últimos 20 años, los físicos han llevado a cabo una gran cantidad de trabajos sobre discriminación y reconocimiento de estados cuánticos y operaciones cuánticas, sin saber mucho de los trabajos existentes sobre IA. La discriminación inequívoca de los estados cuánticos puede formularse: Un sistema se prepara en un número de conjuntos finitos conocidos de estados cuánticos puros y esperamos determinar en qué estado cuántico se encuentra realmente el sistema con el requisito de que una vez que se informa de un resultado, éste debe ser verdadero. Este problema fue considerado por primera vez por Ivanovic para el caso de n = 2. El caso general fue examinado por Chefles. Se demostró que la probabilidad óptima de éxito de la discriminación es matemáticamente equivalente al conocido problema de programación semidefinida. Se proporcionó una estimación de la probabilidad de éxito. El problema de la discriminación de los estados cuánticos se generalizó al caso de los estados mixtos.

Recientemente, la discriminación de las operaciones cuánticas ha recibido una atención considerable. El problema de la discriminación de las transformaciones unitarias ha sido resuelto por Acín y D’Ariano, Presti y Paris. En particular, se obtuvo una caracterización completa de la distinguibilidad perfecta de las operaciones cuánticas descubriendo una condición necesaria y suficiente factible bajo la cual una operación cuántica desconocida elegida secretamente de un conjunto finito de operaciones cuánticas puede ser perfectamente identificada y diseñando un protocolo óptimo para tal discriminación con un número mínimo de consultas. Un problema especialmente interesante es la discriminación de las operaciones cuánticas que actúan sobre un sistema cuántico multipartito de las operaciones locales y la comunicación clásica. Sorprendentemente, se demuestra que el entrelazamiento no es necesario para este tipo de discriminación de operadores unitarios. El problema de reconocimiento de patrones para los estados cuánticos fue considerado por Sasaki y Carlini: dado un conjunto de estados cuánticos modelo, decidir cuál de ellos es el más cercano a un estado de entrada. Una diferencia esencial entre el reconocimiento de patrones cuánticos y clásicos es que en el caso cuántico pueden necesitarse múltiples copias del patrón y de los estados de entrada, ya que en la estrategia de reconocimiento se emplean mediciones cuánticas que suelen cambiar los estados de los sistemas medidos. Se ha propuesto un método de aprendizaje bayesiano para realizar la tarea de reconocimiento de patrones cuánticos.

Aprender sobre los estados cuánticos y las operaciones cuánticas

Consideremos un ejemplo sencillo de aprendizaje conceptual supervisado. En el caso clásico, el conjunto de datos de entrenamiento se proporciona en forma de D = {(, c()): i = 1, …, n}, donde son instancias y c() = 1 o 0 ∀ i.

En el caso cuántico, las instancias se sustituyen por estados cuánticos, |. Si las descripciones de las instancias cuánticas | se dan de forma clásica, el problema de aprendizaje cuántico degenera inmediatamente en un problema de aprendizaje clásico. Más interesante es el caso en el que no se dispone de descripciones clásicas de estos estados cuánticos. Para aprender un concepto a partir del conjunto de entrenamiento cuántico, es necesario extraer información clásica de ellos y, por tanto, hay que realizar ciertas mediciones cuánticas sobre estos estados cuánticos. Dado que estas mediciones cuánticas destruirán los estados cuánticos originales, pueden necesitarse múltiples copias de estos estados cuánticos. Esto es contrario al caso clásico.

La tomografía de estados cuánticos puede considerarse un tipo de aprendizaje cuántico. El escenario es el siguiente: existe un proceso físico que puede producir repetidamente un estado cuántico. Preparamos todas las copias necesarias del estado aplicando este proceso. El objetivo es aprender una descripción del estado a partir de los resultados de las mediciones realizadas en estas copias. Un problema similar para las operaciones cuánticas se conoce como tomografía de procesos cuánticos, cuya teoría fue desarrollada por Chuang y Nielsen y Poyatos, Cirac y Zoller.

Redes neuronales cuánticas

Las redes neuronales cuánticas son modelos de redes neuronales computacionales basados en los principios de la mecánica cuántica. Las primeras ideas sobre la computación neural cuántica fueron publicadas de forma independiente en 1995 por Subhash Kak y Ron Chrisley, comprometiéndose con la teoría de la mente cuántica, que postula que los efectos cuánticos desempeñan un papel en la función cognitiva. Sin embargo, la investigación típica sobre redes neuronales cuánticas consiste en combinar los modelos clásicos de redes neuronales artificiales con las ventajas de la información cuántica para desarrollar algoritmos más eficaces. Una importante motivación para estas investigaciones es la dificultad de entrenar las redes neuronales clásicas, especialmente en aplicaciones de big data. La mayoría de las redes neuronales cuánticas se desarrollan como redes feed-forward. Al igual que sus homólogos clásicos, esta estructura recibe la entrada de una capa de qubits y la transfiere a otra capa de qubits. Esta capa de qubits evalúa esta información y pasa el resultado a la siguiente capa. Finalmente, el camino lleva a la capa final de qubits. Las capas no tienen que tener la misma anchura, lo que significa que no tienen que tener el mismo número de qubits que la capa anterior o posterior. Esta estructura se entrena para saber qué camino tomar de forma similar a las redes neuronales artificiales clásicas. Esto se discute en una sección inferior. Las redes neuronales cuánticas hacen referencia a tres categorías diferentes: computadora cuántico con datos clásicos, computadora clásico con datos cuánticos y computadora cuántica con datos cuánticos.

Algoritmos genéticos cuánticos

El algoritmo genético cuántico (QGA) es el producto de la combinación de la computación cuántica y los algoritmos genéticos, y es un nuevo algoritmo evolutivo de probabilidad. En 1996, Narayanan y Moore propusieron por primera vez el algoritmo genético cuántico, que se utilizó con éxito para resolver el problema TSP. El QGA es esencialmente un tipo de algoritmo genético y puede aplicarse en el campo en el que se puede aplicar el algoritmo genético convencional. La eficiencia del QGA es significativamente mejor que la del algoritmo genético convencional. El QGA tiene un valor de población pequeño, una velocidad de convergencia rápida, una gran capacidad de optimización global y una buena solidez. El vector de estado cuántico se introduce en el algoritmo genético para expresar el código genético y las puertas lógicas cuánticas se utilizan para realizar la evolución cromosómica. De este modo, se obtienen mejores resultados.

Conclusiones

Las tres clases de investigación para los investigadores de inteligencia artificial en la intersección de la computación cuántica, la teoría cuántica y la inteligencia artificial son:

– Diseño de algoritmos cuánticos para resolver problemas de IA de forma más eficiente;

– Desarrollar formas más eficaces de formalizar los problemas en la IA tomando prestadas ideas de la teoría cuántica;

– Desarrollar nuevas técnicas de inteligencia artificial para abordar los problemas del mundo cuántico.

La primera clase de investigación se encuentra todavía en una fase temprana de desarrollo y no se ha avanzado mucho. En cuanto a la segunda clase, la investigación se ha vuelto muy activa en los últimos años, especialmente a través del Simposio Internacional sobre Interacción Cuántica. Pero parece que algunos de estos trabajos son bastante superficiales y que es necesario un análisis teórico más profundo de los métodos formales desarrollados. En particular, se necesita más investigación experimental para comprobar su eficacia. En cambio, la investigación de tercera clase avanza de forma constante.

El potencial de la computación cuántica en la inteligencia artificial pronto será evidente, pero aún no sabemos cómo traducir ese potencial en realidad.

@RESERVADOS TODOS LOS DERECHOS
Temas principales

Especificaciones

C
computación cuántica
I
inteligencia artificial

Nota 1 de 5