Tecnología

LLaMA 2: Qué es y cómo utilizar el chatbot de código abierto de Meta

Disponible en tres dimensiones -7.000, 13.000 y 70.000 millones de parámetros, según el modelo-, se entrena utilizando el aprendizaje reforzado por retroalimentación humana (RLHF), aprendiendo de las preferencias y evaluaciones de los entrenadores humanos de IA. Cómo acceder a él y utilizarlo

Publicado el 02 Ago 2023

LLaMA 2

Meta, la empresa matriz de Facebook, lanzó recientemente LLaMA 2, un modelo lingüístico de gran tamaño (LLM) de código abierto que pretende desafiar las prácticas restrictivas de los grandes competidores tecnológicos.

A diferencia de los sistemas de inteligencia artificial lanzados por Google, OpenAI y otros, que están fuertemente sujetos a modelos propietarios, Meta está liberando el código y los datos que hay detrás de LLaMA 2 para permitir que investigadores de todo el mundo desarrollen y mejoren la tecnología.

La naturaleza de código abierto del LLaMA 2 podría dar lugar a rápidos avances en el campo de la IA, ya que los desarrolladores de todo el mundo pueden ahora acceder al modelo básico, analizarlo y construir sobre él. Se trata de un paso audaz que podría democratizar el campo de la IA, en rápida evolución, proporcionando a los desarrolladores potentes herramientas para crear aplicaciones y soluciones innovadoras.

LLaMA 2: un reto para ChatGPT y Bard

LLaMA 2 está disponible en tres tamaños: 7.000, 13.000 y 70.000 millones de parámetros, en función del modelo elegido. En comparación, la serie GPT-3.5 de OpenAI tiene hasta 175.000 millones de parámetros y la Bard de Google (basada en LaMDA) cuenta con 137.000 millones de parámetros.Como se sabe, OpenAI no reveló el número de parámetros de GPT-4 en su investigación publicada. 

El número de parámetros de un modelo suele estar relacionado con su rendimiento y precisión, pero los modelos más grandes requieren más recursos informáticos y datos para entrenarse.

El método de entrenamiento utilizado para LLaMA 2 también es digno de mención y diferente de las alternativas populares: La herramienta se entrena utilizando el aprendizaje reforzado por retroalimentación humana (RLHF), aprendiendo de las preferencias y evaluaciones de los entrenadores humanos de IA. En cambio, ChatGPT utilizó un ajuste supervisado, aprendiendo a partir de datos etiquetados proporcionados por anotadores humanos.

Cómo acceder a LLaMA 2 y cómo utilizarlo

Dada su naturaleza de código abierto, existen numerosas formas de interactuar con LLaMA 2. A continuación se indican algunas de las formas más sencillas de acceder a LLaMA 2 y empezar a experimentar con él de inmediato:

1. Interactuar con el demo del chatbot

La forma más sencilla de utilizar el LLaMA 2 es visitar llama2.ai, un demo del modelo de chatbot alojado por Andreessen Horowitz. Se puede hacer preguntas al modelo sobre cualquier tema de interés o solicitar contenidos creativos utilizando indicaciones específicas. Se puede cambiar el modo de chat entre equilibrado, creativo y preciso según sus preferencias. Esta es la mejor manera de empezar a probar el nuevo modelo.

2. Descargue el código de LaMA 2

Si desea ejecutar LLaMA 2 en su máquina o modificar el código, puede descargarlo directamente de Hugging Face, una plataforma líder para compartir modelos de IA. Necesita una cuenta de Hugging Face y las bibliotecas y dependencias necesarias para ejecutar el código. Las instrucciones de instalación y la documentación están disponibles en el repositorio LLaMA .

3. Acceso a través de Microsoft Azure

Otra opción para acceder a LLaMA 2 es Microsoft Azure, un servicio de computación en la nube que ofrece varias soluciones de IA. El LLaMA 2 se puede encontrar en el catálogo de modelos de IA de Azure, donde se pueden explorar, distribuir y gestionar los modelos de IA. Para utilizar este servicio, se requiere una cuenta Azure y una suscripción. Este método se recomienda para los usuarios más experimentados.

4. Acceso a través de Amazon SageMaker JumpStart

También puede probar y desplegar LLaMA 2 a través de Amazon SageMaker JumpStart, un popular centro para algoritmos, modelos y soluciones. SageMaker JumpStart simplifica el proceso de construcción, entrenamiento y despliegue de modelos de aprendizaje automático (ML) con solo unos clics. Para utilizar este servicio se requiere una cuenta de Amazon Web Services y una suscripción. Este es otro método recomendado para usuarios avanzados y programadores.

5. Pruebe una variante de llama, perplexity.ai

Perplexity.ai es un rastreador web que utiliza el método ML para generar respuestas generales a sus preguntas y, a continuación, le ofrece una serie de enlaces a sitios web. Llama.perplexity.ai combina la potencia de LLaMA 2 y Perplexity.ai para ofrecer respuestas generales y enlaces relevantes a las consultas utilizando el nuevo modelo para alimentar las respuestas. Para utilizarlo, visite llama.perplexity.ai y escriba una pregunta en el cuadro de búsqueda. Aparecerá una breve respuesta, seguida de una lista de enlaces para seguir explorando.

@RESERVADOS TODOS LOS DERECHOS

Si lo desea, evalúe la calidad de este artículo

¡Su opinión es importante para nosotros!

S
Pierluigi Sandonnini
Temas principales

Especificaciones

C
chatbots
I
IA

Nota 1 de 3