Tecnologías

Cómo la IA híbrida puede reducir “drásticamente” los costos de desarrollo de la IA generativa

La IA en el dispositivo también aporta ventajas en términos de rendimiento, personalización, privacidad y seguridad

Publicado el 22 Jun 2023

IA híbrida.

A medida que la adopción de la IA generativa crece a una velocidad récord y aumentan las demandas de procesamiento, la informática híbrida se vuelve más importante que nunca. 

Una arquitectura de IA híbrida distribuye y coordina las cargas de trabajo de la IA entre la nube y los dispositivos de borde, en lugar de procesarlas únicamente en la nube. La nube y los dispositivos periféricos -teléfonos inteligentes, coches, computadoras personales y dispositivos del Internet de las cosas (IoT)- trabajan juntos para ofrecer una IA más potente, eficiente y altamente optimizada.

La principal motivación es la reducción de gastos

Por ejemplo, se calcula que el costo de la búsqueda basada en la IA generativa por consulta se multiplica por 10 en comparación con los métodos de búsqueda tradicionales, y esta es solo una de las muchas aplicaciones de la IA generativa.

La IA híbrida permitirá a los desarrolladores y proveedores de IA generativa explotar las capacidades informáticas disponibles en los dispositivos periféricos para reducir costos. Una arquitectura de IA híbrida (o que ejecute la IA únicamente en el dispositivo) ofrece las ventajas adicionales del rendimiento, la personalización, la privacidad y la seguridad a escala global.

Estas arquitecturas pueden tener diferentes opciones de descarga para distribuir el procesamiento entre la nube y los dispositivos, en función de factores como la complejidad del modelo y de la consulta. Por ejemplo, si el tamaño del modelo, la consulta y la longitud de generación están por debajo de un determinado umbral y proporcionan una precisión aceptable, la inferencia puede realizarse completamente en el dispositivo. Si la tarea es más compleja, el modelo puede ejecutarse en la nube y en los dispositivos.

La IA híbrida permite incluso que los dispositivos y la nube ejecuten modelos simultáneamente, con los dispositivos ejecutando versiones ligeras del modelo mientras la nube procesa múltiples tokens del modelo completo en paralelo y corrige las respuestas de los dispositivos según sea necesario.

Ampliación de la IA generativa con dispositivos de borde

El potencial de la IA híbrida crece aún más a medida que los potentes modelos de IA generativa se hacen más pequeños, mientras que las capacidades de procesamiento de los dispositivos siguen mejorando. Los modelos de IA con más de 1.000 millones de parámetros ya se ejecutan en teléfonos con niveles de rendimiento y precisión similares a los de la nube, y los modelos con 10.000 millones de parámetros o más se ejecutarán en dispositivos en un futuro próximo.

El enfoque de la IA híbrida es aplicable a prácticamente todas las aplicaciones y segmentos de dispositivos de IA generativa, incluidos teléfonos, computadoras portátiles, auriculares de realidad extendida, autos e IoT. Este enfoque es crucial para que la IA generativa se amplíe y satisfaga las necesidades de las empresas y los consumidores de todo el mundo.

Referencias
1: Buchholz, K. (24 de enero de 2023). ChatGPT llega a un millón de usuarios. Estadista. Recuperado el 2 de mayo de 2023 de https://www.statista.com/chart/29174/time-to-one-million-users/

2: Sheth, S. (25 de febrero de 2023). La IA generativa conduce a una explosión de cálculos: la necesidad inminente de una IA sostenible. ángulo de silicio Recuperado el 2 de mayo de 2023 de https://siliconangle.com/2023/02/05/generative-ai-drives-explosion-compute-looming-need-sustainable-ai/

3: Dastin, J. et al. (22 de febrero de 2023). Para los gigantes tecnológicos, las IA como Bing y Bard representan un problema de investigación de miles de millones de dólares. Reuters. Recuperado el 2 de mayo de 2023 de https://www.reuters.com/technology/tech-giants-ai-like-bing-bard-poses-billion-dollar-search-problem-2023-02-22

Artículo publicado en ai4business.it.

¿Qué te ha parecido este artículo?

¡Su opinión es importante para nosotros!

I
Redacción InnovaciónDigital360

El equipo editorial de InnovaciónDigital360 está formado por periodistas especializados en tecnología, transformación digital e innovación empresarial en América Latina. Desde su lanzamiento en 2021, el medio forma parte de la red Nextwork360, dedicada a la difusión del conocimiento digital en el ámbito B2B. Nuestro equipo cuenta con experiencia comprobada en redacciones de Argentina, España, Reino Unido e Italia, y colabora activamente en la producción de contenidos orientados a CIOs, líderes IT y responsables de transformación digital. Publicamos análisis de tendencias, entrevistas con referentes, estudios de caso y guías prácticas basadas en fuentes confiables y verificadas. Dirección editorial: Pedro Ylarri, Director Responsable Más de 18 años en medios internacionales y fundador de yCon Media. 📩 pedro.ylarri@digixem360.com Redacción y coordinación: Nicolás Della Vecchia, Jefe de Redacción Especialista en innovación y negocios tecnológicos con 10 años de trayectoria. 📩 nicolas@innovaciondigital360.com.ar Franco Della Vecchia, Secretario de Redacción Enfocado en tecnología financiera y entornos empresariales. 📩 franco@innovaciondigital360.com.ar Redactores: Mariano Ylarri 📩 mariano@innovaciondigital360.com.ar Jimena D’Annuzio 📩 jimena@innovaciondigital360.com.ar Casa editorial: YCON SAS — El Salvador 4768 PB B, (1414) CABA, Argentina Grupo editorial: Nextwork360 LATAM Contacto institucional: info@innovaciondigital360.com Consultas comerciales: publicidad@innovaciondigital360.com.ar

Artículos relacionados