Gemini el nuevo lanzamiento de Google, es una IA multimodal que supera a ChatGPT, pues tiene la capacidad de procesar múltiples tipos de datos y tareas simultáneamente.

A pesar de contar con Bard, Google no quiso quedar atrás y lanzó su propia inteligencia artificial multimodal. Llamada Red de Inteligencia Multimodal Generalizada, Gemini según su abreviatura en inglés. Tiene como objetivo remodelar la forma en que los usuarios interactúan con la tecnología.

Mostrando una competencia sin precedentes, Gemini cuenta con un procesamiento de diversos tipos de datos, incluidos texto, imágenes, código, voz y mucho más. Es decir, Google ha traspasado los límites vistos con ChatGPT de OpenAI y de otras herramientas de IA.

Este es el último salto de Google en el sector de inteligencia artificial, llegando a revolucionar los avances adquiridos solo apenas hace unos meses. A diferencia de otros modelos, Gemini es capaz de procesar múltiples tipos de datos y tareas simultáneamente a una velocidad sin precedentes.

Así, no solamente se queda en el texto o imágenes, pues puede funcionar con audio o cualquier tipo de datos. Esto permite al usuario tener interacciones más naturales y atractivas, emulando una conversación con una persona real.

Según el anuncio de Google, su IA fue construido desde cero para ser multimodal. En ese sentido, es descrito como un modelo más flexible, capaz de ejecutarse en centros de datos o dispositivos móviles.

Cabe destacar, tras la presentación de Gemini, llegan otras versiones basadas en ella, tales como Ultra, Pro y Nano. En el caso de Ultra, esta ha roto paradigmas al superar a los expertos humanos, con una puntuación del 90% en una prueba que cubre materias como matemáticas, física, medicina y derecho. Bard también usará una versión mejorada de Gemini Pro, lo cual significa la actualización más importante del chatbot de Google.

El modelo Ultra también impulsa AlphaCode2, una herramienta de escritura de códigos que puede superar al 85% de los programadores de computadores. Sin embargo, el modelo Gemini por sí solo eclipsa a ChatGPT en 30 de 32 pruebas comparativas.

Además, este modelo de IA puede generar resultados completamente nuevos, lo cual significa que puede crear contenido que no necesariamente existe en sus datos de entrenamiento. El lanzamiento inicial se hará en más de 170 países, exceptuando a Reino Unido Europa, pues la autorización regulatoria sigue pendiente.

Entre sus novedades, se encuentra el uso de una nueva arquitectura que fusiona un codificador con un decodificador multimodal. El trabajo del codificador es transformar diferentes tipos de datos a un lenguaje común para que el codificador lo entienda. Después, este genera salidas en diferentes modalidades, según las entradas codificadas.

Cada vez más empresas se suman a la carrera de la IA, por lo cual en los próximos años se verá una colisión de visiones estratégicas y destreza tecnológica en este sector.

NotiPress

CONTINÚA LEYENDO

NASA experimenta con microgravedad y cómo el cuerpo humano se adapta a la ingravidez

¿Qué es la inteligencia artificial general? Científicos buscan consenso