Tras el tibio lanzamiento del chatbot bautizado como Bard, Google ya trabaja en su último proyecto innovador: Gemini. Esta nueva inteligencia artificial, presentada en el evento I/O 2023 en mayo, está diseñada para superar a los modelos de lenguaje extenso (LLM) como GPT-4. Aunque está en fase de desarrollo, adelantan que será capaz de planificar y solucionar problemas de forma única.
Gemini es un cambio de paradigma en el campo de la IA multimodal, capaz de comprender y generar texto; así como entender códigos e imágenes al mismo tiempo. Esta característica es fundamental para aplicaciones de chatbots y análisis de datos, que comenzamos a ver en GPT-4 de Open AI.
Más capacidades que ChatGPT y otros chatbots
El nuevo modelo de lenguaje extenso de Google no solo intenta superar a sus competidores, sino también revolucionar la forma en que interactuamos con la IA. Gemini será capaz de analizar gráficos y tablas en diversos formatos. Además, se integraría con servicios de Google, como Gmail, Drive y Docs, fortaleciendo aún más a su asistente personal, Bard.
El CEO de Google y Alphabet, Sundar Pichai, señaló: “Gemini todavía está en desarrollo, pero ya exhibe capacidades multimodales nunca antes vistas en modelos anteriores. Una vez ajustado y rigurosamente probado para comprobar su seguridad, Gemini estará disponible en varios tamaños y capacidades”.
A medida que Gemini avanza en su desarrollo, también surgen preocupaciones sobre los riesgos que una IA más avanzada podría plantear. Demis Hassabis, cofundador de DeepMind y CEO de Google DeepMind, destacó la necesidad de establecer reglas y estándares sólidos para el desarrollo responsable de la IA.
Google lidera la iniciativa y espera colaborar con otras marcas y gobiernos para garantizar la seguridad en el uso de esta tecnología, que muy pronto estará al alcance de usuarios en todo el mundo.
Con una sólida base en algoritmos de aprendizaje automático y una vasta cantidad de datos de capacitación, Gemini se posiciona como un competidor importante en el mundo de la IA. Se espera que el equipo detrás de Google DeepMind revele más sobre los avances de Gemini a partir del otoño, lo que podría marcar un hito significativo en el campo de la IA multimodal.