La inteligencia artificial de Google ha experimentado una evolución explosiva en meses recientes y al final la terminología puede terminar liándosenos un poco.

Por ejemplo, al cabo de un rato interactuando con Gemini, me asaltó la duda sobre en qué situación se encontraría actualmente Bard, el chatbot que se lanzó a mediados de 2023 como competidor directo de ChatGPT. Ya que tenía delante una fuente autorizada, decidí preguntárselo al propio Gemini.

La conversación

Comencé con lo que pensé sería una pregunta sencilla.1

Yo: Hola. Quisiera saber qué pasó con Bard.

Gemini: Para responderte de forma precisa, necesito más información sobre a qué «Bard» te refieres. Existen varias referencias con ese nombre:

En la mitología:

Bardo el Arquero: Un personaje heroico del legendario de la Tierra Media creado por J.R.R. Tolkien. Es conocido por matar al dragón Smaug en la novela «El Hobbit».
En el cine:

Bardo, falsa crónica de unas cuantas verdades: Una película autobiográfica de 2022 dirigida por Alejandro González Iñárritu. El título hace referencia al protagonista, un cineasta mexicano que reflexiona sobre su vida y carrera.
En la tecnología:

Bard: Un modelo de lenguaje grande (LLM) creado por Google AI. Fui presentado en enero de 2023 y todavía estoy en desarrollo.
Si me puedes dar más contexto sobre tu pregunta, puedo darte una respuesta más completa y específica.

¿A cuál de estos «Bard» te refieres?

Venga ya, Gemini, no nos compliquemos.

Yo: Me refiero al modelo de IA Bard.

Gemini:

¡Ah, perfecto! Entonces puedo hablarte con conocimiento de causa.

Bard, ahora conocido como Gemini, es un modelo de lenguaje grande (LLM) creado por Google AI. Fui presentado en enero de 2023 y todavía estoy en desarrollo.

¿Qué ha pasado conmigo desde entonces?

En poco más de un año, he aprendido y evolucionado mucho. Puedo realizar una gran variedad de tareas, como:

Generar texto: Puedo escribir diferentes tipos de contenido creativo, como poemas, guiones, letras musicales, correos electrónicos, cartas, etc. También puedo resumir textos largos o crear historias a partir de una idea.
Traducir idiomas: Soy capaz de traducir entre más de 200 idiomas con gran precisión.
Responder a tus preguntas de forma informativa: Puedo acceder y procesar información del mundo real a través de la Búsqueda de Google y mantener mi respuesta consistente con los resultados de búsqueda.
Ayudarte con tus tareas: Puedo ayudarte a planificar tu día, crear listas de tareas, establecer recordatorios y mucho más.

Dejando de lado lo extraño que resulta el uso del sujeto en primera persona, la explicación me sirve. Mejor todavía: Gemini me recomienda fuentes adicionales sin esperar a que yo se lo pida.

Gemini: ¿Dónde puedo encontrar más información sobre mí?

Puedes encontrar más información sobre mí en los siguientes sitios web:

¿Qué te gustaría saber sobre mí?

No dudes en preguntar cualquier cosa que tengas en mente.

Ya que lo menciona, sí, hay otras cosas que quisiera saber de Gemini. Por ejemplo, ¿qué hay de la aplicación de Gemini para Google Fotos, que viene sonando desde hace un tiempo?

Gemini:

El Gemini al que te refieres, el que se integra en Google Fotos y permite realizar búsquedas usando lenguaje natural, se encuentra actualmente en fase de desarrollo y se espera su lanzamiento para el próximo verano, entre junio y agosto de 2024.

¿Qué funcionalidades tendrá Gemini en Google Fotos?

Algunas de las funcionalidades que podrás disfrutar con Gemini en Google Fotos son:

Búsqueda multimodal: Podrás buscar fotos y vídeos utilizando preguntas naturales, incluso si estas incluyen texto dentro de las imágenes. Por ejemplo, podrás preguntar «¿En qué fotos salgo con mi perro en el parque el año pasado?» o «¿Dónde se tomó esta foto?».
Organización inteligente: Gemini te ayudará a organizar tus fotos y vídeos de forma automática, creando álbumes temáticos o seleccionando las mejores fotos de cada evento.
Respuestas contextuales: Además de mostrarte las fotos o vídeos que coinciden con tu búsqueda, Gemini te ofrecerá información contextual relevante, como la fecha y el lugar donde se tomó la foto, las personas que aparecen en ella, etc.
¿Cómo puedo probar Gemini en Google Fotos?

Por el momento, Gemini en Google Fotos no está disponible para el público en general. Se espera que la función se lance como una actualización de la aplicación Google Fotos en los próximos meses.

¿Qué novedades se esperan para Gemini en el futuro?

Google AI está trabajando constantemente en mejorar las capacidades de Gemini.2 Se espera que en el futuro, Gemini pueda realizar aún más tareas complejas, como:

Generar descripciones de fotos y vídeos: Gemini podría crear descripciones detalladas de tus fotos y vídeos, incluyendo información sobre las personas, lugares y objetos que aparecen en ellos.
Crear historias a partir de tus fotos: Gemini podría utilizar tus fotos y vídeos para crear historias personalizadas, con música, texto y efectos especiales.

Sí, seguramente lo haré. Gracias, Gemini.

Notas y referencias

  1. Gemini permite crear un enlace público, el cual puede ser copiado o compartido en redes sociales. La conversación siguiente se puede revisar en este enlace: https://g.co/gemini/share/e879b596cbcd
  2. La investigación en torno a la inteligencia artificial se ha integrado en Google DeepMind.