Google I/O 2024: todas las novedades del universo IA
Acaba de tener lugar, en horas recientes, el esperado Google I/O 2024 que, como adelantamos, se centraría en el desarrollo de IA. A continuación, algunas de las novedades que finalmente el gigante buscador dio a conocer.
LearnLM: IA generativa para el aprendizaje
Google presentó LearnLM, una nueva familia de modelos de IA generativa “afinados” para el aprendizaje. Es una colaboración entre la división de investigación DeepMind AI de Google y Google Research. Los modelos LearnLM están diseñados para dar tutoría “conversacional” a los estudiantes sobre una variedad de temas.
Aunque ya está disponible en varias plataformas de Google, la empresa está llevando a LearnLM a través de un programa piloto en Google Classroom. También está trabajando con educadores para ver cómo LearnLM podría simplificar y mejorar el proceso de planificación de lecciones. LearnLM podría ayudar a los profesores a descubrir nuevas ideas, contenidos y actividades, dice Google, o a encontrar materiales adaptados a las necesidades de grupos de estudiantes específicos.
Quiz Master
Hablando de educación, una novedad en YouTube son los cuestionarios generados por IA. Esta nueva herramienta de inteligencia artificial conversacional permite a los usuarios «levantar la mano» en sentido figurado cuando miran videos educativos. Los espectadores pueden hacer preguntas aclaratorias, obtener explicaciones útiles o realizar una prueba sobre el tema.
Esto supondrá un cierto alivio para quienes tienen que ver vídeos educativos más largos, como conferencias o seminarios, debido a las capacidades de contexto prolongado del modelo Gemini. Estas nuevas funciones se están implementando para usuarios seleccionados de Android en los Estados Unidos.
Actualizaciones para Gemma 2
Una de las principales solicitudes que Google escuchó de los desarrolladores es la de un modelo Gemma más grande, por lo que Google agregará un nuevo modelo de 27 mil millones de parámetros a Gemma 2. Esta próxima generación de modelos Gemma de Google se lanzará en junio. Nvidia optimiza este tamaño para ejecutarse en GPU de próxima generación y puede ejecutarse de manera eficiente en un único host de TPU y AI de vértice.
Todo sobre Gemini
Gemini en Gmail
Los usuarios de Gmail podrán buscar, resumir y redactar sus correos electrónicos utilizando la tecnología Gemini AI. También podrán tomar medidas en los correos electrónicos para tareas más complejas, como procesar una devolución de comercio electrónico buscando en la bandeja de entrada, encontrando el recibo y completando un formulario en línea
Gemini 1.5 Pro
Otra actualización de la IA generativa es que Gemini ahora puede analizar documentos, bases de código, vídeos y grabaciones de audio más largos que antes.
En una vista previa privada de una nueva versión de Gemini 1.5 Pro, el modelo insignia actual de la compañía, se reveló que puede aceptar hasta 2 millones de tokens. Eso es el doble del monto máximo anterior. Con ese nivel, la nueva versión de Gemini 1.5 Pro admite la mayor entrada de cualquier modelo disponible comercialmente.
Gemini Live
La compañía presentó una vista previa de una nueva experiencia en Gemini llamada Gemini Live, que permite a los usuarios tener chats de voz «profundos» con Gemini en sus teléfonos inteligentes. Los usuarios pueden interrumpir a Gemini mientras el chatbot habla para hacer preguntas aclaratorias y se adaptará a sus patrones de habla en tiempo real. Y Gemini puede ver y responder al entorno de los usuarios, ya sea a través de fotografías o vídeos capturados por las cámaras de sus teléfonos inteligentes.
A primera vista, Live no parece una mejora drástica con respecto a la tecnología existente. Pero Google afirma que aprovecha técnicas más nuevas del campo de la IA generativa para ofrecer un análisis de imágenes superior y menos propenso a errores, y combina estas técnicas con un motor de voz mejorado para lograr un diálogo de múltiples turnos más consistente, emocionalmente expresivo y realista.
Gemini Nano
Google también está construyendo Gemini Nano, el más pequeño de sus modelos de IA, directamente en el cliente de escritorio Chrome, comenzando con Chrome 126. Esto, según la compañía, permitirá a los desarrolladores utilizar el modelo en el dispositivo para potenciar sus propias funciones de IA. Google planea utilizar esta nueva capacidad para potenciar funciones como la herramienta existente «ayúdame a escribir» de Workspace Lab en Gmail, por ejemplo.
Gemini en Android
Gemini de Google en Android, su reemplazo de inteligencia artificial para el Asistente de Google, pronto aprovechará su capacidad para integrarse profundamente con el sistema operativo móvil de Android y las aplicaciones de Google. Los usuarios podrán arrastrar y soltar imágenes generadas por IA directamente en Gmail, Google Messages y otras aplicaciones. Mientras tanto, los usuarios de YouTube podrán tocar «Preguntar a este video» para encontrar información específica dentro de ese video de YouTube, dice Google.
Gemini en Google Maps
Las capacidades del modelo Gemini llegarán a la plataforma Google Maps para desarrolladores, comenzando con la API de Places. Los desarrolladores pueden mostrar resúmenes generativos de IA de lugares y áreas en sus propias aplicaciones y sitios web. Los resúmenes se crean en base al análisis de Gemini de los conocimientos de la comunidad de Google Maps de más de 300 millones de contribuyentes. Así, los desarrolladores ya no tendrán que escribir sus propias descripciones personalizadas de lugares.
Vía – Techcrunch