Google lanza nuevas actualizaciones para los modelos IA de su nube empresarial

Google lanza actualizaciones de varios de sus modelos de inteligencia artificial disponibles a través de su plataforma en la nube Vertex AI.

Lyria, el modelo de texto a música de Google, ahora está disponible en versión preliminar para clientes seleccionados, y el modelo de creación de videos Veo 2 de la compañía se ha mejorado con nuevas opciones de edición y personalización de efectos visuales. La compañía también ha lanzado una función de clonación de voz impulsada por Chirp 3, el modelo de comprensión de audio de Google, para usuarios incluidos en la “lista de permitidos”. Y el generador de imágenes Imagen 3 ahora ofrece lo que la compañía describe como un rendimiento “significativamente” mejor.

Las actualizaciones, programadas para Cloud Next, son el último esfuerzo de Google para acaparar el mercado empresarial de la IA generativa. La empresa compite quizás más directamente con Amazon, que ofrece una plataforma de inteligencia artificial en la nube comparable llamada Bedrock con su propio conjunto de modelos generativos de inteligencia artificial.

Google está presentando Lyria como una alternativa a las bibliotecas de música libres de regalías. Utilizando este modelo, los clientes pueden crear canciones en una variedad de estilos y géneros, desde solos de piano jazz hasta pistas lo-fi, dijo la compañía.

Chirp 3, por su parte, puede sintetizar voz en alrededor de 35 idiomas. Chirp 3, presentado por primera vez a principios de este año, incorpora Instant Custom Voice, que supuestamente puede clonar una voz con 10 segundos de audio. Ya está disponible de forma general. Este modelo también sustenta una nueva herramienta que se está lanzando en vista previa, llamada Transcripción con Diarización, que separa e identifica a los hablantes en grabaciones con múltiples participantes.

Para evitar abusos, Instant Custom Voice está sujeto a un proceso de “diligencia” para verificar los “permisos de uso de voz adecuados”, dice Google.

En cuanto a Veo 2, el modelo ahora puede eliminar imágenes de fondo, logotipos y objetos de videos existentes, y ampliar el marco del metraje de video (para convertir videos horizontales en verticales, por ejemplo). Ahora también puede ajustar los ángulos de la cámara y el ritmo en escenas generadas por IA para crear time-lapses, clips estilo drones y más, y puede interpolar entre cuadros iniciales y finales específicos.

En cuanto a las actualizaciones de Imagen 3 mencionadas anteriormente, Google dijo que mejoran la capacidad del modelo para eliminar objetos y reconstruir partes faltantes o dañadas de las imágenes.

Todos los medios generados por Imagen, Veo y Lyria (pero no Chirp) tienen marca de agua utilizando la tecnología SynthID de Google. La compañía dijo que todos sus modelos de IA generativa tienen “protecciones integradas” para proteger contra la creación de contenido dañino.

Históricamente, Google no ha indicado qué datos específicos utiliza para entrenar sus modelos, y el gigante tecnológico mantuvo ese precedente. Los datos de entrenamiento tienden a ser un tema controvertido por razones relacionadas con la propiedad intelectual. Algunas empresas entrenan sus modelos con obras protegidas por derechos de autor sin obtener primero el permiso de los titulares de los derechos. Si bien estas empresas afirman que la doctrina estadounidense de uso justo protege la práctica, es comprensible que algunos creadores no estén de acuerdo.

Vía – Techcrunch

Jeremías Rodríguez

Profesor de Historia. Amante de los libros, la tecnología y el buen café.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.