Si alguna vez has visto una película con subtítulos, es probable que hayas leído “[APLAUSOS]” o «»[música dramática]» en la parte inferior de la pantalla. Es una herramienta para ayudar a las personas sordas o con problemas de audición a entender mejor los elementos de audio no dialogados que dan forma a lo que está sucediendo en una escena. Ahora Google está introduciendo una función similar en el sistema operativo móvil Android y, naturalmente, está basada en la inteligencia artificial. Esta es una de las muchas nuevas funciones que llegan hoy a los dispositivos Android y Google Pixel.
Los subtítulos expresivos (Expressive Captions) son una nueva herramienta que forma parte de la función Live Caption de Google, que permite añadir subtítulos a casi cualquier contenido multimedia que se reproduzca en el teléfono, independientemente de la aplicación en la que te encuentres. (Incluso se pueden traducir a diferentes idiomas, aunque con distintos grados de calidad). La nueva incorporación amplía el alcance al subtitular elementos tonales y no verbales.
Si alguien grita en un video, como un comentarista deportivo cuando alguien marca un touchdown, los subtítulos aparecerán ahora en mayúsculas para enfatizar esa emoción. Si alguien suelta un gran suspiro o jadea, ahora se subtitulará como “[suspiro]” o “[jadeo]”, respectivamente. También se incluirán otros sonidos ambientales, como aplausos y otros.

Estos subtítulos los genera un software de inteligencia artificial que se ejecuta en el propio teléfono, no en la nube. Google afirma que, dado que los subtítulos en vivo están integrados en Android y se ejecutan «en el dispositivo», la nueva función de subtítulos expresivos funcionará de forma similar en cualquier aplicación que utilices, incluso en las videollamadas, una vez que la habilites. Aparecerán en tiempo real (aunque a menudo hay un ligero retraso) e incluso cuando el teléfono esté en modo avión. Ya está disponible para los teléfonos Android 14 con la función Live Caption.
Las funciones de transcripción basadas en IA se están convirtiendo rápidamente en algo habitual en los smartphones: muchos dispositivos nuevos utilizan grandes modelos de lenguaje para transcribir voz a texto, como la serie Galaxy S24 de Samsung, que puede transcribir llamadas telefónicas, por no hablar de Apple Intelligence en el iPhone 16, que puede transcribir llamadas e incluso grabaciones en las aplicaciones Notas y Notas de voz.
Más actualizaciones para Android
Expressive Captions es solamente una de las nuevas funciones de Android que Google acaba de anunciar. Hay otra función de accesibilidad que llega a la aplicación Lookout para personas ciegas o con baja visión. La función de preguntas y respuestas sobre imágenes de la app permite a los usuarios subir o tomar una foto y obtener una descripción generada por inteligencia artificial, pero ahora la función emplea el modelo de lenguaje extenso Gemini 1.5 Pro más avanzado de Google. Piensa que se trata de una actualización que ofrece descripciones más completas, y aún puedes hacer preguntas de seguimiento para obtener más información sobre una imagen.
El chatbot Gemini de Google está mejorando en Android gracias a nuevas integraciones con aplicaciones de terceros. La última es una extensión de Spotify, que te permite pedirle a Gemini que reproduzca tus canciones favoritas o que descubra nuevas listas de reproducción en función de tu estado de ánimo. Google dice que también puedes usar Gemini para llamar y enviar mensajes a través de las aplicaciones predeterminadas de tu teléfono e incluso controlar la cámara para hacerte una selfie. Pronto, Gemini también podrá controlar tus dispositivos domésticos inteligentes. (Ahora mismo, cede muchas de las solicitudes de interacción del hogar inteligente a Google Assistant).
Puede que algunas de estas nuevas funciones te suenen (ya las has podido hacer antes a través de Google Assistant), pero Gemini entiende mejor la conversación natural, así que no tienes que ser tan exigente con tus palabras al hacer peticiones.

Otras actualizaciones de Android incluyen escaneos de documentos con mejor aspecto en Google Drive gracias a la mejora del contraste y el balance de blancos en los pasos de procesamiento de documentos, y un uso compartido más sencillo con Quick Share, que es el equivalente de Google a AirDrop de Apple. Puedes compartir rápidamente imágenes y videos con un código QR en lugar de requerir que la persona sea un contacto o juguetear con la configuración de uso compartido de tu aplicación.
Una de las mejoras más notables de Gemini es «Información guardada con Gemini», que te permite decirle a Gemini que recuerde ciertas cosas sobre ti para que pueda generar mejores resultados adaptados a ti. Por ejemplo, si eres vegano y le pides que busque recetas, Gemini puede recordar que eres vegano y solamente te proporcionará recetas veganas sin que tengas que especificar ese detalle en tu consulta.
«Información guardada con Gemini» se está desplegando en Gemini en todos los teléfonos Android y en la web.
NAM/WIRED
Síguenos en nuestras redes sociales para que tengas toda la ¡INFORMACIÓN AL INSTANTE!
Visita nuestro sitio web:
https://noticiaalminuto.com/
X:
https://noticiaalminuto.com/twitter
Instagram:
https://noticiaalminuto.com/instagram
Telegram:
https://noticiaalminuto.com/telegram
Grupo de WhatsApp:
https://noticiaalminuto.com/whatsapp
