El número de fotos que se hacen al día es abrumador. Los teléfonos móviles han conseguido que la fotografía sea una actividad tan natural como el respirar: las cámaras de los terminales móviles son de gran calidad y las que incorporan los dispositivos de las gamas más altas son, en multitud de situaciones y escenarios, tan competentes como muchas cámaras de fotos dedicadas.
Por otro lado, el espacio de almacenamiento de los móviles ha pasado a ser sumamente generoso, con cifras a partir de 128 GB para la mayoría de los terminales “flagship” (los nuevos Huawei P30 Pro llevan 256 GB de almacenamiento); al mismo tiempo que los efectos y posibilidades creativas de los modos automáticos o asistidos mediante IA hacen que sea muy complicado hacer que una instantánea salga mal.
Lo que sucede (cada vez con más frecuencia) es que resulta complicado ordenar y encontrar las fotografías que hacemos. Son tantas y tan diversas que, a poco que dejemos pasar el tiempo, nos encontraremos con cientos o miles de imágenes en nuestra galería de fotos, haciendo que los métodos de desplazamiento tradicionales arriba y abajo sean poco prácticos y muy tediosos.
La organización por fecha o por ubicación es una posibilidad, pero, a medida que aumenta el número de imágenes en nuestro dispositivo, la usabilidad se degrada a efectos de buscar la foto que queremos en el momento preciso.
La IA al rescate
De hace unos años a esta parte, se ha empezado a usar la inteligencia artificial para ayudarnos a clasificar y ordenar las imágenes. Primero fueron servicios online como Flickr, Google o Amazon, además de tecnologías como las que Apple aplica en iPhoto o como las que más recientemente está aplicando Huawei en sus terminales con procesadores Kirin 970 y Kirin 980.
La diferencia entre Huawei y el resto de servicios estriba en que la clasificación y ordenación de las fotos (y los vídeos hasta cierto punto) se realiza en el propio terminal en vez de en la nube.
La forma de trabajar, ya sea en la nube o en el terminal, está sustentada sobre tecnologías de IA implementadas mediante redes neuronales especializadas en el reconocimiento de imágenes. A medida que se consiguen entrenar estas redes neuronales con más imágenes, es posible refinar el grado de precisión con el que los sistemas de IA identifican elementos característicos y singulares.
A día de hoy, las categorías que encontramos en las opciones de clasificación se cuentan por decenas, o incluso por centenares. Además, podemos encontrar la misma foto en diferentes categorías dependiendo de cómo el motor de IA analice e identifique elementos característicos y singulares en las imágenes.
Google, Amazon, Flickr, iPhoto o Huawei, a pesar de usar un motor similar de reconocimiento de imágenes, presentan diferencias en la forma de mostrar las imágenes a los usuarios.
Galería de Huawei
Huawei ha optado por implementar la tecnología de clasificación en el propio terminal, con la ventaja de contar con un número de categorías muy elevado, que permite clasificar imágenes de acuerdo con muchos criterios. Desde los que identifican rostros o ubicaciones, hasta los que directamente reconocen monumentos, sin olvidar vehículos y medios de transporte, fotos grupales, fuentes o mascotas.
Como elemento adicional, está la IA aplicada a los vídeos. No tanto para clasificarlos como para crear un resumen de 10 segundos con los momentos más relevantes. Y también es capaz de agrupar los contenidos de la galería para crear álbumes de recuerdos.
Presente en terminales como los Huawei P30 Pro o Huawei Mate 20 Pro, este tipo de clasificación y ordenación permite manejar colecciones de fotos con un número elevado de imágenes de un modo más ágil que atendiendo a la ordenación cronológica. No siempre acierta en la identificación de las imágenes, pero a medida que se entrenan las redes neuronales, los resultados van refinándose más y más.
Flickr
Flickr ha sido una de las pioneras en la adopción de sistemas de clasificación automática de imágenes. Su “Filtro Mágico” permite clasificar nuestra colección de fotos bajo un número de categorías que, a día de hoy, se muestra como modesto, aunque útil si no queremos rebuscar demasiado y nos conformamos con una clasificación a grandes rasgos.
Concretamente, tenemos ocho categorías principales y 15 subcategorías, aunque muchas de ellas entran dentro de “Otro”, por lo que caemos en una peligrosa generalidad que hace que, incluso clasificando fotos, tengamos centenares o miles de ellas dentro de un mismo apartado.
Esta clasificación está disponible en la interfaz web, pero no en la de la app para móvil. Flickr tuvo su momento álgido cuando era parte de Yahoo!, aunque ahora no está clara cómo será su evolución.
Google Fotos
Este es el servicio de clasificación más potente y completo en la nube. En este caso, no existe una lista de categorías como tal, sino que se usa un buscador donde introducimos aquel elemento que queremos identificar y el motor de búsqueda nos devolverá las fotos de nuestra galería que contengan el elemento que hemos buscado.
Hay un margen de libertad muy grande a la hora de buscar, y en la mayor parte de los casos encontraremos lo que queremos, aunque la categoría sea rebuscada.
Google tiene almacenamiento ilimitado gratuito si permitimos que redimensione las imágenes que subamos. En concreto, se quedan en 16 Mpx cuando superan ese tamaño. Si tenemos dispositivos móviles de Google, el almacenamiento es ilimitado para fotos de tamaño completo.
Además de clasificar las fotos por categorías, Google es capaz de retocar fotos automáticamente, así como crear vídeos a partir de fotos, álbumes temáticos o animaciones a partir de secuencias de imágenes. Todo ello usando tecnología de IA tras analizar las imágenes que se suban a la nube.
Amazon Fotos
Amazon también cuenta con un servicio de almacenamiento de fotos en la nube. Es ilimitado si tenemos una cuenta Prime, con la peculiaridad de que admite la subida de instantáneas en formato RAW. Además, no redimensiona las fotos, por lo que es la opción ideal para hacer una copia de respaldo de las imágenes que tengamos.
En lo que concierne a la IA, ofrece la posibilidad de clasificar las imágenes por lugares, personas, fechas o diferentes tipos de objetos y elementos tales como jardines, coches, plantas, comida, arte, etcétera.
No es tan flexible como Google Fotos o la Galería de Huawei, pero es bastante completo gracias a la posibilidad de combinar varios criterios de búsqueda al mismo tiempo para refinar los resultados.
Apple iPhoto
Apple también permite clasificar las imágenes de acuerdo con el contenido de las fotos. La clasificación se realiza en el propio dispositivo iOS, aunque el número de categorías y la diversidad de elementos que identifica no es tan extensa como en el caso de Google o Huawei.
Los criterios de reconocimiento de rostros o ubicaciones están contemplados, por supuesto.
Perspectivas de futuro
El uso de sistemas de clasificación automática de imágenes parece estar aquí para quedarse y evolucionar. Las colecciones de fotos son cada vez más extensas y sería de gran utilidad que los sistemas de clasificación contemplasen de forma sistemática tecnologías que permitan incluso detectar fotos mal hechas y bien hechas. Ya existen, aunque no están integrados de forma «normal» en estos motores de clasificación mediante machine learning.
Además, hay muchos fallos en la clasificación actual. Si observamos las fotos, algunas no se corresponden en absoluto con la categoría donde están. Los sistemas de captcha hacen de sistemas de «entrenamiento» para estos motores, pero es necesario que mejoren aún más. El vídeo es otra asignatura pendiente. Ya hay motores que «entran» en el vídeo para encontrar elementos para su clasificación, pero sigue siendo una tecnología incipiente.
De todos modos, la tendencia es claramente hacia una mejor y más completa y rápida ordenación y clasificación de los contenidos multimedia.
Imágenes / Huawei, Flickr, Google Fotos y Amazon Fotos