En las últimas décadas se han introducido innovaciones tecnológicas a un ritmo nunca antes visto. El aspecto negativo de esta velocidad, es que muchas veces esto disminuye nuestra capacidad de asombro. Sin embargo, existen momentos donde volvemos a experimentar esa sensación única, de ver la realidad alcanzando a nuestra imaginación. Personalmente, uno de esos momentos fue con la salida del primer iPod Touch y la desaparición de los botones físicos. El último, lo identifico con la aparición de la Inteligencia Artificial, y en particular, su capacidad de hacer que las computadoras puedan ver.

Computer Vision

Computer Vision es la interacción con el mundo a través de la percepción visual, procesa imágenes y video para interpretarlos, brindando detalles e interpretación de los mismos.

¿A que nos referimos cuando decimos que las computadoras pueden ver? A que en estos momentos son muy eficientes en realizar los siguientes tipos de actividades, y lo más importante, que estas capacidades se encuentran disponibles para el uso de todos nosotros con un esfuerzo e inversión bajos.

  • Clasificar imágenes en categorías
  • Detección de objetos, incluso personas.
  • Analizar e identificar caras.
  • Detectar contenido adulto.
  • Lectura de texto y documentos

Análisis de imágenes

Luego del análisis de una imagen, se pueden describir los objetos detectados, generando frases amigables, o sentencias que describen los objetos encontrados.

También podemos identificar un conjunto de etiquetas asociadas con la imagen, que nos ayudan a clasificar su tipo de contenido. En el ejemplo anterior, podemos recuperar etiquetas como gato y retrato.

Este tipo de características ha sido incorporado por Instagram como forma de mejorar la accesibilidad de su servicio.

Detección e identificación de Objetos

Es posible detectar objetos dentro de una imagen, para los cuales no sólo se identifica su naturaleza, sino que también se delimita su forma y ocupación.

En el ejemplo, podemos identificar las distintas frutas que aparecen, así como también las coordenadas de la región que ocupan en la imagen.

Esta técnica se puede aplicar para cualquier tipo de objeto que buscamos identificar. Por ejemplo, podemos detectar marcas dentro de una fotografía, en caso que busquemos analizar el uso de nuestros productos, o algún producto en particular de nuestro interés comercial.

Detección, reconocimiento y análisis de rostros

Un área particular dentro de las capacidades de detección, es aquella que identifica rostros dentro de la imagen.

Además de localizar los rostros, es posible identificar a la persona (Skynet agradecido)

Sin embargo, las posibilidades van mucho más allá de la detección, con la identificación de características, donde podemos identificar rasgos típicos y descripciones detalladas de los rostros observados. Esto incluye la identificación del estado de ánimo de la persona, ¿Está sonriendo?, ¿se muestra molesta?

Algunas de las características que podemos conocer de una persona a partir de su fotografía:

  • Edad. La edad estimada, en años.
  • Género. Estimación de género, masculino, femenino o sin identificar.
  • Emoción. Clasificación de la emoción mostrada (felicidad, tristeza, neutral, ira).
  • Lentes. Indica si la persona utiliza lentes, y que tipo de lentes, de lectura, de sol, para natación, etc.
  • Cabello. Si tiene o no cabello, y su color.
  • Barba. Indica si tiene o no barba.
  • Maquillaje. Indica si la persona está maquillada o no.
  • Posición. Orientación de la cara, si se encuentra inclinada, cuantos grados de inclinación.

Las aplicaciones son variadas, partiendo de la autenticación, hasta el análisis de las reacciones de nuestros clientes al servicio brindado.

Lectura de texto y documentos

Es natural que una vez pueden observar el mundo que las rodea, la lectura sea una de sus grandes atracciones ¿no?

Con el uso de inteligencia artificial, se ha mejorado las capacidades que ya se conocían de lectura de texto dentro de las imágenes. Incluso para texto manuscrito, puede ser interpretado y transformado de forma sencilla.

Desde el punto de vista de su aplicación comercial, una de las características más interesantes es la lectura de formularios. Se tiene la capacidad de interpretar recibos y facturas de forma de extraer sus valores.

Podemos automatizar la lectura de valores de facturas, o cualquier fragmento de información contenido en papel, con el ahorro de tiempo y errores que esto implica.

El futuro es hoy

Estas novedades tecnológicas de por sí, representan una revolución en todo tipo de áreas, comercial, seguridad, salud. Pero su importancia se multiplica al considerar que se encuentran disponibles al alcance de todo tipo de usuario. Su uso se ha masificado, y pueden ser aprovechadas sin importar el rubro o tamaño de la persona o empresa interesada.

El desarrollo de soluciones que incluyan estas novedades puede adecuarse a todo tipo de inversión económica. Existen herramientas en nube, completas y accesibles, así como soluciones a medida utilizando desarrollos de código abierto y muy bajo esfuerzo de implantación.

En IDEATI estamos a tu disposición para ayudarte a construir tus proyectos de Inteligencia Artificial.