Blog

Computer Visión

¿Qué es Computer Visión?

El término Computer Vision (Visión Artificial en español) es un subcampo de machine learning que enseña a los ordenadores a ‘ver’ y entender el contenido de las imágenes digitales.

Puede parecer una tarea muy simple ya que hasta un niño de tres años sabe diferenciar objetos tanto en imágenes como en videos. Sin embargo, a nivel biológico y computacional las cosas se complican bastante.

Visión de Computer Visión

El objetivo de Computer Visión o visión por computadora es emular la visión humana utilizando imágenes digitales a través de tres componentes principales de procesamiento, ejecutados uno tras otro:

Adquisición de imágenes

Adquisición de imágenes

Análisis de imágenes y comprensión

A medida que nuestra comprensión visual humana del mundo se refleja en nuestra capacidad de tomar decisiones a través de lo que vemos, proporcionar tal comprensión visual a las computadoras les permitiría el mismo poder:

Procesamiento de imágenes

El segundo componente de Computer Vision es el procesamiento de imágenes de bajo nivel. Los algoritmos se aplican a los datos binarios adquiridos en el primer paso para inferir información de bajo nivel sobre partes de la imagen. Este tipo de información se caracteriza por bordes de imagen, características de punto o segmentos, por ejemplo. Son todos los elementos geométricos básicos que construyen objetos en imágenes.

Este segundo paso generalmente involucra algoritmos y técnicas avanzados de matemáticas aplicadas .

Los algoritmos de procesamiento de imágenes de bajo nivel incluyen:

Detección de bordes

Detección de bordes en una imagen en color.

Segmentación

Segmentación de manzanas en una canasta

Clasificación

Clasificación de partes de imágenes

Análisis de imágenes y comprensión

El segundo componente de Computer Vision es el procesamiento de imágenes de bajo nivel. Los algoritmos se aplican a los datos binarios adquiridos en el primer paso para inferir información de bajo nivel sobre partes de la imagen. Este tipo de información se caracteriza por bordes de imagen, características de punto o segmentos, por ejemplo. Son todos los elementos geométricos básicos que construyen objetos en imágenes.

El último paso de la canalización de Visión artificial es el análisis real de los datos, que permitirá la toma de decisiones.
Se aplican algoritmos de alto nivel, utilizando tanto los datos de imagen como la información de bajo nivel calculada en los pasos anteriores. Ejemplos de análisis de imágenes de alto nivel son:

Mapeo de escenas en 3D

Reconocimiento de objetos

Reconocimiento de objetos en imágenes

Seguimiento de objetos

Rastreando personas en una avenida

Aplicaciones de visión artificial 

Es un hecho que las aplicaciones de CV al mundo real son innumerables. Además, las grandes empresas como Amazon, Google, Microsoft y Facebook están invirtiendo millones de euros en esta tecnología. Realizando una búsqueda en internet, llegamos a la conclusión de que muchos de los siguientes sectores están echando mano de la tecnología CV:Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo. Nemo enim ipsam voluptatem quia voluptas sit aspernatur aut odit aut fugit, sed quia consequuntur magni dolores eos qui ratione voluptatem sequi nesciunt. Neque porro quisquam est.

Banca

Este sector también está sacándole partido a la tecnología de CV. Existen sistemas como Mitek Systems que realizan un reconocimiento de imágenes con el fin de clasificar documentos, extraer información e identificar a los individuos. Esto facilita trámites como no tener que acudir a una sucursal para abrir una nueva cuenta bancaria.

Automoción

¿Quién no conoce Tesla? Esta empresa de automoción sabe el significado real de la aplicación de Computer Vision. En comunicación con la tecnología de IA, todos los modelos Tesla llevan instaladas decenas de cámaras. Utilizando la visibilidad 360, su sistema AutoPilot tiene la capacidad de conducir el vehículo sin la supervisión humana.

Salud

Microsoft pone a disposición un software llamado InnerEye, que es capaz de visualizar e identificar tumores u otras anomalías en las radiografías (rayos X). Los radiólogos pueden subir una radiografía tridimensional, y el software colorea las zonas que presentan anomalías, con el fin de prestar mayor atención a dicha zona.

Aplicaciones de visión artificial

Las técnicas desarrolladas para Computer Visión tienen muchas aplicaciones en los campos de la robótica, la interacción entre humanos y la visualización, por nombrar algunos:
Las técnicas desarrolladas para Computer Visión tienen muchas aplicaciones en los campos de la robótica, la interacción entre humanos y la visualización, por nombrar algunos:

1. Reconocimiento de movimiento
2. Realidad aumentada
3. Coches autónomos
4. Robots domésticos / de servicio
5. Restauración de imagen como eliminación de ruido

Comparte esta publicación

Share on facebook
Share on whatsapp
Share on telegram
Share on twitter