4.3.1. Conceptos básicos.
Visión Artificial: Rama de la inteligencia artificial que busca reproducir la función de la vista mediante procesos y herramientas tecnológicas. Aplicar técnicas de visión artificial debe tener un propósito, es decir, en base a la información adquirida mediante imágenes y su procesamiento, se deben tomar acciones o plasmar la información crítica que estamos buscando. Por ejemplo, en ocasiones se utiliza la visión artificial para mover actuadores, para indicarle a un robot los obstáculos que hay, etc. Pero en otras ocasiones se puede utilizar la visión artificial simplemente para mostrar información, por ejemplo, en una fábrica indicando que un material tiene defectos. La visión artificial se compone de varias ramas, pero las más significativas son las siguientes:
- Matemáticas : Todas las técnicas que se utilizan para el procesamiento de imágenes se basan en las matemáticas, desde la eliminación de ruido, detección de bordes, detección de objetos, detección de color, todas se basan en matemáticas, y es importante conocer de dónde vienen todas estas herramientas para poder y saber aplicarlo en nuestro algoritmo.
- Procesamiento de imágenes : Antes de indicarle a nuestro Sistema de Visión lo que deba hacer con las imágenes, estas deben pasar por un procesamiento previo. Las imágenes siempre tienen ruido, por lo que normalmente debemos eliminarlo desde un inicio. En ocasiones nada más queremos destacar ciertas áreas o información de la imagen, como un borde o un color, por lo que la imagen debe de pasar por un procesamiento para resaltar la información que queramos y eliminar la que solo nos estorba, de ahí la importancia del procesamiento de imágenes.
- Aprendizaje de máquina : Si queremos desarrollar visión artificial tarde o temprano tendremos que introducirnos al mundo del ¨Aprendizaje de máquina¨. La mayoría de los programas de visión están desarrollados para un ambiente o escenario, y una vez que se cambia de escenario dicho programa deja de funcionar. Por lo tanto, desarrollando aprendizaje de máquina para nuestro programa, este será capaz de adaptarse a múltiples escenarios, mientras más se alimente más escenarios aceptará, haciéndolo mucho más funcional.
Imagen digital: Las imágenes digitales se representan con matrices de un número de renglones por un número de columnas. Cada espacio dentro de la matriz representa un nivel de gris (intensidad de color), y es a lo que llamamos pixel. Por ejemplo, podemos tener una imagen de tamaño 5x5 (5 renglones por 5 columnas), que representan a 25 pixeles con su respectiva intensidad de color. Se podría visualizar de la siguiente manera, donde los valores 21, 55, 88, 19…. representan un valor de gris en dicha posición.
Por ejemplo, tenemos la siguiente imagen:
Esta imagen tiene una gran cantidad de pixeles, si hacemos zoom en una parte en específico, podemos analizar minuciosamente que cada pixel tiene una intensidad de gris distinta.
Como sabemos, la visión artificial trata de crear la misma función que la de la vista humana. Ahora bien, cada una tiene sus respectivas ventajas y desventajas.
Ventajas de la visión humana
- Se basa en el conocimiento previo: Por ejemplo, nosotros desde chicos sabemos cómo es una manzana, color, tamaño y forma, y aunque nos la muestren en distintas posiciones o semi-oculta sabemos que es una manzana porque es un conocimiento que ya adquirimos.
- El ojo humano tiene alta resolución de captura.
- Adaptable a una gran variedad de situaciones: Por ejemplo, se adapta a los cambios de escenario y de iluminación.
- Alta capacidad de reconocimiento de objetos.
- No puede medir la magnitud de intensidad de colores.
- El ojo humano se cansa y puede llegar a perder visión.
- Sensible a efectos ópticos.
- No puede medir distancias geométricas con exactitud.
Ventajas de la visión artificial
- Los efectos ópticos no le afectan.
- Puede medir magnitudes físicas con una alta precisión.
- Podemos analizar muchos factores de la imagen y obtener gran cantidad de información.
- Al no cansarse como en el caso del ojo humano, puede realizar tareas rutinarias por mucho tiempo.
- Dependiendo del tipo de cámara y del procesamiento de la imagen puede haber pérdida de información.
- Para medir objetos, los cambios de escala son un gran problema.
- Los cambios de iluminación pueden alterar toda la interpretación de la información si no se programa para varios escenarios.
- No detecta movimiento directamente.
Video resumen:
Comentarios
Publicar un comentario