Diferencias entre las revisiones 8 y 24 (abarca 16 versiones)

Robot Vision 2012

Experimentos realizados para la 4º edición de la competencia 'Robot Vision Challenge - ImageCLEF'.

Robot Vision 2012 Web Site

Cosas que vamos a tener que probar

Aumentar los conjuntos de datos con la versión espejada de las imágenes
Algún pre-procesamiento para estabilizar el "motion blur" y el "flickering"
Debluring:
- http://www.di.ens.fr/willow/research/deblurring/ (código en matlab)
- http://grail.cs.washington.edu/projects/mdf_deblurring/
Flickering: se puede probar trabajar en aglún espacio de color que sea robusto frente a cambios afines en la iluminación
Descriptores de colores
- J. van de Weijer, C. Schmid, J. Verbeek, D. Larlus, Learning Color Names for Real-World Applications, IEEE TIP, 2009.
  http://lear.inrialpes.fr/people/vandeweijer/color_names.html
- K. van de Sande, T. Gevers and C. Snoek, Evaluating Color Descriptors for Object and Scene Recognition, IEEE TPAMI, 2010
  http://koen.me/research/colordescriptors

Repositorio con los scripts para replicar los experimentos

hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012

25 abril 2012

Experimento 1

Configuración

Descriptores: SIFT sobre grilla regular (DSIFT de vlfeat), patchs 32x32, paso=8, L2-norm., D=128
PCA: subespacio aprendido sobre training1+training2+training3, D=80
GMM: aprendido sobre training1+training2+training3, para N = 8, 16 y 32
IFV: gradientes resp. medias y varianzas, alpha=0.5, pnorm=2.0
SGD: hinge loss, 20, 50 y 100 iteraciones, lambda = 1e-2, 1e-3 y 1e-4, training sobre training1 y testeando sobre training2. La clasificación se realizo con argmax.

Resultados

	20 iteraciones			50 iteraciones			100 iteraciones
lambda	8	16	32	8	16	32	8	16	32
1e-2	872	984	928	886	990	930	890	992	940
1e-3	1382	1334	1414	1376	1352	1426	1382	1356	1422
1e-4	1462	1422	1466	1462	1400	1478	1462	1396	1476

None: Vision/ProyectosVision/RobotVision2012 (última edición 2013-08-10 22:52:45 efectuada por Jaarac)

-  ⇤ ← Versión 8 con fecha 2012-04-25 13:30:24 → 
  Tamaño: 911
  Editor: JorgeSanchez
  Comentario:
+   ← Versión 24 con fecha 2012-04-25 19:56:45 → ⇥
  Tamaño: 2406
  Editor: JorgeSanchez
  Comentario:
-Los textos eliminados se marcan así.
+Los textos añadidos se marcan así.
 Línea 8:
+== Cosas que vamos a tener que probar ==

 * Aumentar los conjuntos de datos con la versión espejada de las imágenes


 * Algún pre-procesamiento para estabilizar el "motion blur" y el "flickering"

 * Debluring:

   * http://www.di.ens.fr/willow/research/deblurring/ (código en matlab)

   * http://grail.cs.washington.edu/projects/mdf_deblurring/

 * Flickering: se puede probar trabajar en aglún espacio de color que sea robusto frente a cambios afines en la iluminación

 * Descriptores de colores 

  * J. van de Weijer, C. Schmid, J. Verbeek, D. Larlus, ''Learning Color Names for Real-World Applications'', IEEE TIP, 2009. 

  http://lear.inrialpes.fr/people/vandeweijer/color_names.html

  * K. van de Sande, T. Gevers and C. Snoek, ''Evaluating Color Descriptors for Object and Scene Recognition'', IEEE TPAMI, 2010

  http://koen.me/research/colordescriptors
-Línea 9:
+Línea 34:
+hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012
-Línea 18:
+Línea 45:
- * GMM: aprendido sobre training1+training2+training3
+ * GMM: aprendido sobre training1+training2+training3, para ''N = 8, 16 y 32''
-Línea 22:
+Línea 49:
- * SGD: hinge loss, 20 iteraciones
+ * SGD: hinge loss, ''20, 50 y 100'' iteraciones, ''lambda = 1e-2, 1e-3 y 1e-4'', training sobre ''training1'' y testeando sobre ''training2''. La clasificación se realizo con argmax.
-Línea 25:
+Línea 52:
-||1||2||
||3||4||
+|| ||||||20 iteraciones||||||||50 iteraciones||||||||100 iteraciones||
||lambda||8||16||32||||8||16||32||||8||16||32||
||1e-2|| 872 || 984 || 928 |||| 886 || 990 || 930 |||| 890 || 992 || 940 ||
||1e-3|| 1382 || 1334 || 1414 |||| 1376 || 1352 || 1426 |||| 1382 || 1356 || 1422 ||
||1e-4|| 1462 || 1422 || 1466 |||| 1462 || 1400 || 1478 |||| 1462 || 1396 || 1476 ||

Buscar

Herramientas