Bienvenido: Ingresar
location: Diferencias para "Vision/ProyectosVision/RobotVision2012"
Diferencias entre las revisiones 3 y 34 (abarca 31 versiones)
Versión 3 con fecha 2012-04-25 12:16:38
Tamaño: 631
Editor: Jaarac
Comentario:
Versión 34 con fecha 2012-04-26 13:25:01
Tamaño: 3571
Editor: Jaarac
Comentario:
Los textos eliminados se marcan así. Los textos añadidos se marcan así.
Línea 4: Línea 4:
Experimentos realizados para la 4º edición de la competencia ""Robot Vision Challenge"". Experimentos realizados para la 4º edición de la competencia ''''Robot Vision Challenge - ImageCLEF''''.
Línea 8: Línea 8:
== Cosas que vamos a tener que probar ==

 * Aumentar los conjuntos de datos con la versión espejada de las imágenes


 * Algún pre-procesamiento para estabilizar el "motion blur" y el "flickering"

  * Debluring:

   * http://www.di.ens.fr/willow/research/deblurring/ (código en matlab)

   * http://grail.cs.washington.edu/projects/mdf_deblurring/

  * Flickering: se puede probar trabajar en aglún espacio de color que sea robusto frente a cambios afines en la iluminación

 * Descriptores de colores

  * J. van de Weijer, C. Schmid, J. Verbeek, D. Larlus, ''Learning Color Names for Real-World Applications'', IEEE TIP, 2009.

  http://lear.inrialpes.fr/people/vandeweijer/color_names.html

  * K. van de Sande, T. Gevers and C. Snoek, ''Evaluating Color Descriptors for Object and Scene Recognition'', IEEE TPAMI, 2010

  http://koen.me/research/colordescriptors
Línea 10: Línea 35:
== Configuración General ==
=== Descriptores ===
==== SIFT ====
hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012
Línea 16: Línea 39:
==== Configuración Particular ==== ==== Configuración ====

 * Descriptores: SIFT sobre grilla regular (DSIFT de vlfeat), patchs 32x32, paso=8, L2-norm., D=128

 * PCA: subespacio aprendido sobre training1+training2+training3, D=80

 * GMM: aprendido sobre training1+training2+training3, para ''N = 8, 16 y 32''

 * IFV: gradientes resp. medias y varianzas, alpha=0.5, pnorm=2.0

 * SGD: hinge loss, ''20, 50 y 100'' iteraciones, ''lambda = 1e-2, 1e-3 y 1e-4'', training sobre ''training1'' y testeando sobre ''training2''. La clasificación se realizo con argmax.
Línea 18: Línea 52:
||1||2||
||3||4||
|| ||||||20 iteraciones||||||||50 iteraciones||||||||100 iteraciones||
||lambda\ngauss||8||16||32||||8||16||32||||8||16||32||
||1e-3|| 1382 || 1334 || 1414 |||| 1376 || 1352 || 1426 |||| 1382 || 1356 || 1422 ||
||1e-4|| 1462 || 1422 || 1466 |||| 1462 || 1400 || 1478 |||| 1462 || 1396 || 1476 ||
||1e-5|| 1318 || 1402 || 1444 |||| 1358 || 1368 || 1394 |||| 1378 || 1384 || 1322 ||
/* ||1e-2|| 872 || 984 || 928 |||| 886 || 990 || 930 |||| 890 || 992 || 940 || */

[[attachment:experimento_1_25_abril_2012.txt]]

== 26 abril 2012 ==
=== Experimento 1 ===
==== Configuración ====

 * Igual que el experimento anterior, pero se agrego 64 gaussianas.

 * SGD: hinge loss, ''20'' iteraciones, ''lambda = 1e-4'', training sobre ''training1'' o ''training2'' y testeando siempre sobre ''training3''. La clasificación se realizo con argmax y con thr=-0.1.

==== Resultados ====
|| ||||||||20 iteraciones, argmax, train1 ||||||||||20 iteraciones, thr=-0.1, train1||||||||||20 iteraciones, argmax, train2||||||||||20 iteraciones, thr=-0.1, train2||
||l\ng||8||16||32||64||||8||16||32||64||||8||16||32||64||||8||16||32||64||
||1e-4|| -405 || -153 || -127 || -161 |||| 194 || 362 || 355 || 399 |||| -361 || -87 || 1 || 35 |||| 226 || 421 || 471 || 553 ||

[[attachment:experimento_1_train1_val3_argmax_26_abril_2012.txt]]
[[attachment:experimento_1_train1_val3_-0.1_26_abril_2012.txt]]
[[attachment:experimento_1_train2_val3_argmax_26_abril_2012.txt]]
[[attachment:experimento_1_train2_val3_-0.1_26_abril_2012.txt]]

Robot Vision 2012

Experimentos realizados para la 4º edición de la competencia 'Robot Vision Challenge - ImageCLEF'.

Robot Vision 2012 Web Site

Cosas que vamos a tener que probar

Repositorio con los scripts para replicar los experimentos

hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012

25 abril 2012

Experimento 1

Configuración

  • Descriptores: SIFT sobre grilla regular (DSIFT de vlfeat), patchs 32x32, paso=8, L2-norm., D=128
  • PCA: subespacio aprendido sobre training1+training2+training3, D=80
  • GMM: aprendido sobre training1+training2+training3, para N = 8, 16 y 32

  • IFV: gradientes resp. medias y varianzas, alpha=0.5, pnorm=2.0
  • SGD: hinge loss, 20, 50 y 100 iteraciones, lambda = 1e-2, 1e-3 y 1e-4, training sobre training1 y testeando sobre training2. La clasificación se realizo con argmax.

Resultados

20 iteraciones

50 iteraciones

100 iteraciones

lambda\ngauss

8

16

32

8

16

32

8

16

32

1e-3

1382

1334

1414

1376

1352

1426

1382

1356

1422

1e-4

1462

1422

1466

1462

1400

1478

1462

1396

1476

1e-5

1318

1402

1444

1358

1368

1394

1378

1384

1322

experimento_1_25_abril_2012.txt

26 abril 2012

Experimento 1

Configuración

  • Igual que el experimento anterior, pero se agrego 64 gaussianas.
  • SGD: hinge loss, 20 iteraciones, lambda = 1e-4, training sobre training1 o training2 y testeando siempre sobre training3. La clasificación se realizo con argmax y con thr=-0.1.

Resultados

20 iteraciones, argmax, train1

20 iteraciones, thr=-0.1, train1

20 iteraciones, argmax, train2

20 iteraciones, thr=-0.1, train2

l\ng

8

16

32

64

8

16

32

64

8

16

32

64

8

16

32

64

1e-4

-405

-153

-127

-161

194

362

355

399

-361

-87

1

35

226

421

471

553

experimento_1_train1_val3_argmax_26_abril_2012.txt experimento_1_train1_val3_-0.1_26_abril_2012.txt experimento_1_train2_val3_argmax_26_abril_2012.txt experimento_1_train2_val3_-0.1_26_abril_2012.txt

None: Vision/ProyectosVision/RobotVision2012 (última edición 2013-08-10 22:52:45 efectuada por Jaarac)