Diferencias entre las revisiones 2 y 67 (abarca 65 versiones)

Robot Vision 2012

Experimentos realizados para la 4º edición de la competencia 'Robot Vision Challenge - ImageCLEF'.

Robot Vision 2012 Web Site

Tareas

experimentos con pirámides espaciales
usar el detector de transiciones con NGAUSS=64, 128 y 256
buscar implementaciones y evaluar descriptores RGBD
ver algunos descriptores de colores

Cosas que vamos a tener que probar

Aumentar los conjuntos de datos con la versión espejada de las imágenes
Algún pre-procesamiento para estabilizar el "motion blur" y el "flickering"
- Debluring:
  - http://www.di.ens.fr/willow/research/deblurring/ (código en matlab)
  - http://grail.cs.washington.edu/projects/mdf_deblurring/
- Flickering: se puede probar trabajar en aglún espacio de color que sea robusto frente a cambios afines en la iluminación
Descriptores de colores
- J. van de Weijer, C. Schmid, J. Verbeek, D. Larlus, Learning Color Names for Real-World Applications, IEEE TIP, 2009.
  http://lear.inrialpes.fr/people/vandeweijer/color_names.html
- K. van de Sande, T. Gevers and C. Snoek, Evaluating Color Descriptors for Object and Scene Recognition, IEEE TPAMI, 2010
  http://koen.me/research/colordescriptors

Datasets

Imágenes de ejemplo

En training1 el recorrido del robot es contrario al caso de training[23].
Las imágenes de training3 son tomadas de noche

Training1

Training2

Training3

Repositorio con los scripts para replicar los experimentos

hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012

Estructura de directorios

RobotVision2012/DS_..._DSIFT_.../
- trainingX/
  
  trainingX.log
  
  trainingX_lr/
  
  trainingX_lr.log
  
  _PCA_/
  - subspace.dat
    
    subspace.log
    
    80D/
    - trainingX/
      
      trainingX.log
      
      trainingX_lr/
      
      trainingX_lr.log
      
      _GMM_/
      - u64.gmm
        
        u64/
        
        IFV.../
        
        trainingX/
        
        trainingX.log
        
        trainingX_lr/
        
        trainingX_lr.log
        
        _SGD_tr12_te3_/
        
        hinge_20_1e-4/
        
        Corridor.lin
        
        hinge_20_1e-4.training3
        
        hinge_20_1e-4.log

25 abril 2012

Experimento 1

Configuración

Descriptores: SIFT sobre grilla regular (DSIFT de vlfeat), patchs 32x32, paso=8, L2-norm., D=128, 5 escalas, factor=0.707
PCA: subespacio aprendido sobre training1+training2+training3, D=80
GMM: aprendido sobre training1+training2+training3, para N = 8, 16 y 32
IFV: gradientes resp. medias y varianzas, alpha=0.5, pnorm=2.0
SGD: hinge loss, 20, 50 y 100 iteraciones, lambda = 1e-2, 1e-3 y 1e-4, training sobre training1 y testeando sobre training2. La clasificación se realizo con argmax.

Resultados

	20 iteraciones			50 iteraciones			100 iteraciones
lambda\ngauss	8	16	32	8	16	32	8	16	32
1e-3	1382	1334	1414	1376	1352	1426	1382	1356	1422
1e-4	1462	1422	1466	1462	1400	1478	1462	1396	1476
1e-5	1318	1402	1444	1358	1368	1394	1378	1384	1322

experimento_1_25_abril_2012.txt

26 abril 2012

Experimento 1

Configuración

Igual que el experimento anterior, pero se agrego 64 gaussianas.
SGD: hinge loss, 20 iteraciones, lambda = 1e-4, training sobre training1 o training2 y testeando siempre sobre training3. La clasificación se realizo con argmax y con thr=-0.1.

Resultados

	20 iteraciones, argmax, train1				20 iteraciones, thr=-0.1, train1				20 iteraciones, argmax, train2				20 iteraciones, thr=-0.1, train2
l\ng	8	16	32	64	8	16	32	64	8	16	32	64	8	16	32	64
1e-4	-405	-153	-127	-161	194	362	355	399	-361	-87	1	35	226	421	471	553

experimento_1_train1_val3_argmax_26_abril_2012.txt experimento_1_train1_val3_-0.1_26_abril_2012.txt experimento_1_train2_val3_argmax_26_abril_2012.txt experimento_1_train2_val3_-0.1_26_abril_2012.txt

3 mayo 2012

Experimento 1

Se realiza una prueba con distintos valores de DSIFT_STEP (8 y 16) y aumento el conjunto de entrenamiento haciendo un flip left-right de las imágenes antes de calcular DSIFT. Flip=0, indica sin aumentar el conjunto; Flip=1 indica aumentando el conjunto de entrenamiento con las imágenes flipeadas. Al final de este experimento se muestra la configuración que resulta más apropiada.

Configuración

SGD LBD=1e-4, 20 iteraciones
Using argmax for classification

Resultados

Flip=0

DSIFT step=8

		NGAUSS
Tr.	Te.	8	16	32	64	128	256	512	1024
1,2	3	-289	29	59	79	185	267	319	445
2,3	1	935	1195	1141	1173	1183	1251	1225	1293
3,1	2	1162	1374	1390	1456	1584	1658	1668	1632
Avg.		603	866	863	903	984	1059	1071	1123

DSIFT step=16

		NGAUSS
Tr.	Te.	8	16	32	64	128	256	512	1024
1,2	3	-161	-9	19	25	225	191	299	371
2,3	1	897	1129	1221	1143	1101	1095	1175	1179
3,1	2	1160	1252	1392	1424	1412	1528	1552	1524
Avg.		632	791	877	864	913	938	1009	1025

Flip=1

DSIFT step=8

		NGAUSS
Tr.	Te.	8	16	32	64	128	256	512	1024
1,2	3	-357	-105	45	59	185	199	233	411
2,3	1	1569	1703	1787	1795	1887	1949	1995	1999
3,1	2	1666	1880	2018	2076	2142	2182	2182	2190
Avg.		959	1159	1283	1310	1405	1443	1470	1533

DSIFT step=16

		NGAUSS
Tr.	Te.	8	16	32	64	128	256	512	1024
1,2	3	-211	11	31	-15	233	149	263	373
2,3	1	1447	1651	1693	1791	1857	1901	1945	1909
3,1	2	1642	1744	1944	2032	2126	2128	2150	2140
Avg.		959	1135	1223	1269	1405	1393	1453	1474

results_3_de_mayo_2012.tar.gz

Configuración: 256 Gaussianas, DSIFT step=8, flip=1

4 mayo 2012

Experimento 1

Se prueba oscureciendo las imágenes de entrenamiento del clasificador. El oscurecimiento se realiza multiplicando las intensidades de los pixeles de las imágenes por un factor menor a 1. Se probo con factores de 0.33 y 0.5. En este experimento no se actualizó el modelo .gmm con los nuevos descriptores con flip y oscurecidos.

Configuración

SGD LBD=1e-4, 20 iteraciones, 256 Gaussianas, DSIFT step=8, flip=1
Using argmax for classification

Resultados

NGAUSS=256		srange
Tr.	Te.	1.0	0.33	0.5
1,2	3	199	229	221
2,3	1	1949	1949	1945
3,1	2	2182	2180	2180
Avg.		1443	1452	1449

5 mayo 2012

Experimento 1

Se prueba oscureciendo las imágenes de entrenamiento del clasificador. El oscurecimiento se realiza multiplicando las intensidades de los pixeles de las imágenes por un factor menor a 1. Se probo con factores de 0.33 y 0.5. En este experimento si se actualizó el modelo .gmm con los nuevos descriptores generados con flip y con oscurecimiento.

Configuración

SGD LBD=1e-4, 20 iteraciones, 256 Gaussianas, DSIFT step=8, flip=1
Using argmax for classification

Resultados

NGAUSS=256		srange
Tr.	Te.	1.0	0.1	0.33	0.5
1,2	3	199	187	195	171
2,3	1	1949	1975	1945	1965
3,1	2	2182	2154	2166	2180
Avg.		1443	1439	1435	1439

7 mayo 2012

Experimento 1

Se prueba utilizando feature augmentation. En este experimento si se actualizó el modelo .gmm con los descriptores generados con flip de las imágenes. Con aug=1 o aug=0 se indica el uso o no de feature augmentation respectivamente.

Configuración

SGD LBD=1e-4, 20 iteraciones, 64 Gaussianas, DSIFT step=8, flip=[0,1]
Using argmax for classification

Resultados

NGAUSS=64		flip=0		flip=1
Tr.	Te.	aug=0	aug=1	aug=0	aug=1
1,2	3	77	87	257	33
2,3	1	1173	1207	1801	1783
3,1	2	1440	1528	2080	2014
Avg.		897	941	1379	1277

Comparación usando en ambos casos imágenes de entrenamiento originales y flipeadas, pero en el primer caso entrenando el modelo .gmm solo en las imágenes originales (gmm_flip=0) y en el segundo caso utilizando las imágenes originales y las flipeadas (gmm_flip=1). No se usó feature augmentation.

NGAUSS=64		flip=1
Tr.	Te.	gmm_flip=0	gmm_flip=1
1,2	3	59	257
2,3	1	1795	1801
3,1	2	2076	2080
Avg.		1310	1379

8 mayo 2012

Experimento 1

Configuración

SGD LBD=1e-4, 20 iteraciones, 128 Gaussianas, DSIFT step=8, flip=[0,1]
Using argmax for classification

Resultados

NGAUSS=128		flip=0		flip=1
Tr.	Te.	aug=0	aug=1	aug=0	aug=1
1,2	3	191	115	195	39
2,3	1	1189	1255	1887	1905
3,1	2	1582	1618	2132	2098
Avg.		987	996	1405	1347

9 mayo 2012

Experimento 1

Se prueba utilizando pirámides espaciales. Las configuraciones usadas son "sp1x1,lsf=0,gsf=0" (spyr=0), "sp1x1,sp1x3,lsf=0,gsf=0" (spyr=1) y "sp1x1,sp1x3,lsf=0.33,gsf=0.33" (spyr=2).

Configuración

SGD LBD=1e-4, 20 iteraciones, 64 Gaussianas, DSIFT step=8, flip=[0,1]
Using argmax for classification

Resultados

NGAUSS=64		flip=0			flip=1
Tr.	Te.	spyr=0	spyr=1	spyr=2	spyr=0	spyr=1	spyr=2
1,2	3	77	-413	-41	257	-458	201
2,3	1	1173	1123	1029	1801	1773	1791
3,1	2	1440	1412	1358	2080	2078	2084
Avg.		897	707	782	1379	1122	1359

11 mayo 2012

Experimento 1

Se prueba utilizando opponent SIFT. El software utilizado para calcular los descriptores es colorDescriptor

Configuración

Descriptor: OPP_SIFT, step=16, sampling_scale=1.6
SGD LBD=1e-4; 20 iteraciones; 16, 32 y 64 Gaussianas; flip=0
Using argmax for classification

Resultados

OPPSIFT		flip=0
Tr.	Te.	16	32	64
1,2	3	-231	-173	-17
2,3	1	1161	1217	1221
3,1	2	1538	1598	1664
Avg.		823	881	956

None: Vision/ProyectosVision/RobotVision2012 (última edición 2013-08-10 22:52:45 efectuada por Jaarac)

-  ⇤ ← Versión 2 con fecha 2012-04-25 11:59:18 → 
  Tamaño: 368
  Editor: Jaarac
  Comentario:
+   ← Versión 67 con fecha 2012-05-11 12:28:14 → ⇥
  Tamaño: 15084
  Editor: Jaarac
  Comentario:
-Los textos eliminados se marcan así.
+Los textos añadidos se marcan así.
 Línea 4:
-Experimentos realizados para la 4º edición de la competencia ""Robot Vision Challenge"".
+Experimentos realizados para la 4º edición de la competencia ''''Robot Vision Challenge - ImageCLEF''''.
-Línea 7:
+Línea 8:
+== Tareas ==
 * --(experimentos con pirámides espaciales)--
 * usar el detector de transiciones con NGAUSS=64, 128 y 256
 * buscar implementaciones y evaluar descriptores RGBD
 * ver algunos descriptores de colores


== Cosas que vamos a tener que probar ==

 * --(Aumentar los conjuntos de datos con la versión espejada de las imágenes)--


 * Algún pre-procesamiento para estabilizar el "motion blur" y el "flickering"

  * Debluring:

   * http://www.di.ens.fr/willow/research/deblurring/ (código en matlab)

   * http://grail.cs.washington.edu/projects/mdf_deblurring/

  * Flickering: se puede probar trabajar en aglún espacio de color que sea robusto frente a cambios afines en la iluminación

 * Descriptores de colores 

  * J. van de Weijer, C. Schmid, J. Verbeek, D. Larlus, ''Learning Color Names for Real-World Applications'', IEEE TIP, 2009. 

  http://lear.inrialpes.fr/people/vandeweijer/color_names.html

  * K. van de Sande, T. Gevers and C. Snoek, ''Evaluating Color Descriptors for Object and Scene Recognition'', IEEE TPAMI, 2010

  http://koen.me/research/colordescriptors

== Datasets ==
=== Imágenes de ejemplo ===
 * En training1 el recorrido del robot es contrario al caso de training[23].
 * Las imágenes de training3 son tomadas de noche

==== Training1 ====
[[attachment:training1_rgb_69.jpg|{{attachment:training1_rgb_69.jpg|rgb_69|width=200}}]]
[[attachment:training1_rgb_71.jpg|{{attachment:training1_rgb_71.jpg|rgb_71|width=200}}]]
[[attachment:training1_rgb_73.jpg|{{attachment:training1_rgb_73.jpg|rgb_73|width=200}}]]
[[attachment:training1_rgb_75.jpg|{{attachment:training1_rgb_75.jpg|rgb_75|width=200}}]]
==== Training2 ====
[[attachment:training2_rgb_93.jpg|{{attachment:training2_rgb_93.jpg|rgb_93|width=200}}]]
[[attachment:training2_rgb_95.jpg|{{attachment:training2_rgb_95.jpg|rgb_95|width=200}}]]
[[attachment:training2_rgb_97.jpg|{{attachment:training2_rgb_97.jpg|rgb_97|width=200}}]]
[[attachment:training2_rgb_99.jpg|{{attachment:training2_rgb_99.jpg|rgb_99|width=200}}]]
==== Training3 ====
[[attachment:training3_rgb_60.jpg|{{attachment:training3_rgb_60.jpg|rgb_60|width=200}}]]
[[attachment:training3_rgb_62.jpg|{{attachment:training3_rgb_62.jpg|rgb_62|width=200}}]]
[[attachment:training3_rgb_64.jpg|{{attachment:training3_rgb_64.jpg|rgb_64|width=200}}]]
[[attachment:training3_rgb_66.jpg|{{attachment:training3_rgb_66.jpg|rgb_66|width=200}}]]

== Repositorio con los scripts para replicar los experimentos ==

hg clone https://proyectos.ciii.frc.utn.edu.ar/hg/robot_vision_2012

== Estructura de directorios ==

 RobotVision2012/DS_..._DSIFT_.../
 
                                  trainingX/ <<BR>>

                                  trainingX.log <<BR>>

                                  trainingX_lr/ <<BR>>

                                  trainingX_lr.log <<BR>>

                                  _PCA_/ <<BR>>

                                          subspace.dat <<BR>>

                                          subspace.log <<BR>>

                                          80D/ <<BR>>

                                              trainingX/ <<BR>>

                                              trainingX.log <<BR>>

                                              trainingX_lr/ <<BR>>

                                              trainingX_lr.log <<BR>>

                                              _GMM_/ <<BR>>

                                                    u64.gmm <<BR>>                                              

                                                    u64/ <<BR>>

                                                       IFV.../ <<BR>>

                                                              trainingX/ <<BR>>

                                                              trainingX.log <<BR>>

                                                              trainingX_lr/ <<BR>>

                                                              trainingX_lr.log <<BR>>

                                                              _SGD_tr12_te3_/ <<BR>>

                                                                             hinge_20_1e-4/ <<BR>>

                                                                                           Corridor.lin <<BR>>

                                                                             hinge_20_1e-4.training3 <<BR>>

                                                                             hinge_20_1e-4.log <<BR>>

== 25 abril 2012 ==
=== Experimento 1 ===
==== Configuración ====

 * Descriptores: SIFT sobre grilla regular (DSIFT de vlfeat), patchs 32x32, paso=8, L2-norm., D=128, 5 escalas, factor=0.707

 * PCA: subespacio aprendido sobre training1+training2+training3, D=80

 * GMM: aprendido sobre training1+training2+training3, para ''N = 8, 16 y 32''

 * IFV: gradientes resp. medias y varianzas, alpha=0.5, pnorm=2.0

 * SGD: hinge loss, ''20, 50 y 100'' iteraciones, ''lambda = 1e-2, 1e-3 y 1e-4'', training sobre ''training1'' y testeando sobre ''training2''. La clasificación se realizo con argmax.

==== Resultados ====
|| ||||||20 iteraciones||||||||50 iteraciones||||||||100 iteraciones||
||lambda\ngauss||8||16||32||||8||16||32||||8||16||32||
||1e-3|| 1382 || 1334 || 1414 |||| 1376 || 1352 || 1426 |||| 1382 || 1356 || 1422 ||
||1e-4|| '''1462''' || '''1422''' || '''1466''' |||| 1462 || 1400 || 1478 |||| 1462 || 1396 || 1476 ||
||1e-5|| 1318 || 1402 || 1444 |||| 1358 || 1368 || 1394 |||| 1378 || 1384 || 1322 ||
/* ||1e-2|| 872 || 984 || 928 |||| 886 || 990 || 930 |||| 890 || 992 || 940 || */

[[attachment:experimento_1_25_abril_2012.txt]]

== 26 abril 2012 ==
=== Experimento 1 ===
==== Configuración ====

 * Igual que el experimento anterior, pero se agrego 64 gaussianas.

 * SGD: hinge loss, ''20'' iteraciones, ''lambda = 1e-4'', training sobre ''training1'' o ''training2''  y testeando siempre sobre ''training3''. La clasificación se realizo con argmax y con thr=-0.1.

==== Resultados ====
|| ||||||||20 iteraciones, argmax, train1 ||||||||||20 iteraciones, thr=-0.1, train1||||||||||20 iteraciones, argmax, train2||||||||||20 iteraciones, thr=-0.1, train2||
||l\ng||8||16||32||64||||8||16||32||64||||8||16||32||64||||8||16||32||64||
||1e-4|| -405 || -153 || -127 || -161 |||| 194 || 362 || 355 || 399 |||| -361 || -87 || 1 || 35 |||| 226 || 421 || 471 || 553 ||

[[attachment:experimento_1_train1_val3_argmax_26_abril_2012.txt]]
[[attachment:experimento_1_train1_val3_-0.1_26_abril_2012.txt]]
[[attachment:experimento_1_train2_val3_argmax_26_abril_2012.txt]]
[[attachment:experimento_1_train2_val3_-0.1_26_abril_2012.txt]]

== 3 mayo 2012 ==
=== Experimento 1 ===
Se realiza una prueba con distintos valores de DSIFT_STEP (8 y 16) y aumento el conjunto de entrenamiento haciendo un flip left-right de las imágenes antes de calcular DSIFT. Flip=0, indica sin aumentar el conjunto; Flip=1 indica aumentando el conjunto de entrenamiento con las imágenes flipeadas.
Al final de este experimento se muestra la configuración que resulta más apropiada.
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones

 * Using ''argmax'' for classification

==== Resultados ====

===== Flip=0 =====

 * DSIFT step=8

||||          |||||||||||||||| NGAUSS ||
|| Tr. || Te. || 8    || 16   || 32   || 64   || 128  || 256  || 512  || 1024 ||
|| 1,2 || 3   || -289 || 29   || 59   || 79   || 185  || 267  || 319  || 445  ||
|| 2,3 || 1   || 935  || 1195 || 1141 || 1173 || 1183 || 1251 || 1225 || 1293 ||
|| 3,1 || 2   || 1162 || 1374 || 1390 || 1456 || 1584 || 1658 || 1668 || 1632 ||
|||| Avg.     || 603  || 866  || 863  || 903  || 984  || 1059 || 1071 || 1123 ||

 * DSIFT step=16

|||| |||||||||||||||| NGAUSS ||
|| Tr. || Te. || 8    || 16   || 32   || 64   || 128  || 256  || 512  || 1024 ||
|| 1,2 || 3   || -161 || -9   || 19   || 25   || 225  || 191  || 299  || 371  ||
|| 2,3 || 1   || 897  || 1129 || 1221 || 1143 || 1101 || 1095 || 1175 || 1179 ||
|| 3,1 || 2   || 1160 || 1252 || 1392 || 1424 || 1412 || 1528 || 1552 || 1524 ||
|||| Avg.     || 632  || 791  || 877  || 864  || 913  || 938  || 1009 || 1025 ||

===== Flip=1 =====

 * DSIFT step=8

|||| |||||||||||||||| NGAUSS ||
|| Tr. || Te. || 8    || 16   || 32   || 64   || 128  || '''256'''  || 512  || 1024 ||
|| 1,2 || 3   || -357 || -105 || 45   || 59   || 185  || '''199'''  || 233  || 411  ||
|| 2,3 || 1   || 1569 || 1703 || 1787 || 1795 || 1887 || '''1949''' || 1995 || 1999 ||
|| 3,1 || 2   || 1666 || 1880 || 2018 || 2076 || 2142 || '''2182''' || 2182 || 2190 ||
|||| Avg.     || 959  || 1159 || 1283 || 1310 || 1405 || '''1443''' || 1470 || 1533 ||

 * DSIFT step=16

|||| |||||||||||||||| NGAUSS ||
|| Tr. || Te. || 8    || 16   || 32   || 64   || 128  || 256  || 512  || 1024 ||
|| 1,2 || 3   || -211 || 11   || 31   || -15  || 233  || 149  || 263  || 373  ||
|| 2,3 || 1   || 1447 || 1651 || 1693 || 1791 || 1857 || 1901 || 1945 || 1909 ||
|| 3,1 || 2   || 1642 || 1744 || 1944 || 2032 || 2126 || 2128 || 2150 || 2140 ||
|||| Avg. || 959  || 1135 || 1223 || 1269 || 1405 || 1393 || 1453 || 1474 ||

[[attachment:results_3_de_mayo_2012.tar.gz]]

 * Configuración: 256 Gaussianas, DSIFT step=8, flip=1

== 4 mayo 2012 ==
=== Experimento 1 ===
Se prueba oscureciendo las imágenes de entrenamiento del clasificador. El oscurecimiento se realiza multiplicando las intensidades de los pixeles  de las imágenes por un factor menor a 1. Se probo con factores de 0.33 y 0.5. En este experimento no se actualizó el modelo .gmm con los nuevos descriptores con flip y oscurecidos.
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones, 256 Gaussianas, DSIFT step=8, flip=1

 * Using ''argmax'' for classification

==== Resultados ====

|||| NGAUSS=256 |||||| srange         ||
|| Tr. || Te. || 1.0  || 0.33 || 0.5  ||
|| 1,2 || 3   || 199  || 229  || 221  ||
|| 2,3 || 1   || 1949 || 1949 || 1945 ||
|| 3,1 || 2   || 2182 || 2180 || 2180 ||
|||| Avg.     || 1443 || 1452 || 1449 ||

== 5 mayo 2012 ==
=== Experimento 1 ===
Se prueba oscureciendo las imágenes de entrenamiento del clasificador. El oscurecimiento se realiza multiplicando las intensidades de los pixeles  de las imágenes por un factor menor a 1. Se probo con factores de 0.33 y 0.5. En este experimento si se actualizó el modelo .gmm con los nuevos descriptores generados con flip y con oscurecimiento.
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones, 256 Gaussianas, DSIFT step=8, flip=1

 * Using ''argmax'' for classification

==== Resultados ====

|||| NGAUSS=256 |||||| srange         ||
|| Tr. || Te. || 1.0  || 0.1  || 0.33 || 0.5  ||
|| 1,2 || 3   || 199  || 187  || 195  || 171  ||
|| 2,3 || 1   || 1949 || 1975 || 1945 || 1965 ||
|| 3,1 || 2   || 2182 || 2154 || 2166 || 2180 ||
|||| Avg.     || 1443 || 1439 || 1435 || 1439 ||

== 7 mayo 2012 ==
=== Experimento 1 ===
Se prueba utilizando feature augmentation. En este experimento si se actualizó el modelo .gmm con los descriptores generados con flip de las imágenes.
Con aug=1 o aug=0 se indica el uso o no de feature augmentation respectivamente.
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones, 64 Gaussianas, DSIFT step=8, flip=[0,1]

 * Using ''argmax'' for classification

==== Resultados ====

|||| NGAUSS=64 |||| flip=0      |||| flip=1      ||
|| Tr. || Te.  || aug=0|| aug=1 || aug=0|| aug=1 ||
|| 1,2 || 3    || 77   || 87    || 257  || 33    ||
|| 2,3 || 1    || 1173 || 1207  || 1801 || 1783  ||
|| 3,1 || 2    || 1440 || 1528  || 2080 || 2014  ||
|||| Avg.      ||  897 || 941   || 1379 || 1277  ||

 * Comparación usando en ambos casos imágenes de entrenamiento originales y flipeadas, pero en el primer caso entrenando el modelo .gmm solo en las imágenes originales (gmm_flip=0) y en el segundo caso utilizando las imágenes originales y las flipeadas (gmm_flip=1). No se usó feature augmentation.

|||| NGAUSS=64 |||| flip=1      ||
|| Tr. || Te.  || gmm_flip=0 || gmm_flip=1 ||
|| 1,2 || 3    || 59         || 257  ||
|| 2,3 || 1    || 1795       || 1801 ||
|| 3,1 || 2    || 2076       || 2080 ||
|||| Avg.      || 1310       || 1379 ||

== 8 mayo 2012 ==
=== Experimento 1 ===
Se prueba utilizando feature augmentation. En este experimento si se actualizó el modelo .gmm con los descriptores generados con flip de las imágenes.
Con aug=1 o aug=0 se indica el uso o no de feature augmentation respectivamente.
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones, 128 Gaussianas, DSIFT step=8, flip=[0,1]

 * Using ''argmax'' for classification

==== Resultados ====

|||| NGAUSS=128 |||| flip=0       |||| flip=1      ||
|| Tr. || Te.   || aug=0 || aug=1 || aug=0|| aug=1 ||
|| 1,2 || 3     || 191   || 115   || 195  || 39    ||
|| 2,3 || 1     || 1189  || 1255  || 1887 || 1905  ||
|| 3,1 || 2     || 1582  || 1618  || 2132 || 2098  ||
|||| Avg.       || 987   || 996   || 1405 || 1347  ||

== 9 mayo 2012 ==
=== Experimento 1 ===
Se prueba utilizando pirámides espaciales. Las configuraciones usadas son "sp1x1,lsf=0,gsf=0" (spyr=0), "sp1x1,sp1x3,lsf=0,gsf=0" (spyr=1) y  "sp1x1,sp1x3,lsf=0.33,gsf=0.33" (spyr=2).
==== Configuración ====

 * SGD LBD=1e-4, 20 iteraciones, 64 Gaussianas, DSIFT step=8, flip=[0,1]

 * Using ''argmax'' for classification

==== Resultados ====

|||| NGAUSS=64 |||||| flip=0                  |||||| flip=1                ||
|| Tr. || Te.   || spyr=0 || spyr=1 || spyr=2 || spyr=0 || spyr=1 || spyr=2||
|| 1,2 || 3     || 77     || -413   || -41    || 257    || -458   || 201   ||
|| 2,3 || 1     || 1173   || 1123   || 1029   || 1801   || 1773   || 1791  ||
|| 3,1 || 2     || 1440   || 1412   || 1358   || 2080   || 2078   || 2084  ||
|||| Avg.       || 897    || 707    || 782    || 1379   || 1122   || 1359  ||

== 11 mayo 2012 ==
=== Experimento 1 ===
Se prueba utilizando opponent SIFT. El software utilizado para calcular los descriptores es [[http://koen.me/research/colordescriptors|colorDescriptor]]
==== Configuración ====
 * Descriptor: OPP_SIFT, step=16, sampling_scale=1.6

 * SGD LBD=1e-4; 20 iteraciones; 16, 32 y 64 Gaussianas; flip=0

 * Using ''argmax'' for classification

==== Resultados ====

|||| OPPSIFT    |||||| flip=0           ||
|| Tr. || Te.   || 16   || 32   || 64   ||
|| 1,2 || 3     || -231 || -173 || -17  ||
|| 2,3 || 1     || 1161 || 1217 || 1221 ||
|| 3,1 || 2     || 1538 || 1598 || 1664 ||
|||| Avg.       || 823  || 881  || 956  ||

Buscar

Herramientas

Robot Vision 2012

Tareas

Cosas que vamos a tener que probar

Datasets

Imágenes de ejemplo

Training1

Training2

Training3

Repositorio con los scripts para replicar los experimentos

Estructura de directorios

25 abril 2012

Experimento 1

Configuración

Resultados

26 abril 2012

Experimento 1

Configuración

Resultados

3 mayo 2012

Experimento 1

Configuración

Resultados

Flip=0

Flip=1

4 mayo 2012

Experimento 1

Configuración

Resultados

5 mayo 2012

Experimento 1

Configuración

Resultados

7 mayo 2012

Experimento 1

Configuración

Resultados

8 mayo 2012

Experimento 1

Configuración

Resultados

9 mayo 2012

Experimento 1

Configuración

Resultados

11 mayo 2012

Experimento 1

Configuración

Resultados