levanto este hilo para comentar que probe el ejemplo inicial, el que creo el hilo, con bennugd2...
y en mi maquina un Intel(R) Core(TM) i7-3630QM CPU @ 2.40GHz (corriendo con turbo a ~3.4 GHz) el programa me da:
con bennugd1: ~525 fps
con bennugd2 (opengl): ~135 fps
lo raro es que otras pruebas, por ejemplo, mi SabreWulf (no se si recuerdan ese demo que puse hace tiempo con un scroll gigante y un muñequito moviendose):
en bennugd1 me da unos ~570fps
en bennugd2 me da unos ~1300fps
ahora tambien note que si el grafico del fondo del scroll lo cargo con un set_mode previo a la carga seteado a 32bits, la performance se va a la mierda, y bennugd1 se va a ~260fps... asi que un set_mode a 16bits en bennugd1 mejora la performance con los load_png (o cargar fpg de 16bits)... se ve que el render de graficos de 16bits sobre 32bits es mas performante que 32 sobre 32 (por la cantidad de operaciones que se hacen en 32bits)... al menos en el scroll que es lo que tiene que dibujar toda la pantalla....
quizas se me esta escapando algo, estos son comentarios rapidos sobre la primer prueba...
lo que apunto con todo esto, es que el problema de performance es sin dudas por la cantidad de texturas que se estan renderizando con opengl con estas placas intel... o tambien puede que estemos haciendo alguna operacion que consume mucho muy repetitiva y que se pueda mejorar...