20130724

PSPP vs SPSS, y más allá

(Las actualizaciones al fondo)

Aunque comprensiblemente el número de quienes se dedican a regalar su tiempo al software libre y/o gratuito crece mucho más lentamente que el de especuladores (emprendedores) de toda condición y sector (moral incluido), hay una legión que aguanta, impertérrita a los tiempos, o precisamente por ser éstos los tiempos. Libre Office avanza, aunque mucho más lentamente en aspectos formales (porque los del diseño son más reticentes a lo de regalar la propia obra), y siguen apareciendo numerosas aplicaciones tanto en sistemas operativos abiertos (sobre todo en Android) como en Windows.




A veces, el reencuentro con alguna de estas aplicaciones es incluso impactante. Es lo que me ha ocurrido con PSPP, el entonces pequeño programa de estadística que nació como alternativa gratuita (luego se convirtió en software libre) al imperialista SPSS, hoy en manos de la china IBM (ya saben: ese programa de estadística originariamente diseñado no por físicos o matemáticos, como éstos creen, sino por sociólogos, aunque paradójicamente pocos sociólogos saben manejar a fondo, y incluso somos minoría los que simplemente nos defendemos). Lo conocí hace más de una década, e incluso intenté que gentes de mi grupo de investigación más vinculadas a la Estadística se incorporasen al proyecto, para intentar implantarlo en nuestra Universidad, pues las licencias de los "grandes" programas de estadística (de los que el 90% de los usuarios sólo utiliza lo más básico: distribuciones de frecuencias, algunas correlaciones y regresiones, y a lo sumo algún factorial o clusters, lo cual puede hacerse con decenas de programas gratuitos, o casi) tienen un coste muy elevado (escandalosamente elevado).

Como entretanto llegó una alternativa española, surgida también desde la ciencias sociales, y que además cubría (entonces) mejor todo el proceso completo desde el diseño a la explotación de una encuesta, optamos en la mayor parte nuestras investigaciones por Dyane de Miguel Santesmases. Además de ser producto nacional, era mucho más barato. Por supuesto que hay programas gratuitos extraordinarios, como los ofrecidos por la oficina del Censo de los Estados Unidos (especialmente CSPro, que siguen manteniendo actualizado, aunque es complejo para un uso habitual que no sea de tipo censal), o Epidat, muy utilizado por los epidemiólogos y en general en Salud (el Servicio Gallego de Salud lo tiene muy bien atendido en los últimos años). Tanto CsPro como Epidat permiten además construir GIS con los datos brutos o explotados, lo que supone un valor añadido cuando el análisis territorial/espacial es importante. No olvido otros programas de estadística muy potentes, pero como están basados en Linux, y van dirigidos a la ingeniería y las ciencias duras, su funcionamiento en Windows, y en Ciencias Sociales, deja mucho que desear (R- es sin duda el más desarrollado, y muy logrado en algunos aspectos, pero sigue siendo un poco friki para usuarios medios de Windows). Además, directamente con LibreOffice/OpenOffice se puede hacer mucho, casi todo lo fundamental en realidad. Y acaballo de dos mundos, con software libre sobre software propietario, también, con el Daniel`s XL Toolbox, añadido para Excel que imita unos añadidos que se llevaban mucho con las primeras versiones de la hoja de Microsoft.

El caso es que me había olvidado del PSPP, pero hace unos meses en una de mis navegaciones dí de cabeza en su web, y descargué e instalé la última versión. Luego no me dió tiempo ni a abrirla. Pero héte ahí que me llegan el otro día unos ficheros para manejar con SPSS; no lo tenía instalado en el ordenador de casa y me daba pereza ponerme a ello, así que pruebo a abrirlos con PSPP... y ¡zas, en toda la boca!. Transparencia total, compatibilidad total... y casi todo lo que se necesita con unas herramientas en algunos casos incluso mucho más claras y fáciles de seguir que en SPSS, y en buen español. Ya puede presumir de lo que es: no es un clon de SPSS; es una poderosa alternativa gratuita (osea, altruista), que debería ser software oficial de estadística en todas las Facultad de Sociología, Economía y Ciencias Sociales en general.

Postdata: resulta que el comentario viene al pelo, pues acabo de enterarme que estamos en el año de la Estadística. Pues bueno...

Addenda: Una mención especial al esfuerzo que Isacar Marin, no sé si estudiante, profesor o PAS de la Universidad de Valencia, está haciendo para construir un manual del PSPP. Aunque sigue la versión de Linux, es muy fácilmente adaptable a la de Windows. Los fragmentos del manual los va dejando en su blog. Y también tienen gran interés los videotutoriales preparados por Ignacio Cardone.  Si se busca, se pueden encontrar en youtube unos cuantos tutoriales más sobre el uso básico.





Addenda2: Uno de los serios problemas por resolver en PSPP es el del formato de salida de los resultados, muy complicados para llevar a excel y hacer tablas o gráficos (la mejor forma que he encontrado es un poco pesada, pero no tanto como parece, y funciona: exportar la ventana de resultados a html; abrir la página web resultante desde el Word de LibreOffice; entonces ya construye unas tablas en condiciones, y desde ahí se pueden llevar a Excel, o Libre Calc, claro). Para eso hay otra alternativa, otro programa de estadística no tan robusto, pero más flexible en algunas cuestiones (como gráficos, presentación de resultados, etc): Sofastatistics. Aunque está en Java, y eso lo hace muy lento de inicio (da la sensación de que está diseñado para ser ejecutado on line), está bastante bien (no así su nombre, ni su logo).

Addenda 3: ¿Y la otra parte del proceso, el diseño y realización de encuestas, con software libre o gratuito?. Pues también, también es posible, cada vez con menos complicaciones. El sistema on line ideal (que permite rellenar cuestionarios con encuestador en cualquier sitio... si tienen acceso a Internet) es Lime Survey, que se puede instalar en cualquier servidor propio, pero que también permite si no se quieren complicaciones, por poco más de 50 euros (sin más gastos, sin cuentas mensuales ni nada raro), poner en servidores externos una encuesta de tamaño estándar (unos 800/1000 cuestionarios). Por supuesto, no hay que olvidar con que la herramienta Cuestionarios de Google, todo eso es casi innecesario.

Addenda 4: Imperdonable que no hubiese encontrado antes este otro intento, promovido además por un hispano, Salstat. Incluye unos buenos gráficos, un interface brillante (que recuerda a los programas de estadística y censos del gobierno americano de la UNESCO), y sobre todo una conexión directa con Excel (¿por qué no con Libreoffice?) que lo hace más amigable. Una única limitación a resolver urgentemente: no importa directamente los .sav de SPSS.

Addenda 5: El trabajo de Daniel Kraus, que sigue mejorando su utilidad para Excel, ha espabilado a algunos creadores de software estadístico de pago, generando versiones Lite gratuitas que pueden servir para lo más básico. Un buen ejemplo es el de Estatistician.

Algo es evidente, a la vista de todo lo anterior: SPSS sobra. Al menos el dinero que nuestras universidades despilfarran en sus licencias.

Addenda 6 (apaños para hacer estadísticas desde Android): No terminan de animarse a adaptar PSPP a Android, y no aparecen soluciones realmente interesantes. Uno puede hacer virguerías, pues hay apks que directamente instalan un Windows 95, o un Linux, en un tablet o teléfono android, y desde ahí se podría instalar el PSPP. Pero es lioso, y no está claro que compense (yo no los he probado). Entre tanto una buena alternativa, siempre que estemos conectados, es https://www.numberanalytics.com/. Es de pago, pero la cuenta gratuita sirve para salvarnos en una urgencia. Maneja ficheros csv y genera estadísticas básicas, regresiones y algunos tests. Naturalmente, también podemos utilizar las hojas de cálculo de cualquiera de los excelentes office's gratuitos (incluido el de Microsoft, que hay que reconocer que se ha portado) como WPS o Softmaker, y obviamente el de Google

Addenda 7 (16/12/2015): ¿PSPP sobrepasa a SPSS? No, pero dále tiempo...
PSPP ya va por la versión 9, y no cesa en su a veces imperceptible, pero permanente mejora. Con esta versión han resuelto algunos problemas de adaptación gráfica a las nuevas altísimas resoluciones que hasta ahora había que resolver con trucos en el arranque del programa. Por supuesto que SPSS ha avanzado también en aspectos gráficos, y sigue añadiendo sofisticadas funciones, que sólo algunos especialistas necesitan. Pero el PSPP es generosamente gratuito (porque gratis no significa que caiga del cielo, sino que una pandilla de gentes generosas regalan su tiempo a los demás). Y sobre todo hace incluso más cosas. Sin ir más lejos, y como muestra: mientras SPSS tiene una limitación de 500 variables cuando se quiere hacer una distribución de frecuencias, PSPP puede con ellas (casi 700 en el caso ocurrido). Se apura, parece que se cuelgue... pero ahí llega. A ver si consiguen resolver la posibilidad de editar en los resultados, sin tener que llevarlos a *.odt.


Addenda 8 (4/10/2017): Se amplían las opciones. Nuevos programas que mejoran el manejo de ficheros


PSPP sigue mejorando, aunque sigue sin resolver aspectos claves. Tendremos que esperar pacientemente, que bastante es la cantidad de tiempo que sus programadores nos regalan.

Entretanto se pueden ir probando nuevas opciones que han aparecido. Algunas basadas en el más sofisticado R (que no está al alcance de quien no tenga una preparación "fuerte" en Estadística e informática), de las que hay que destacar JASP. Este, agradable de aspecto (eso que llaman amigable), tiene dos virtudes importantes:

  • además de abrir ficheros SPSS (.sav), permite exportarlos luego a .csv (algo que no puede hacer PSPP). Por ejemplo si se quiere trabajar con el también amigable SOFAStat...
  • permite copy/pegar las tablas de resultados directamente a un documento de texto o una presentación, ese handicap que aún tiene PSPP. Y no quedan nada mal, pues resultan editables como tablas
En JASP son ambiciosos. Tienen una sección dedicada a la enseñanza del programa, pues ya unasd cuantas universidades lo han adoptado en sus clases. 



Otro recién llegado, JAMOVI, parece una variación, casi un clon (pues todos estos vienen del código abierto R) de JASP, pero menos completo: no lee ficheros .sav (aunque importa muy bien los .csv conmvertidos por JASP), y (algo importante en ordenadores antiguos o portátiles ligeros) no hay versión de 32 bytes. 

A cambio, tiene la opción de añadirle módulos para algunas tareas, como en R, de la librería del propio grupo de programadores.




Hay que tener en cuenta que estas opciones derivadas de R son bastante pesadas: 300 Mb JASP y 200 Mb JAMOVI, muy alejadas de los 40 MB de PSPP o los 60 de SOFAStat. Hay que tener espacio. Ah, y ninguno de los dos está traducido al castellano (todavía; supongo que les vendrán bien voluntarios)

Una referencia apenas, pues no he tenido tiempo me meterme a explorarlo en profundidad, a la base de datos ORANGE, una potentísima herramienta recién descubierta (también de software abierto) que va mucho allá de lo que podemos hacer con un programa estadístico. 

Con Orange creo que volveré a utilizar las bases de datos, que desde DBASE III+ prácticamente no había utilizado. Ya veremos, ya contaré..., porque debe de ser pesado. Por lo pronto, casi 400 Mb y casi media hora para instalarse (la versión de 32 Bytes pesa menos).




 

Addenda 9

Imperdonable no haber hecho aún referencia a Microsiris, un antiguo software devenido a Freeware. Aunque se parece más al SPSS de hace veinte años, cumple sus propósitos, y gratis. Y sobretodo no pesa nada, es decir nada (4 Mb).


7 comentarios:

  1. Muchas gracias por el artículo. Yo estoy tratando de manejarme con el programa. Sé que puedo abrir los archivos de SPSS en PSPP pero ¿a la inversa también funciona?
    un saludo

    ResponderEliminar
  2. El formato es el de SPSS, por lo que funciona exactamente igual

    ResponderEliminar
  3. Permite exportar a csv?

    ResponderEliminar
  4. Hola solo le veo un pero, en pruebas no paramétricas faltan grupos no relacionados y falta la regresión lineal ordinal. Saludos.

    ResponderEliminar
  5. Nada es gratis, quien me asegura que un calculo complejo sea el correcto en algo gratuito????, por lo menos en un software pagado existe una emplesa responsable de eso....! como para pensar

    ResponderEliminar
    Respuestas
    1. El cálculo depende de rutinas básicas que en realidad comparten casi todos programas. Y hay muchas cosas gratis, mucha gente que simplemente comparte lo que sabe de forma altruista. Sé que eso pone nerviosas a algunas personas, pero es así.

      Eliminar

Los comentarios están moderados para evitar spam, pero estaré encantado de incluir cualquier comentario que quieras hacer

Artículos relacionados

Related Posts Plugin for WordPress, Blogger...