Aunque comprensiblemente el número de quienes se dedican a regalar su tiempo al software libre y/o gratuito crece mucho más lentamente que el de especuladores (emprendedores) de toda condición y sector (moral incluido), hay una legión que aguanta, impertérrita a los tiempos, o precisamente por ser éstos los tiempos. Libre Office avanza, aunque mucho más lentamente en aspectos formales (porque los del diseño son más reticentes a lo de regalar la propia obra), y siguen apareciendo numerosas aplicaciones tanto en sistemas operativos abiertos (sobre todo en Android) como en Windows.
A veces, el reencuentro con alguna de estas aplicaciones es incluso impactante. Es lo que me ha ocurrido con PSPP, el entonces pequeño programa de estadística que nació como alternativa gratuita (luego se convirtió en software libre) al imperialista SPSS, hoy en manos de la china IBM (ya saben: ese programa de estadística originariamente diseñado no por físicos o matemáticos, como éstos creen, sino por sociólogos, aunque paradójicamente pocos sociólogos saben manejar a fondo, y incluso somos minoría los que simplemente nos defendemos). Lo conocí hace más de una década, e incluso intenté que gentes de mi grupo de investigación más vinculadas a la Estadística se incorporasen al proyecto, para intentar implantarlo en nuestra Universidad, pues las licencias de los "grandes" programas de estadística (de los que el 90% de los usuarios sólo utiliza lo más básico: distribuciones de frecuencias, algunas correlaciones y regresiones, y a lo sumo algún factorial o clusters, lo cual puede hacerse con decenas de programas gratuitos, o casi) tienen un coste muy elevado (escandalosamente elevado).
Como entretanto llegó una alternativa española, surgida también desde la ciencias sociales, y que además cubría (entonces) mejor todo el proceso completo desde el diseño a la explotación de una encuesta, optamos en la mayor parte nuestras investigaciones por Dyane de Miguel Santesmases. Además de ser producto nacional, era mucho más barato. Por supuesto que hay programas gratuitos extraordinarios, como los ofrecidos por la oficina del Censo de los Estados Unidos (especialmente CSPro, que siguen manteniendo actualizado, aunque es complejo para un uso habitual que no sea de tipo censal), o Epidat, muy utilizado por los epidemiólogos y en general en Salud (el Servicio Gallego de Salud lo tiene muy bien atendido en los últimos años). Tanto CsPro como Epidat permiten además construir GIS con los datos brutos o explotados, lo que supone un valor añadido cuando el análisis territorial/espacial es importante. No olvido otros programas de estadística muy potentes, pero como están basados en Linux, y van dirigidos a la ingeniería y las ciencias duras, su funcionamiento en Windows, y en Ciencias Sociales, deja mucho que desear (R- es sin duda el más desarrollado, y muy logrado en algunos aspectos, pero sigue siendo un poco friki para usuarios medios de Windows). Además, directamente con LibreOffice/OpenOffice se puede hacer mucho, casi todo lo fundamental en realidad. Y acaballo de dos mundos, con software libre sobre software propietario, también, con el Daniel`s XL Toolbox, añadido para Excel que imita unos añadidos que se llevaban mucho con las primeras versiones de la hoja de Microsoft.
El caso es que me había olvidado del PSPP, pero hace unos meses en una de mis navegaciones dí de cabeza en su web, y descargué e instalé la última versión. Luego no me dió tiempo ni a abrirla. Pero héte ahí que me llegan el otro día unos ficheros para manejar con SPSS; no lo tenía instalado en el ordenador de casa y me daba pereza ponerme a ello, así que pruebo a abrirlos con PSPP... y ¡zas, en toda la boca!. Transparencia total, compatibilidad total... y casi todo lo que se necesita con unas herramientas en algunos casos incluso mucho más claras y fáciles de seguir que en SPSS, y en buen español. Ya puede presumir de lo que es: no es un clon de SPSS; es una poderosa alternativa gratuita (osea, altruista), que debería ser software oficial de estadística en todas las Facultad de Sociología, Economía y Ciencias Sociales en general.
Postdata: resulta que el comentario viene al pelo, pues acabo de enterarme que estamos en el año de la Estadística. Pues bueno...
Addenda: Una mención especial al esfuerzo que Isacar Marin, no sé si estudiante, profesor o PAS de la Universidad de Valencia, está haciendo para construir un manual del PSPP. Aunque sigue la versión de Linux, es muy fácilmente adaptable a la de Windows. Los fragmentos del manual los va dejando en su blog. Y también tienen gran interés los videotutoriales preparados por Ignacio Cardone. Si se busca, se pueden encontrar en youtube unos cuantos tutoriales más sobre el uso básico.
Addenda2: Uno de los serios problemas por resolver en PSPP es el del formato de salida de los resultados, muy complicados para llevar a excel y hacer tablas o gráficos (la mejor forma que he encontrado es un poco pesada, pero no tanto como parece, y funciona: exportar la ventana de resultados a html; abrir la página web resultante desde el Word de LibreOffice; entonces ya construye unas tablas en condiciones, y desde ahí se pueden llevar a Excel, o Libre Calc, claro). Para eso hay otra alternativa, otro programa de estadística no tan robusto, pero más flexible en algunas cuestiones (como gráficos, presentación de resultados, etc): Sofastatistics. Aunque está en Java, y eso lo hace muy lento de inicio (da la sensación de que está diseñado para ser ejecutado on line), está bastante bien (no así su nombre, ni su logo).
Addenda 3: ¿Y la otra parte del proceso, el diseño y realización de encuestas, con software libre o gratuito?. Pues también, también es posible, cada vez con menos complicaciones. El sistema on line ideal (que permite rellenar cuestionarios con encuestador en cualquier sitio... si tienen acceso a Internet) es Lime Survey, que se puede instalar en cualquier servidor propio, pero que también permite si no se quieren complicaciones, por poco más de 50 euros (sin más gastos, sin cuentas mensuales ni nada raro), poner en servidores externos una encuesta de tamaño estándar (unos 800/1000 cuestionarios). Por supuesto, no hay que olvidar con que la herramienta Cuestionarios de Google, todo eso es casi innecesario.
Addenda 4: Imperdonable que no hubiese encontrado antes este otro intento, promovido además por un hispano, Salstat. Incluye unos buenos gráficos, un interface brillante (que recuerda a los programas de estadística y censos del gobierno americano de la UNESCO), y sobre todo una conexión directa con Excel (¿por qué no con Libreoffice?) que lo hace más amigable. Una única limitación a resolver urgentemente: no importa directamente los .sav de SPSS.
Addenda 5: El trabajo de Daniel Kraus, que sigue mejorando su utilidad para Excel, ha espabilado a algunos creadores de software estadístico de pago, generando versiones Lite gratuitas que pueden servir para lo más básico. Un buen ejemplo es el de Estatistician.
Algo es evidente, a la vista de todo lo anterior: SPSS sobra. Al menos el dinero que nuestras universidades despilfarran en sus licencias.
Addenda 6 (apaños para hacer estadísticas desde Android): No terminan de animarse a adaptar PSPP a Android, y no aparecen soluciones realmente interesantes. Uno puede hacer virguerías, pues hay apks que directamente instalan un Windows 95, o un Linux, en un tablet o teléfono android, y desde ahí se podría instalar el PSPP. Pero es lioso, y no está claro que compense (yo no los he probado). Entre tanto una buena alternativa, siempre que estemos conectados, es https://www.numberanalytics.com/. Es de pago, pero la cuenta gratuita sirve para salvarnos en una urgencia. Maneja ficheros csv y genera estadísticas básicas, regresiones y algunos tests. Naturalmente, también podemos utilizar las hojas de cálculo de cualquiera de los excelentes office's gratuitos (incluido el de Microsoft, que hay que reconocer que se ha portado) como WPS o Softmaker, y obviamente el de Google
Addenda 7 (16/12/2015): ¿PSPP sobrepasa a SPSS? No, pero dále tiempo...
Addenda 8 (4/10/2017): Se amplían las opciones. Nuevos programas que mejoran el manejo de ficheros
PSPP sigue mejorando, aunque sigue sin resolver aspectos claves. Tendremos que esperar pacientemente, que bastante es la cantidad de tiempo que sus programadores nos regalan.
Entretanto se pueden ir probando nuevas opciones que han aparecido. Algunas basadas en el más sofisticado R (que no está al alcance de quien no tenga una preparación "fuerte" en Estadística e informática), de las que hay que destacar JASP. Este, agradable de aspecto (eso que llaman amigable), tiene dos virtudes importantes:
- además de abrir ficheros SPSS (.sav), permite exportarlos luego a .csv (algo que no puede hacer PSPP). Por ejemplo si se quiere trabajar con el también amigable SOFAStat...
- permite copy/pegar las tablas de resultados directamente a un documento de texto o una presentación, ese handicap que aún tiene PSPP. Y no quedan nada mal, pues resultan editables como tablas
Otro recién llegado, JAMOVI, parece una variación, casi un clon (pues todos estos vienen del código abierto R)
A cambio, tiene la opción de añadirle módulos para algunas tareas, como en R, de la librería del propio grupo de programadores.
Hay que tener en cuenta que estas opciones derivadas de R son bastante pesadas: 300 Mb JASP y 200 Mb JAMOVI, muy alejadas de los 40 MB de PSPP o los 60 de SOFAStat. Hay que tener espacio. Ah, y ninguno de los dos está traducido al castellano (todavía; supongo que les vendrán bien voluntarios)
Una referencia apenas, pues no he tenido tiempo me meterme a explorarlo en profundidad, a la base de datos ORANGE, una potentísima herramienta recién descubierta (también de software abierto) que va mucho allá de lo que podemos hacer con un programa estadístico.
Con Orange creo que volveré a utilizar las bases de datos, que desde DBASE III+ prácticamente no había utilizado. Ya veremos, ya contaré..., porque debe de ser pesado. Por lo pronto, casi 400 Mb y casi media hora para instalarse (la versión de 32 Bytes pesa menos).
Addenda 9
Imperdonable no haber hecho aún referencia a Microsiris, un antiguo software devenido a Freeware. Aunque se parece más al SPSS de hace veinte años, cumple sus propósitos, y gratis. Y sobretodo no pesa nada, es decir nada (4 Mb).Addenda 10
Descubro otro programa que, aunque no orientado a las CCSS, también puede ser muy útil, sobre todo por el aparato de gráficos. Aquí he recogido la información
Addenda 11
Un nuevo add on para Excel, RegressIt, desarrollado por Robert Nau (Fuqua School of Business, Duke University) a partir de programas de John Butler (McCombs School of Business, University of Texas). Potente, muy potente, al menos de apariencia (no he tenido tiempo de probarlo, únicamente de hojear el fichero de ejemplo que incluye)
Addenda 12 (Septiembre 2019)
Por fin alguien se ha entretenido en probar cómo instalar PSPP como programa portable en un pendrive, para quien lo lleve montado como Portableapps. Aquí está el proceso
2. Within the software folder (say PSPP32), create an "App" directory, and within this create an "AppInfo" subdirectory..
3. Create a "appinfo.ini" file in the AppInfo subdirectory with the following code (make sure that you save it as an .ini file and not a .txt file).
Type=PortableApps.comFormat
Version=2.0
Name=PSPP32 Portable
AppId=PSPP32Portable
Publisher=Free Software Foundation Team
Homepage=PortableApps.com/PSPP32Portable
Category=Development
Description=PSPP32 is 32-bit public domain version of the SPSS statistical package
Shareable=true
OpenSource=true
Freeware=true
CommercialUse=true
PackageVersion=1.6.2.21
DisplayVersion=1.6.2 Dev Test 1
Icons=1
Start=bin\psppire.exe
6. Within the "Apps" menu, use the "Refresh App Icons" option to install PSPP into your PortableApps menu.
7. You can use the above code to also create an "appinfo.ini" file for the 64-bit version, if you do a search & replace for "32" with "64".
8. OPTIONAL: You can also use the IcoFX program to create an icon for PSPP and save it as "appicon.ico" in the AppInfo subdirectory.
Naturalmente, se pueden encontrar más referencias en estos lugares clásicos
http://gsociology.icaap.org/methods/soft.html
http://en.citizendium.org/wiki/Free_statistical_software
Addenda 13 (Febrero 2020)
Un nuevo descubrimiento. He rechazado acercarme a R, a pesar de ser consciente de sus posibilidades, porque me produce una sensación extraña, como de volver al MSDOS... Quien se dedique en exclusividad a la estadística o precise un uso continuado, sin duda se sentirá cómodo, como nos sentíamos con el SPSS hace un cuarto de siglo, y aún más atrás programando el DBASE. Pero en los últimos años han ido apareciendo lo que los expertos llaman GUI's, frentes gráficos (lo que Windows fue respecto del MSDOS), que evitan tener que manejar el progrma con comandos. En realidad JAMOVI y JASP, ya comentados y que siguen creciendo, sobre todo el primero, que va más adelantado, son dos GUI de R. Han ido apareciendo otros que van mucho más allá, aunque a cambio de ir haciéndose a su vez más complicados. Uno de los más conocidos es RStudio (que no es software libre, pero tiene una versión gratuita) pero también Rkward (que sí es software libre) aporta facilidad de uso a R. Por cierto, todos ellos abren (también JASP y JAMOVI, que uno no lo hacía inicialmente) los dichosos ficheros .sav de SPSS.
Pero sin duda el que se lleva la palma es BlueSky Statistics, que como Rstudio tiene una versión comercial y una versión gratuita que tiene casi las mismas funcionalidades a efectos prácticos.
Puede parecer un poco complicado a primera vista, y de hecho lo es, dado el enorme número de opciones que tiene, pero es un sustituto sin competencia de SPSS. De hecho va mucho más allá.
Pero cuidado: si te manejas con herramientas estadísticas básicas, el tiempo de aprendizaje que necesitarás quizás no te compense. En ese caso es mejor quedarte con PSPP, que además está ya traducido (los menús en inglés son algo que sigue provocando rechazo en los usuarios, incluso entre quienes supuestamente se manejan en inglés).
Así que ¡viva PSPP, todavía! Que por cierto, tiene una nueva versión (la 1.3, que aún está en prueba, pero funciona perfectamente, y corrige algunas cosas aunque apenas se noten). Ojo: recuerda que antes de instalar la nueva versión tienes que desinstalar la anterior.
Addenda 14 (junio 2020)
Radiant
Bluesky
Tiene nueva versión. Pero sigue dando problemas con el español. No ya porque no estén traducidos los menús (que no es tan importante, pero lo es para muchos usuarios), sino porque porque además tiene problemas para importar los caracteres latinos, y eso es más serio. Y tener que perder el tiempo en esas cuestiones a estas alturas, como que no....Addenda (10/8/2021)
ADDENDA 21/8/2021
Addenda 1/11/2021
Incautos de Linux
Addenda 13/12/21
EPIDAT
http://www.sergas.es/saude-publica/EPIDAT
Programa de libre distribución desarrollado por el Servicio de Epidemiología de la Dirección General de Salud Pública de utilidad para el análisis estadístico y epidemiológico de datos.
EPIINFO
Software estadístico de dominio público para la epidemiología desarrollado por el CDC (Centros para el Control y la Prevención de Enfermedades) que le permite a los usuarios revisar los datos de la encuesta para valores atípicos y datos inconsistentes, llevar a cabo un análisis descriptivo y generar de modo sencillo archivos con los resultados del análisis.
FIREFOX
https://www.mozilla.org/es-ES/firefox/new/
Es un navegador web libre y de código abierto.
GRETL
http://gretl.sourceforge.net/es.html
Software libre y de código abierto para el análisis econométrico que trata entre otras técnicas el modelo de regresión y el análisis de series temporales con una interfaz sencilla e intuitiva.
JAMOVI
Es un programa gratuito que permite la realización de cálculos estadísticos complejos de forma sencilla y eficiente.
(Manual)
JASP
JASP (Just Another Statistical Program) es una alternativa sencilla a SPSS o R.
LIBREOFFICE
Es un paquete de software de oficina libre y de código abierto que cuenta con un procesador de texto (Writer), un editor de hojas de cálculo (Calc), un gestor de presentaciones (Impress), un gestor de bases de datos (Base), un editor de gráficos vectoriales (Draw) y un editor de fórmulas matemáticas (Math).
LYX
Es un procesador de documentos de código abierto que permite la edición de texto usando LaTeX y fomenta para la escritura un enfoque basado en la estructura del documento, no en su aparencia.
(Manual)
OCTAVE
https://www.gnu.org/software/octave/
Es un programa para realizar cálculos numéricos considerado el equivalente libre de Matlab. Proporciona capacidades para la solución numérica de problemas lineales y no lineales y gráficos para la visualización y manipulación de datos.
OPENEPI
Es una calculadora web gratuíta, disponible para su uso en epidemiología, bioestadística, salud pública y medicina que proporciona una serie de herramientas epidemiológicas y estadísticas para los datos resumidos o agregados.
PSPP
https://www.gnu.org/software/pspp/
Es una aplicación de software libre para el análisis de datos que proporciona funcionalidades básicas como: frecuencias, tablas cruzadas, comparación de promedio, regresión lineal, fiabilidad, reordenamiento de datos y pruebas no paramétricas entre otras.
QGIS
Es un Sistema de Información Geográfica de código abierto que soporta numerosos formatos y funcionalidades de datos vector, datos ráster y bases de datos.
R
Lenguaje de programación que ofrece una amplia variedad de herramientas estadísticas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, etc) y gráficas manejado a través de una consola en la que se introduce el código propio de su lenguaje para obtener los resultados deseados.
R COMMANDER
Es una interfaz para el análisis estadístico que permite manejar R sin necesidad de conocer su código.
R STUDIO
Es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R. Incluye una consola, un editor de sintaxis que apoya la ejecución del código y herramientas para el trazado, la depuración y la gestión del espacio de trabajo.
SCILAB
Software para el análisis numérico que posee su propio lenguaje de programación, orientado al uso de matrices y vectores.
SUMATRA PDF
https://www.sumatrapdfreader.org/
Visor libre para documentos PDF, ePUB, MOBI, CHM, XPS, DjVu, CBZ y CBR.
THUNDERBIRD
Cliente de correo electrónico multiplataforma de código abierto y libre.
WINBUGS
http://www.mrc-bsu.cam.ac.uk/software/bugs/the-bugs-project-winbugs/
Software estadístico para el análisis bayesiano usando los llamados métodos MCMC (Markov Chain Monte Carlo).
Muy interesante. Gracias.
ResponderEliminarMuchas gracias por el artículo. Yo estoy tratando de manejarme con el programa. Sé que puedo abrir los archivos de SPSS en PSPP pero ¿a la inversa también funciona?
ResponderEliminarun saludo
El formato es el de SPSS, por lo que funciona exactamente igual
ResponderEliminarPermite exportar a csv?
ResponderEliminarHola solo le veo un pero, en pruebas no paramétricas faltan grupos no relacionados y falta la regresión lineal ordinal. Saludos.
ResponderEliminarNada es gratis, quien me asegura que un calculo complejo sea el correcto en algo gratuito????, por lo menos en un software pagado existe una emplesa responsable de eso....! como para pensar
ResponderEliminarEl cálculo depende de rutinas básicas que en realidad comparten casi todos programas. Y hay muchas cosas gratis, mucha gente que simplemente comparte lo que sabe de forma altruista. Sé que eso pone nerviosas a algunas personas, pero es así.
EliminarHola, estoy comenzando a probar PSPP y quisiera saber como se pueden crear variables de respuesta múltiple partiendo de un set múltiple de variables dicotómicas (sí/no, provenientes de preguntas de encuestas con opciones de respuestas a marcar con checkboxes). Y luego cómo por ejemplo, calcular las frecuencias.
ResponderEliminarMuchas gracias!