La prensa como fuente de datos socio-históricos:
Cuestiones sobre la metodología de recolección de datos a partir de periódicos♠
The Press as a Source of Socio-Historical Data: Issues in the Methodology of Data Collection from Newspapers
Roberto Franzosi*
Traducción: Daniel Nicolás Rabino** Revisión: Agustín Santella*** y Luciana Salandro**** |
Introducción
Los científicos sociales involucrados en investigaciones cuantitativas de carácter empírico suelen estar relativamente despreocupados por los problemas de medición. La mayoría prefiere comenzar inmediatamente con estimaciones estadísticas y la construcción de teoría. Esto es particularmente cierto en relación a los investigadores que utilizan estadísticas oficiales recolectadas por el gobierno. El hecho de que estas estadísticas estén impresas en publicaciones oficiales las hace irreprochables. En todo caso, al utilizar estadísticas oficiales, sentimos que el problema no es nuestro, ya que no recolectamos la información nosotros mismos. En el mejor de los casos, los problemas de medición son reconocidos en notas de página o apéndices metodológicos difíciles de encontrar. La literatura cuantitativa sobre huelgas es un buen ejemplo. Se ha realizado una gran cantidad de investigaciones utilizando estadísticas gubernamentales de huelgas desde comienzos de este siglo; pero, a pesar de la baja calidad de estos datos, se le ha dado poca atención a los problemas de medición.[1]
Es más difícil ignorar completamente los problemas de medición cuando recolectamos nuestros propios datos, ya que nos sentimos obligados por lo menos a describir los procedimientos de recolección. Generalmente, no vamos más allá de eso. Las investigaciones cuantitativas de acción colectiva y violencia colectiva brindan un buen ejemplo –la mayoría de estas investigaciones se basaron en fuentes primarias extraídas de periódicos. Pero, incluso en esta literatura, los problemas de medición han “recibido sólo una consideración simbólica” [Snyder y Kelly 1977]. Esto impide ver las formas en que los procesos de medición puedan afectar los resultados de los análisis estadísticos, y en última instancia, nuestras conclusiones teóricas.
En este texto, analizaré varios aspectos involucrados en la recolección de datos provenientes de periódicos. La primera parte se encargará específicamente de los aspectos relacionados con los errores de medición (validación y selección de muestras parciales, diseños de procedimientos de codificación y fiabilidad entre codificadores). La segunda sección ofrece algunas sugerencias sobre la selección de las muestras de periódicos para ser usadas como fuentes y su frecuencia de lectura. También se discutirán las diversas unidades de medición y análisis.
Este texto se basa principalmente en mi investigación actual sobre la conflictividad en Italia, basada en información de periódicos; sin embargo, las definiciones de los problemas involucrados y las soluciones propuestas son generalmente válidas. La principal recomendación de este texto es que se le debería dar más énfasis a los problemas de validación que a los de fiabilidad. La magnitud de los errores generados por problemas de validación es probablemente mucho mayor que los problemas de fiabilidad. Pero, generalmente se le presta mayor atención a los problemas de fiabilidad, probablemente a causa de la creencia generalizada de que los investigadores no pueden hacer nada para superar los efectos de los sesgos de información (validez) producidos por los periódicos. Las técnicas discutidas en este texto ofrecen varias soluciones potenciales a los problemas de validación de nuestros datos.
Errores de medición
Validez y fiabilidad en los datos de eventos periodísticos
“La medición se preocupa por el problema de vincular conceptos abstractos con indicadores empíricos” [Zeller y Carmines 1980]. Hay dos componentes para cualquier problema de medición, uno teórico y otro empírico. El componente teórico de la medición se aplica a la relación entre indicadores empíricos y conceptos teóricos. Por ejemplo, la literatura sobre eventos se interesa por los conceptos abstractos como “lucha de clase”, “agitación política” y similares. ¿Qué es lo que los científicos sociales tienen en mente cuando piensan en la “lucha de clases”? ¿Serán los eventos de gran escala que son tan característicos del repertorio de acción colectiva de los trabajadores como las huelgas, las manifestaciones, las marchas y los mítines?[2] ¿O están pensando en formas de conflicto más subterráneas, difíciles de detectar desde afuera, pero cuyos significados sociales son bastante claros para los individuos involucrados?[3] Además, dada la variedad de formas específicas de “lucha de clase” ¿puede un solo indicador (huelgas por ejemplo) servir para proveer una medida adecuada, o sería mejor utilizar múltiples indicadores? Si fuese así, ¿cómo podría uno entonces analizarlos?[4]
La pregunta es: ¿Hasta qué punto los indicadores empíricos elegidos miden el concepto para el que fueron diseñados? El concepto de validez se refiere a la noción de “un instrumento que mide exactamente lo que supuestamente debe medir y nada más” [Zeller y Carmines 1980]. Otra forma de decir esto es que la validez se refiere al grado del error sistemático involucrado en el proceso de medición; un termómetro no sería un instrumento válido para medir la presión sanguínea en lugar de la temperatura corporal [Zeller y Carmines 1980]. De igual manera, las huelgas generales podrían no proveer una buena medición del grado del conflicto de clase presente en la sociedad en cualquier contexto histórico.
Los procesos que intervienen en operacionalizar y en darle representación empírica a conceptos abstractos refieren al componente empírico de medición. Al respecto, la pregunta es: habiendo aceptado las huelgas, por ejemplo, como un buen indicador empírico del conflicto de clase, ¿se ha introducido algún error al medirlas? El foco de atención aquí es el error aleatorio y el concepto que ofrece diálogo con él es el de fiabilidad. “La fiabilidad da cuenta del grado de repetición y consistencia de las mediciones empíricas” [Zeller y Carmines 1980].
Aunque la validez refiere generalmente al grado en que un indicador mide un concepto abstracto, los problemas de validez surgen en diferentes niveles de abstracción. Por ejemplo, la validez tal vez se refiere al grado en que las huelgas proveen una buena medida del conflicto de clase. A un nivel más concreto, habiendo elegido a las huelgas como una medida válida del conflicto de clase, la validez refiere al grado en que los archivos policiales, las estadísticas de huelgas oficiales o los periódicos proveen indicadores validos de huelgas. ¿Cuán acertadas son estas fuentes en su registro de las huelgas? ¿Qué forma de parcialidad sistemática introducen? En referencia a los periódicos, ¿son algunos eventos más susceptibles o posibles de ser reportados que otros? ¿Cuáles son las características de estos eventos? Estas son las preguntas de validez que me conciernen específicamente y que voy a intentar responder.
La prensa como fuente de datos socio-históricos. El problema de la validez de los informes
Los periódicos han sido considerados por historiadores y científicos sociales, en forma general, como fuentes informales de datos históricos. Aunque, en investigaciones sociales recientes, los periódicos han sido utilizados sistemáticamente como fuente de datos. Por ejemplo, Philip Burch utilizó periódicos semanales y diarios entre los años 1950 y 1971 para evaluar el grado de control gerencial en las grandes corporaciones. Louis Galambos acudió a los periódicos para estudiar los cambios en la actitud de la opinión pública acerca de los grandes negocios durante el cambio de siglo [Burch 1972]. Sin embargo, es en el estudio de la acción colectiva y de violencia política donde los periódicos fueron más utilizados como fuentes de datos.[5]
El problema en utilizar la prensa como fuente de datos sobre eventos, es que la validez de la información de parte de los periódicos es cuestionable. Se ha argumentado que los periódicos difieren ampliamente en sus reportes y coberturas de noticias [Capecchi y Livolsi 1971; Glasgow University Media Group 1976; Kegan y Hartmann 1975/76] y que, en todo caso, las noticias son parciales y selectivas [Breed 1955; Bowers 1967, 1973; Gans 1980]. La selectividad ha sido vista como producto de la profesionalización del periodista, con sus propios estándares de objetividad reforzados por criterios autónomos para entrenamiento, reclutamiento e imperativos de promoción comerciales, restricciones de espacio y tiempo, y limitaciones impuestas por la estructura organizacional de las salas de noticias [Gitlin 1980]. De forma más extrema, Harvey Molotoch y Marilyn Lester [1974] “ven a los medios masivos de comunicación como el reflejo, no del mundo, sino de las prácticas de aquellos que tienen el poder para determinar las experiencias de los otros”. Argumentos similares han sido expresados por algunos estudiosos que trabajan con la tradición gramsciana de hegemonía e ideología cultural. Estos estudiosos ven tanto a los periódicos como a los medios masivos de comunicación como partes integrales del aparato ideológico de las sociedades capitalistas y una de las principales agencias para la reproducción de estas sociedades a través de su interpretación, embalaje y distribución de la realidad en toda la sociedad [Gitlin 1980]. De acuerdo a esta escuela de pensamiento, la selección de noticias no es aleatoria -refleja las intenciones, voluntades e intereses de los grupos económicos dominantes [Hall 1977]. La cobertura de noticias representa de manera errónea particularmente las cuestiones laborales y de clase [Capecchi y Livolsi 1971; Nedzynski 1973; Glasgow University Media Group 1976; Morley 1976; Beharrell y Philo 1977; Murdock y Golding 1977; Hartmann 1979; Downing 1980].
Si estas críticas son aceptadas, también deberíamos preguntarnos si los “hallazgos en conflictos pueden ser de hecho artilugios de patrones de publicación de noticias” [Danzger 1975]. La pregunta aquí es si analizamos patrones de eventos históricos o patrones de reportes de noticias [Danzger 1975; Tilly 1969]. Aunque esta es una pregunta seria y dañina, ya que apunta a la potencial contaminación entre el fenómeno de interés y los procedimientos para registrarlo, hay varias razones para ser optimistas.
Primero, más allá de las limitaciones de los periódicos como fuentes de datos históricos, a menudo constituyen la única fuente de información disponible. En su estudio sobre las revoluciones agrarias, Jeffrey Paige [1975] escribe, “ninguna compilación de eventos, tal cual están definidos en esta monografía (como una acción o serie de acciones colectivas en el sector de la agricultura de exportación) está disponible, por lo que fue necesario para computar la cantidad de eventos utilizar las fuentes periodísticas”.[6] La exclusión de los datos periodísticos impediría investigaciones en campos donde no hay datos alternativos disponibles [McAdam 1982].
Segundo, mientras hay problemas con la prensa como fuente de datos históricos sobre conflictos, deberíamos recordar que no hay fuentes de datos sin errores, incluyendo las estadísticas oficiales [Shalev 1978]. En la ausencia de validaciones sistemáticas y comparativas, no hay razón a priori para creer que los datos recogidos de periódicos serán menos validos que otras fuentes comúnmente utilizadas.
Tercero, no todos los eventos o artículos de información son igualmente malinterpretados en la prensa. Algunas noticias parecieran estar más afectadas por las políticas editoriales.[7] Por ejemplo, los periódicos generalmente concuerdan en sus reportes en el tipo de acción involucrada (huelga, demostración, sentada, etc.), su localización y fecha, la identidad general de los participantes (trabajadores, estudiantes, negros, policía, etc.) y si la gente fue arrestada, lastimada o asesinada. Aunque pareciera que habrá variaciones en sus reportes acerca de las razones que le dan a la acción de la gente o la responsabilidad dada a ciertos grupos (trabajadores contra policía, por ejemplo) por acciones específicas (daño a la propiedad o violencia) a grupos en particular, más que a otros grupos (trabajadores o policías).[8] La interpretación de los eventos, tal cual fueron expresados por las editoriales o algunas veces mezclados con los reportes de hechos concretos, son particularmente susceptibles a influencias. Diversos tipos de acciones conflictivas también tienen diversas probabilidades de ser reportados. Por ejemplo, David Snyder y William Kelly argumentan que “por razones de tamaño, violencia e impacto político”, las guerras civiles, golpes de estados y arrestos masivos son reportados más exhaustivamente que los exilios, arrestos de personas insignificantes, crisis dentro de organizaciones no gubernamentales o huelgas [Snyder y Kelly 1977: 109-110].
Cuarto, tal cual indican Snyder y Kelly, la probabilidad de errores en los reportes siempre puede reducirse elevando el umbral mínimo de recolectores (50 individuos en vez de 10, actuando colectivamente) [Tilly 1969: 29-30; Snyder y Kelly 1977: 109]. La mayoría de los estudios sobre la cobertura de medios de comunicación está de acuerdo con que los eventos a gran escala difícilmente pasen desapercibidos en los medios.
Finalmente, el tipo de influencias que más comúnmente puede ocurrir en los medios masivos de comunicación consiste, más en el silencio o en el énfasis, que en dar falsa información. Como dicen Vittorio Capecchi y Marino Livolsi:
La distorsión de noticias no opera demasiado a través de una alteración obvia de un evento (por ejemplo: la noticia de que “A ama a B” reportada por un diario de derecha y que aparece como “A odia a B” es un diario de izquierda), sino más bien a través de la bajada de línea como de la insistencia en algunas características de un evento [Capecchi y Livolsi, 1971: 264].
La información se manipula a través del uso de adjetivos, la frecuencia de ciertos sustantivos, el uso de sinónimos y paráfrasis, comentarios y editoriales, y títulos y subtítulos, desde el énfasis en algunas características de un evento a la omisión de otras, y la ruptura de la información y su reconstrucción de una forma que sugiere relaciones causales precisas.[9] El lenguaje es la herramienta de manipulación mediática, “el sonido de ambiente que amplifica o reduce las reacciones emocionales del lector, y que subraya las características positivas o negativas que el periódico atribuye a un actor en particular” [Capecchi y Livolsi 1971: 270]. Así el prejuicio de los periódicos tendría menos que ver con el vínculo del objeto de información con la realidad que con la probabilidad de que un objeto de información aparezca una o más veces en uno o más artículos concernientes a un evento. Por consiguiente, al utilizar la prensa como una fuente de datos históricos, tomamos el riesgo de recolectar insuficiente, en vez de defectuosa, información. En este sentido, el problema puede ser menos severo de lo que las investigaciones sobre medios nos han llegado a hacer creer.
El sesgo en la elección de la muestra. El problema y algunas soluciones
Como hemos visto, los datos recolectados de los periódicos suelen carecer de validez en ciertas formas no aleatorias. Como consecuencia, esos datos pueden no considerarse como un subconjunto aleatorio de una población de eventos. Al final, esto significa que los test estadísticos por inferencia que nos permiten generalizar los resultados a partir de una muestra a toda una población no son aplicables. No podemos simplemente ignorar el problema pretendiendo no generalizar los resultados de la muestra al universo [Berk 1983: 396]. La exclusión sistemática de una parte de las observaciones introduce errores de especificación que influyen en la relación entre las variables en el modelo. La dirección y el peso de estas influencias no son fáciles de predecir. “La dificultad es que uno arriesga confundir el fenómeno substantivo de interés con el proceso de selección” [Berk 1983: 391]. ¿Reflejaría un incremento del 10% en la frecuencia de reportes de determinados eventos tendencias reales similares, o este incremento solo responde a un interés repentino de los medios? De manera similar, “la falta de conflictos reportados tal vez no significa que los conflictos no ocurrieron… los reportes de periódicos pueden ser aceptados como datos de que el evento ocurrió, pero la ausencia de reportes no puede tomarse como indicador de que los eventos no ocurrieron” [Danzger 1975: 570, 581].
Por supuesto, si el nivel de información errónea fuese constante a través de varias unidades de agregación de datos (tiempo, espacio, sector económico u otro), el problema no sería tan serio. Jeffrey Paige, por ejemplo, fue capaz de mostrar que hubo acuerdos considerables en la distribución espacial y sectorial de los eventos entre prensa primaria (local) y secundarias (internacional) para los casos de Perú y Angola, a pesar del gran número de eventos registrados en la prensa local [Paige 1975]. Aunque, en general, la evidencia disponible parece indicar que los patrones temporales y espaciales de las noticias periodísticas no se corresponden con los patrones de la vida real. Por ejemplo, se ha argumentado que los desórdenes raciales ocurridos en ciudades con o sin experiencias previas de conflictos raciales tienen diferentes probabilidades de ser reportados, distorsionando así la distribución geográfica de los eventos.[10]
Además, es probable que haya diferencias geográficas internacionales y nacionales al momento de reportar. Primero, la posición geopolítica de un país y el interés del mundo en sus asuntos domésticos así como también la presencia de la censura de medios podrían afectar la probabilidad de reportar los eventos que ocurren en ese país, por la prensa internacional [Rummel 1963; Tanter 1966]. Incluso las coberturas de eventos nacionales sufren parcialidad geográfica. Por ejemplo, David Snyder y William Kelly “se dieron cuenta de que muy pocas protestas ocurridas en las ciudades del oeste de Estados Unidos aparecían en el New York Times” [Snyder y Kelly 1977: 119-120]. Ambos, los patrones geográficos y temporales, son probablemente distorsionados por la prensa. De nuevo, Snyder y Kelly argumentan que, en el largo plazo, hay una relación en U invertida entre la frecuencia y los eventos conflictivos [Snyder y Kelly 1977: 119-120]. Aunque sería difícil especificar cuántos días, meses o años tomarían para que el largo plazo funcione, Snyder y Kelly apuntan a un importante aspecto del reporte de los conflictos, que los patrones temporales de los informes periodísticos no serían sincrónicos con los patrones de eventos históricos.[11]
Para resolver el problema de la selección de muestras parciales desde el punto de vista estadístico, necesitaríamos un modelo de la determinación de la parcialidad, es decir, una teoría de la selección. Si la información separada estuviese disponible en ambos subconjuntos, el seleccionado y el no seleccionado, sería posible estimar un modelo estructural formal de ecuación con una ecuación “substantiva” y una ecuación “parcial” [Heckman 1979; Berk 1983]. Desafortunadamente, en el caso de recolectar eventos de protesta a partir de periódicos, no pareciera que una ecuación formal de la muestra de selección de parcialidad pudiese ser estimada. En general, sabemos demasiado poco acerca de los mecanismos de selección de noticias. Aunque sería posible aplicar el procedimiento de corrección para eventos seleccionados o periodos de muestra seleccionados para los cuales fuentes alternativas de información estén disponibles. En otros casos, es posible que simplemente incluyendo en el modelo medidas en las localizaciones de los corresponsables de los periódicos locales pudiera mejorar el poder explicativo del modelo [Danzger 1975; ver, no obstante, Snyder y Kelly 1977].
Más allá de que el problema de la selección de muestra parcial puede ser resuelto formalmente en un modelo estadístico o no, se le debería dar más atención a este asunto del que se le da normalmente en la literatura de protesta. Como mínimo, recomiendo la realización de recolecciones paralelas de información de “control”, incluso solo por un subconjunto del total del periodo de muestra, distribución geográfica y tipos de eventos de interés. El propósito general de recoger información de control poco difiere en espíritu de las técnicas comúnmente utilizadas en encuestas de investigación para recoger tanta información como sea posible sobre los no encuestados. Investigaciones cuidadosas sobre las características de los encuestados versus no encuestados son de mucha ayuda en evaluar la validez de nuestras inferencias. Tales investigaciones son prácticas estándar en las investigaciones por encuestas, pero raramente se encuentran en los estudios sobre eventos históricos. Específicamente, sugeriría recolectar la siguiente información de “control”.
Primero, los investigadores que se dedican a periodos históricos que incluyan el presente deberían establecer procedimientos de registro independiente, incluso si fuese solo por un pequeño subconjunto de un territorio de interés y por un limitado periodo de tiempo. Empleadores, sindicatos locales y asociación de empleadores, departamentos de policía, u organizaciones de derechos civiles, pueden ser persuadidos a recolectar y proveer información valiosa “de acuerdo con estándares aceptables para los investigadores” [Tilly 1969: 31]. La información así recogida podría entonces ser comparada con la información reportada por los periódicos.
Segundo, por lo menos para estudios sobre conflictos industriales, la información de alguna empresa significativa reportada por la prensa podría compararse con la información recolectada por las empresas mismas (en la medida en estas tengan la voluntad de abrir sus registros a los investigadores). La ventaja de este abordaje por sobre la anterior es que ofrece una dimensión histórica potencial, ya que las empresas podrían tener archivos de conflictos a lo largo del tiempo. La desventaja es que la muestra de las empresas cuya información podría usarse (más allá de la voluntad de las empresas para habilitar esa información) lo más probable es que sea parcial a favor de las grandes firmas. Es menos probable que las pequeñas o medianas firmas tengan información sobre huelgas.
Una tercera aproximación aprovecharía cualquier otra enumeración preexistente de eventos, en la medida en que estas listas sean realmente independientes y que no provengan de la misma fuente periodística. Muy a menudo, como observa Herbert Danzger, “lo que parecieran ser fuentes numerosas son tras un examen cercano, primariamente la misma fuente con diferente disfraz” [Danzger 1975: 573]. Anuarios, procedimientos de la corte, resultados de investigaciones de un comité parlamentario ad hoc, encuestas de agencias especializadas en la recolección información, y por supuesto, archivos policiales (a pesar de que estos últimos generalmente no están abiertos al público para las décadas más recientes) pueden proveer información útil [Tilly 1969: 23-24, 30]. Asimismo, en el caso del conflicto industrial en Italia, comparaciones día a día de los eventos de huelga recolectados de periódicos se podrían comparar sistemáticamente con los casos reportados por ISTAT, la agencia gubernamental oficial de estadísticas, desde 1976 cuando ISTAT comenzó a guardar diariamente los datos de huelgas en cintas magnéticas.
Cuarto, deberían hacerse comparaciones periódicas sistemáticas a lo largo de varios diarios de diferentes posiciones ideológicas y periodísticas. Incluso una semana cada tres o cinco años sería suficiente; consultando varios diarios, incluso por tan corto periodo de muestra y con ese intervalo de muestreo tan largo seríamos capaces de medir el efecto de utilizar solo un diario del tipo de dato recolectado. Además, las comparaciones sistemáticas en diferentes puntos en el tiempo ayudarían a monitorear los cambios en el grado de cobertura de la fuente seleccionada para el análisis.
Finalmente, si las definiciones que califican los eventos para recolectar han sido mantenidas suficientemente amplias, se pueden realizar análisis separados a varios niveles de umbrales. Los resultados estadísticos obtenidos en los niveles de umbral más altos, y consecuentemente a niveles más altos de validez, entonces pueden ser utilizados como varas de medición contra las cuales puedan compararse los resultados obtenidos en niveles más bajos [Tilly 1969: 23-24, 30].
Como escribió Charles Tilly, “las comparaciones entre eventos de periódicos y otras fuentes desaniman cualquier esperanza de arribar a la “misma” lista de disturbios de estas diversas fuentes, pero sí indican que los periódicos proveen la más completa enumeración y de que sus prejuicios principales se dirigen sobre todo a sobre-reportar eventos en grandes ciudades” [Tilly 1969: 23-24, 30]. De nuevo, el propósito en estos esfuerzos en la recolección independiente de datos, no es llegar a una enumeración de eventos lo más cercana posible a los eventos de la población, que de por sí sería lo más deseable, sino para desarrollar una mejor comprensión de las características de los eventos en la muestra del periódico. La recolección de datos comparativos debería ser una parte integral del diseño de proyectos de investigaciones que involucren recolección de datos periodísticos.
Esquemas de codificación y fiabilidad del registro
Hasta este punto, he tratado principalmente con problemas de validez de datos (o el error sistemático de los reportes de periódicos). En las aplicaciones específicas involucradas en utilizar datos de periódicos, los errores generados por problemas de validez parecieran eclipsar a los problemas generados por la fiabilidad. No obstante, hay al menos dos fuentes de errores aleatorios (confiabilidad) involucrados en recolectar datos de periódicos, que se producen de los errores de transcripción o registro. Ocurren cuando 1) los codificadores interpretan erróneamente uno o más ítems de la información contenida en un artículo de periódico (los errores de codificación relacionados al problema más general de confiabilidad entre diferentes codificadores); o 2) los codificadores registran equivocadamente la información en papeles o directamente en la computadora (error de entrada de datos). Esta y la siguiente sección tratan estos tipos de errores de confiabilidad.[12]
La recolección de información de periódicos está generalmente basada en análisis de contenidos empleando esquemas de codificación que consisten en una serie de categorías. El siguiente criterio debería guiar la preparación de esquemas de codificación:
- Las categorías deberían tener un vínculo directo, individualmente o en un grupo de otras categorías, con una o más hipótesis de interés [Laswell et al. 1952, citado en Budd et al. 1966];
- Las categorías deberían ser mutualmente excluyentes [Krippendorf 1980: 83];
- Las categorías deberían mantener una semejanza con el lenguaje utilizado por los periódicos [Krippendorf 1980: 84].
Ítems o categorías sean muy abstractas o generales posiblemente llevarán a amplias diferencias de interpretación entre los lectores. Para mejorar la homogeneidad de los datos y la confiabilidad entre los codificadores, los conceptos y categorías generales deberían convertirse en ítems elementales de información tal cual fueron informados por los mismos periódicos. Es preferible recomponer las categorías más generales de interés teórico durante la fase tardía del análisis de datos, agregando los ítems más elementales de información a trabajar con categorías cuyos procesos de agregación subyacentes pareciesen variar ampliamente entre los lectores. Esto, en cambio, implica familiaridad con el material textual o teórico a ser codificado antes de la preparación del esquema de codificación.
Una vez que el esquema de codificación esté listo y haya pasado por extensas pruebas, el proyecto puede llevarse a su segunda fase: el registro de información de los periódicos. Tradicionalmente, la codificación se ha realizado con esquemas de codificación en base a papel. La llegada de las microcomputadoras pareciera haber convertido a esta técnica en obsoleta ya que pueden ser utilizadas para codificar información directamente a la máquina.
Las ventajas de las entradas directas por sobre las transcripciones manuales son dos: 1) las entradas directas son menos costosas; y 2) producen datos más confiables. La entrada directa evita el paso intermedio de codificar en papel. Aunque requiere la adquisición de una microcomputadora, este costo pareciera ser compensado por los ahorros efectuados al no tener que imprimir esquemas de codificación o de ingresar codificaciones de datos en la computadora a mano; aunque la verdadera ventaja de la entrada directa es que permite un inmediato control automático, online, de la información codificada (ortografía de nombres de localidades y sectores industriales, tiempo de los eventos, consistencia interna de categorías codificadas). Asimismo, la entrada directa permite una fácil actualización del esquema de codificación.[13] Otros proyectos de recolección de datos a gran escala han elegido la misma estrategia. En la base de una comparación adecuada de los tiempos de codificacion y la proporción de error en las transcripciones manuales y en las entradas directas, las investigaciones involucradas en el “40-50 Project” del Bureau de Estados Unidos del Census concluye, “la entrada de datos directos es más rápida que el proceso de transcripción manual…además, los datos ingresados directamente son de una calidad superior”.[14]
Finalmente, la entrada directa de datos puede combinarse con conceptos poderosos desarrollados en el campo de la inteligencia artificial y el lenguaje matemático para producir archivos históricos que son mucho más flexibles y ricos en información de contenidos que los permitidos a través de los esquemas de codificación tradicionales. El concepto de gramática es particularmente útil [Chomsky 1971]. La gramática de un lenguaje indica las reglas para combinar palabras en frases. Ambos, los esquemas de gramática y de codificación, nos permiten ajustar hilos textuales en casilleros, ya sea a través de la codificación de categorías o estructuras gramaticales, como sujeto, verbo, objeto y otros. La ventaja de una gramática es que provee una forma poderosa de conectar categorías, con las conexiones especificas por la misma gramática. En un esquema de codificación tradicional, los vínculos y conexiones entre categorías no pueden implementarse fácilmente.[15]
Incluso la entrada directa (basada en esquemas de codificación tradicionales o gramáticas), para todo chequeo online, no puede garantizar datos libres de errores de registro. Como hemos visto, los registradores pueden cometer errores al ingresar datos en la computadora (errores de entrada de datos) o interpretar equivocadamente uno o más ítems de información contenida en los artículos periodísticos.
Muchos errores en la entrada de datos son identificados automáticamente por la computadora (Nuw York en vez de New York, Enero 35, 1952, etc.) otros errores no son automáticamente identificados (por ejemplo, la duración de una huelga de dos horas, tipeada equivocadamente como de 22 horas). El programa de computadora que realiza la entrada directa de datos podría ser diseñado para mostrar toda la información codificada por cada artículo en la pantalla; este le pedirá al lector verificar los datos recién ingresados antes de continuar la codificación del siguiente artículo. Aunque la posibilidad de error pueda existir, al poder los registradores interpretar el significado de ciertas categorías de codificación en formas diferentes. En la siguiente sección, voy a enumerar las cuestiones de la fiabilidad entre codificadores.
La fiabilidad entre codificadores
La fiabilidad entre codificadores es un problema que afecta a todos los proyectos de análisis de contenido, incluidos potencialmente aquellos que reportan un alto coeficiente de fiabilidad entre codificadores [Krippendorf 1980: 74]. Expresado en forma simple, la fiabilidad entre codificadores, como otras formas de fiabilidad, mide la repetición: los resultados obtenidos por un codificador pueden repetirse por otros codificadores utilizando las mismas técnicas sobre el mismo material con el mismo set de reglas. La repetición podría ser más o menos difícil dependiendo de la aplicación específica de análisis de contenidos (cuentas simples de palabras claves o medición de longitud) de artículos en números de líneas o centímetros claramente son menos propensos a problemas de fiabilidad entre codificadores que los análisis temáticos. Por esta razón, “la fiabilidad en un estudio debe haber sido comparada con estudios similares” [Budd et al. 1966: 67]. La fiabilidad entre codificadores depende también de la forma en la cual fue diseñada la forma de codificación de categorías, el tipo de instrucciones dadas a los codificadores y la claridad con que las reglas de codificación han sido escritas.
Idealmente, deberíamos poder obtener altos coeficientes de fiabilidad entre codificadores, solamente sobre la base de las instrucciones escritas [Krippendorf 1980: 74]. Por estas razones, durante las fases de preparación y prueba de los proyectos basados en la codificación de periódicos, mucho esfuerzo debería dedicársele a escribir un manual detallado de instrucciones de codificación y diseño de categorías problemáticas.
Una forma de maximizar la fiabilidad entre codificadores y minimizar el error de registro es tener a varios codificadores realizando la codificación en fases sucesivas, cada uno leyendo cada artículo. En teoría, eso sería lo mejor; en la práctica, tal vez no valga los recursos gastados. Dada la magnitud probable de validez versus los errores de fiabilidad (errores de información versus errores de registro), en una situación de recursos limitados, invertiría en datos paralelos los esfuerzos de recolección apuntando a evaluar la naturaleza y extensión del error de información. En otras palabras, yo intentaría medir la dirección y magnitud de las influencias del periódico.[16]
El tipo de error sistemático introducido por las prácticas de reporte de información pareciera tener un efecto mucho más grande en conclusiones empíricas que en los errores aleatorios introducidos a través de los procedimientos de registro. Sin embargo, la atención de los investigadores se ha focalizado casi exclusivamente en los errores de registro y en los de fiabilidad entre codificadores. Tal vez todos nos sentimos comprometidos a hacer todo lo posible para recolectar datos confiables ya que que tenemos poco control sobre la validez de los datos del periódico. Pero ¿cuál es el punto en invertir tantos recursos en asegurarse, por ejemplo, que una forma de conglomerado de 200 mil personas sea registrada apropiadamente? Dicha forma puede estar al borde de lo fantástico y, además, hay una igual probabilidad de que esté siendo sobreestimado o subestimada.[17] Los investigadores poco pueden hacer para cambiar el nivel de error al reportar (validez); aunque, pueden –y deberían- hacer un mayor esfuerzo para medir su extensión.
La anterior discusión no significa que los errores de registro deberían tomarse livianamente –es más, no deberían. Sugiero que deberíamos considerar estrategias alternativas. Los muestreos por aceptación, por ejemplo, pueden proveer suficiente protección contra los errores de registro. No todas las bombillas de luz que provienen de una línea de ensamble son testeadas para ver su rendimiento, aunque uno raramente deba devolver una bombilla al negocio donde la compró. ¿Cómo funciona el muestreo por aceptación? Una muestra de la cantidad de artículos codificados todos los días por cada lector es seleccionada aleatoriamente para inspeccionarla[18]. Cuando el porcentaje de errores es mayor que el umbral mínimo, la producción diaria del lector es enteramente descartada y rehecha. De lo contrario, los errores serán corregidos. En este caso, ambos, el viejo código incorrecto y el nuevo código correcto se guardarían en el archivo. Este archivo de datos proveería un registro útil de desempeños de las categorías. Los muestreos por aceptación no pueden garantizar un producto libre de errores, pero puede garantizar que los errores se mantendrán dentro de ciertos límites de tolerancia predefinidos.
El problema con el muestreo por aceptación es que las codificaciones del codificador y del verificador no son independientes. El verificador podría verse afectado por las codificaciones previas que él o ella inspecciono. Para evitar este problema y todavía hacer posible el control de la fiabilidad entre codificadores, mientras el proyecto continúa el equipo entero debería registrar periódicamente y en forma individual los mismos artículos de periódico. Los coeficientes de la fiabilidad entre codificadores luego serán computados para cada categoría [Holsti 1969; Budd et al. 1966: 68].[19] Richard Budd, Robert Thorp y Lewis Donohew escriben “si un codificador está constantemente fuera de la línea con respecto a los otros, debe ser instruido o eliminado; si varios codificadores están en desacuerdo, las instrucciones y definiciones deben ser reexaminadas” [1966: 67].
Claramente, los estándares mínimos de fiabilidad varían con la categoría (la categoría “nombre del lugar”, por ejemplo, es menos vaga que la categoría “objetivo de la acción”); generalmente deberían ser tomados como aceptables rangos de coincidencia entre el 80 y 90 %. Para eliminar posibles tendencias espurias en los datos recolectados debidos solo a la idiosincrasia del codificador es recomendable que la codificación sea organizada de tal forma que ningún lector trabaje en un solo periodo de submuestra [Hofstetter 1976: 25]. Aunque hay dificultades prácticas y costos con una colección enteramente aleatoria, una organización normalmente posee solo una copia de microfilm de periódico, y cada carrete del microfilm contiene varios meses de artículos. Además, la familiaridad con el contexto histórico y el desarrollo día a día de un evento debería proveer al lector un mejor entendimiento de las dinámicas de los actores y temas involucrados en el periodo, reduciendo la probabilidad de errores de interpretación. Así, la planificación de la codificación de producción debe llegar a un punto medio entre dos tendencias opuestas. Una solución sería asignar un subperiodo de tres a cinco años a un grupo de lectores, con cada lector codificando temas del periódico que le hayan sido asignados aleatoriamente dentro de todo el subperiodo.
Seleccionar el periódico para ser usado como fuente de datos y la frecuencia de su lectura
Las prácticas de reportar por parte de los periódicos han diferido en términos de 1) el grado de la circulación del periódico [Capecchi y Livolsi 1971], 2) la proximidad de los eventos al mercado consumidor del periódico o de las agencias de noticias [Danzger 1975; Snyder y Kelly, 1977] y 3) la posición ideológica del periódico [Hartmann 1975/76]. Dadas estas diferencias, idealmente, a uno le gustaría recolectar datos de la mayor cantidad de periódicos posible. Basarse en varios periódicos incrementa la cantidad de eventos y ayuda al investigador a estar menos sujeto a la idiosincrasia de cualquier fuente individual. El problema es que la cantidad de los periódicos en la mayoría de los países es muy alta [De Luna et al. 1980: 304-308], demasiado alta para que un investigador los pueda consultar todos, al menos en un largo periodo de muestra y con lecturas diarias. Debe tomarse una decisión. De cualquier forma, en ninguna parte he visto reportes de investigaciones preliminares conducidos para justificar la elección de un periódico en particular, ni he visto un criterio claro que haya guiado tal decisión. La conveniencia de tener un índice que facilite la búsqueda de artículos parece ser el criterio no mencionado para la elección del New York Times en muchos estudios de datos sobre eventos.
Una elección más racional estaría basada en comparaciones preliminares sistemáticas de un gran número de periódicos para evaluar la extensión y tipo de cobertura de cada uno. El periodo de muestra no necesita ser demasiado largo; incluso de una semana a dos o más puntos de tiempo dentro del periodo total de muestreo de interés puede ser suficiente. Los análisis preliminares de estos datos comparados pueden ayudar a los investigadores a realizar elecciones informadas, dictadas por la naturaleza del problema en mano en vez de la conveniencia.
Habiendo elegido el/los periódicos a utilizar como fuente, el intervalo de muestreo – la frecuencia de lectura y codificación de los periódicos- todavía debe ser seleccionado. Los periódicos pueden leerse todos los días, utilizando todos los artículos publicados, o para ahorrar recursos, podría leerse uno o más días a la semana, uno o más semanas al mes, uno o más meses al año, cada tres años, cada cinco años y así. Después de todo, la población entera de un país nunca es entrevistada para predecir el comportamiento electoral en las próximas elecciones políticas nacionales. Las muestras elegidas cuidadosamente pueden dar resultados muy cercanos a los que se podría obtener sobre la base de la población total. Sin embargo, mientras que el muestreo puede ser un procedimiento apropiado en el campo de los análisis de contenido clásicos, tiene probabilidad de incurrir dos obstáculos fundamentales cuando es aplicado en estudios de procesos socio-históricos[20].
Primero, si el fenómeno bajo estudio está caracterizado por un comportamiento cíclico – que es la naturaleza de muchos procesos históricos- los ciclos podrían escabullirse por la cuadricula de muestreo, apareciendo con cortes de picos aquí y menores allí. Consecuentemente, los ciclos no serían identificados fácilmente durante el análisis. Uno podría estratificar la muestra sobre la base de dicho comportamiento cíclico, pero estas técnicas de muestreo supondrían, a priori, conocimiento de los ciclos.
Segundo, la distribución de los eventos en el fenómeno a estudiar estaría atada en vínculos estratégicos de eventos en cadena. En esos casos, los eventos en cadena constituyen la real unidad de análisis por sobre los eventos singulares. Por ejemplo, yo argumentaría que la unidad significativa para entender el conflicto industrial en Italia no es la huelga, concebida como interrupción de trabajo individual, pero sí la disputa, que tal vez incluya no solo uno o más interrupciones de trabajo, sino también diferentes formas de acción colectiva – manifestaciones, concentraciones, asambleas, reuniones de negociación, etc. Gerald Marwell y Pamela Oliver han argumentado en forma similar que una “campaña colectiva” es la unidad de análisis más apropiada en las investigaciones de la acción colectiva y de los movimientos sociales [Marwell y Oliver 1984] por sobre una actividad o evento singular. Al recolectar información sobre la base de técnicas de muestreo con un intervalo mayor que el de la publicación de los periódicos –un día- se arriesga no solo a truncar ciclos sino también a perder eventos dentro de las disputas (o campañas colectivas), además alterando fundamentalmente el conjunto de acciones colectivas. Bajo estas condiciones, el conflicto sería una unidad de muestra más apropiada que el artículo o el tema del periódico.[21] Esto requeriría un poco de trabajo preliminar para identificar el universo de todas las disputas reportadas para probar, pero subsiguientemente ahorraría tiempo en codificar.
En conclusión, en vista del alto costo en la recolección de datos de periódicos, yo recomendaría el siguiente diseño de investigación:
- Depender de uno o posiblemente unos pocos periódicos cuidadosamente seleccionados sobre la base de análisis comparativos preliminares;
- Tomar muestras solo si la naturaleza del fenómeno a estudiar no es propensa a producir datos deformados.
Unidades de medición
Las últimas dos secciones tratan acerca de las cuestiones de cómo un lector decide qué califica para codificar y qué hace un investigador con todos estos datos. Hay dos elecciones involucradas en el proceso de producción de la decisión, implícitas en la primera pregunta. Estas elecciones tratan con la unidad de muestra –la unidad de contexto y la unidad de registro (o codificación).
La unidad de contexto se refiere a la porción del material simbólico que debe ser analizado para caracterizar la unidad de registro, por ejemplo, los ítems y símbolos a ser codificados. Es dentro de la unidad más amplia de contexto que debemos buscar las unidades de registro– una palabra, oración, párrafo, tema, etc. Las unidades de registro están contenidas enteramente en las unidades de contexto. Las unidades de contexto pueden ser a su vez unidades de registro dentro de contextos más amplios.[22] Los artículos constituyen las típicas unidades de contexto. Las unidades sintácticas– sujeto, acción, objetivo- y unidades temáticas son unidades de registro elementales para cualquier evento dado. Las categorías de codificación proveen las unidades temáticas básicas para la recolección. Usualmente, un artículo es una unidad fácilmente identificable con un título (encabezado) y, frecuentemente, un subtítulo. Una noticia corta que aparece bajo tales encabezados como “Resumen de Prensa”, “Actualización”, “Resumen del noticiero”, y por el estilo califican como un artículo. Un artículo podría ser también la captura de una fotografía si la información que esta contiene no aparece en un artículo.
Sin embargo, desde el punto de vista operacional, no siempre es fácil decidir cuándo un artículo califica o no para ser registrado. Con fines ilustrativos, utilicemos nuevamente el conflicto industrial en Italia, por ejemplo, conflictos en los que los trabajadores organizados sean los principales actores. Con esta definición operacional en mano, debería ser fácil decidir qué eventos califican y cuáles no. El problema es que, dadas las características de clase de los sindicatos italianos, los conflictos industriales a menudo conciernen a la política en vez del lugar de trabajo [Pizzorno 1973]. ¿Debería este último tipo de conflicto ser excluido de la recolección de datos? Al excluirlo, se perderían importantes características de los conflictos industriales italianos.
Si nosotros recolectamos también aquellas formas de acción colectiva que van más allá de las razones puramente económicas, ¿qué debería hacerse en aquellos casos donde no son los sindicatos sino el Partido Comunista –la otra gran estructura organizacional de la clase trabajadora italiana- el que organiza las acciones masivas? ¿Debería una acción política colectiva registrarse solo cuando se organizó por los sindicatos o solo cuando está caracterizada por interrupciones laborales? ¿Qué debería hacerse cuando los organizadores, ya sean los sindicatos o el Partido Comunista, protagonizan acciones que no involucran a trabajadores en asuntos relacionados al trabajo (acciones por viviendas, medio ambiente, paz, etc.) o involucran a no trabajadores (por ejemplo, los desocupados o los jubilados)? ¿Qué pasa en una situación donde el liderazgo del movimiento no provenga ni de los sindicatos ni del partido (movimientos civiles por el aborto, divorcio, desarme, etc.)?
Una de muchas soluciones operacionales posibles puede ser la siguiente: codificar todos los artículos que refieran a acciones colectivas donde cualquier número de trabajadores esté presente como actor colectivo y que sea identificado específicamente así (de esa forma) por el periódico, incluso si están es una posición minoritaria e independientemente del tipo de demanda llevada adelante y el tipo y nivel de organización involucrada (sindicatos, partidos políticos, los trabajadores mismos o cualquier otro tipo de organización). Para los casos ambiguos, el nombre del periódico, el número de columna y de página, el tipo de evento y la fecha, se registra en forma separada. Se puede decidir luego cuando estos artículos califican para registrar o deberán ser descartados.
Aunque una complicación posterior es introducida por aquellos artículos que no involucran acciones colectivas de la clase trabajadora fácilmente identificables –huelgas, manifestaciones, asambleas, etc.-. ¿Deberían calificar los artículos que discuten un juicio contra algunos trabajadores por su participación en acciones colectivas en el pasado? ¿Debería calificar un artículo que nos cuenta que una comisión parlamentaria ha sido establecida para investigar las condiciones de trabajo en las fábricas? Esta información puede ser muy útil luego para evaluar las características del sistema de relaciones industriales en Italia. Si este es el caso, deberíamos modificar los criterios de calificación llevados adelante. Los artículos donde los trabajadores aparecen como actores deberían ser codificados, como también aquellos artículos en los que los trabajadores aparecen como referentes y objetivos implícitos o explícitos de otros actores: el estado, la policía, el sistema judicial, los gobiernos central y local, etc.- partidos políticos, o cualquier otro grupo organizado cuyas acciones pueden afectar positiva o negativamente, de una manera significativa, a un conjunto de trabajadores o a la clase trabajadora entera.[23] De nuevo, yo recomiendo mantener definiciones suficientemente amplias que permitan recolectar la mayor cantidad de información relevante posible. El costo económico de esta estrategia es más alto, pero la solución alternativa de trabajar con un umbral más alto tal vez resulte en un costo teórico más alto. Un umbral más alto provee más datos válidos, pero su desventaja es que perdemos generalidad y número de casos. Yo prefiero mantener el umbral bajo durante la fase de recolección de datos y elevarla luego durante la fase de análisis de datos, ejecutando análisis estadísticos en varios niveles umbrales. Lo contrario no sería posible.[24]
En el contexto de un artículo, los codificadores van a identificar uno o más eventos. En el contexto de cada evento, los codificadores identificarán las unidades sintácticas y temáticas elementales. La mejor forma de organizar las unidades de registro es por temas, en lugar de palabras clave. La expresión “la recolección de fondos para los huelguistas” se refiere a un tema general de despliegue práctico de solidaridad de los trabajadores, independientemente de la expresión verbal especifica utilizada por el periódico. Expresiones como “una recolección de contribuciones voluntarias para ser utilizadas como fondo para los huelguistas”, “trabajadores de firmas cercanas han ofrecido su apoyo financiero”, y similares serían todas codificadas bajo la categoría temática “recolección de fondos para huelguistas”. Las categorías temáticas pueden ser más o menos específicas o genéricas. La categoría “comienzo de huelga” claramente es compatible con un rango más estrecho de sinónimos que “están satisfechos con el resultado de la huelga”. En consideración del hecho de que la fiabilidad de los datos recolectados se vincula al diseño de las categorías y al conocimiento de los codificadores sobre qué codificar dentro de cada categoría, el manual de instrucciones de registro debería proveer un gran número de expresiones similares para cada categoría.
Agregando Datos – Unidades de análisis
Como hemos visto, el uso de computadoras para recolectar datos de periódicos ha posibilitado obtener información histórica mucho más rica que la que era posible bajo los marcos tradicionales de codificación. Estos datos son altamente desagregados a lo largo de varias dimensiones – espacio, tiempo, sector/firma/planta (o tipo de organización), y categoría de información. En el grado en que los periódicos provean información sobre el lugar del conflicto, uno podrá tener un mapa geográfico detallado y altamente desagregado del proceso histórico a estudiar (barrio, cuadra, calle). En cuanto al tiempo, los periódicos nunca son muy precisos. Las expresiones típicamente utilizadas para referirse al tiempo son “ayer”, “mañana”, “hace algunos días”, o “al poco tiempo de eso”. El tiempo es raramente definido más precisamente, como “el lunes, 7 de octubre de 1983 a las 10:45 PM”. Los lenguajes matemáticos han provisto de cuantificadores generalizados que permiten registrar en forma precisa incluso las formas más vagas de expresiones temporales [ver Franzosi 1986]. Cuando el tiempo exacto de un evento no está disponible, es todavía posible lograr un ordenamiento parcial en relación a otros eventos. Esto daría como resultado un alto grado de datos desagregados sobre el tiempo –hasta el mismo minuto, si así se hizo referencia en el periódico. En el caso de un conflicto industrial, lo mismo se podría aplicar para las firmas y los sectores económicos; allí donde la información fuese provista, se podrían registrar el sector económico, el grupo, la firma, la planta, y negocio donde se dieron los eventos.
La alta desagregación de datos sobre tiempo y espacio permitirá a los investigadores entender mejor los procesos de movilización involucrados en oleadas de eventos de protesta. Los trabajos pioneros de Eric Hobsbawm y George Rude, Andrew Charleswoth, y los trabajos actuales de Charles Tilly han mostrado que los procesos de difusión a larga escala, como las olas de huelgas u otro comportamiento conflictivo, siguen patrones predictivos tanto de tiempo como de espacio [Hobsbawm y Rude 1968; Charlesworth 1979]. Por ejemplo, en el caso del conflicto industrial, estaríamos interesados en saber que firmas y sectores y que áreas geográficas lideran la lucha o son alcanzadas por esta en cualquier tiempo dado.
Tan alta desagregación de los datos nos permite llevar adelante análisis por territorio (primero recuperar y luego analizar toda la información de Piamonte, por ejemplo, o Milán, o la provincia de Génova), por tiempo (seleccionando toda la información disponible en un periodo dado), por sector (seleccionar toda la información sobre trabajadores textiles), por firma/planta/negocio (recuperar toda la información sobre FIAT), por ítem especifico de información (ej., todos los casos de intervención policial), o por cualquier combinación de las anteriormente citadas (recuperar toda la información de intervenciones policiales en las plantas de FIAT de Turín durante el periodo 1945-1956). La disponibilidad comercial del potente “Relational Data Base Management Systems” (DBMS), como INGRES, ORACLE, DL1, o RDB, hace que recuperar e interrogar información de tan grandes bancos de datos sea muy simple.[25]
Los datos, sin embargo, también pueden ser agregados en varios niveles –espacio y tiempo, sector/firma, o evento.[26] Dependiendo del tipo de información procesada, la agregación tal vez involucre añadir información (ej., número de gente herida, asesinada, arrestada, etc.) por unidad de tiempo (mes, cuatrimestre, año), por unidad espacial (provincia, región, país como un todo), por sector/firma (ej., FIAT o industria química), o por evento (huelga, manifestación, etc.). También puede involucrar la simple acumulación del número de características de los eventos (por ejemplo, la entrega de folletos) o de los mismos eventos. Los análisis luego pueden ser desarrollados en estos varios niveles. Aunque mucho del detalle fino de los datos se pierde a través de la agregación, en algunos casos esto es inevitable si se van a desarrollar análisis de multivariables. En efecto, las variables de otras fuentes tal vez estén disponibles solo en los niveles más altos de agregación (solo publicaciones trimestrales, por ejemplo, están disponibles sobre desempleo). Finalmente, pueden formarse combinaciones de las categorías que proveen diferentes mediciones de un concepto subyacente único (por ejemplo, a través de análisis de factores; algunos paquetes de computadoras como LISREL, aunque permita estimaciones directas de modelos estructurales de ecuaciones utilizando varios indicadores de un concepto subyacente único).
Conclusiones
Este artículo puso a la vista un número de temas involucrados en la recolección de datos de eventos de los periódicos. En resumen, me gustaría destacar unos cuantos puntos concernientes específicamente a la validez y fiabilidad. Primero, una pregunta: ¿son los periódicos datos validos? Mi respuesta es, generalmente no. David Snyder y William Kelly argumentan que los estudios basados en múltiples indicadores de conflicto sean probablemente propensos a ser influenciados, mientras que los estudios basados en formas específicas de conflicto (huelgas, disturbios raciales, etc.) “son generalmente válidos, especialmente cuando se limitan a considerar comportamientos relativamente altos en intensidad [Snyder y Kelly 1977: 117, 121]. A la luz de la anterior discusión, sus dichos parecen demasiado optimistas. Ellos admiten que, al menos en el caso del conflicto industrial –que, de paso, es un indicador individual- hay evidencia de una “drástica influencia en sub reportar” [Snyder y Kelly 1977: 110]. No hay duda de que a mayor intensidad de un evento, mayor es la probabilidad de ser reportado. Además, la validez siempre puede alcanzarse simplemente subiendo el umbral de los eventos. Aunque esto implica perdida de generalidad y de número de casos. Si uno no desea hacer este sacrificio, la pregunta sobre validez se vuelve más problemática.
Discutiría que los datos de eventos recolectados de periódicos parecieran verse afectados por errores sistemáticos y, por lo tanto, no son válidos. Aunque esto no importa mientras especifiquemos la naturaleza de los errores no aleatorios asociados con la validez. Esto probablemente no pueda hacerse en forma exacta, en tanto que estamos lidiando con muestras de eventos no aleatorios extraídos de una población desconocida, pero, a través de las técnicas discutidas arriba podemos realizar juicios informados sobre la dirección y la magnitud del error.
Una segunda pregunta es si los datos recolectados de los periódicos son confiables. Mi respuesta es, generalmente sí. Como hemos visto, la mayoría de los estudios sobre conflictividad realizan muchos esfuerzos para asegurar que cualquier cosa que es reportado por los periódicos sea registrado sin errores. Una pregunta relacionada entonces sería: ¿Vale realmente la pena? Retomemos el ejemplo de Richard Zeller y Edward Carmine de un rifle de amarre sano que en forma repetitiva y constante golpea el mismo punto (perfecta), excepto que no golpea el blanco deseado (cero validez) [Zeller y Carmines 1980]. Es lo suficientemente fácil mover el rifle hasta que golpee el blanco, ya que generalmente lo más reciente está bien definido. Aunque, en el caso de los periódicos, los contornos del blanco son desconocidos, y los investigadores no saben realmente si están dándole correctamente en el blanco o le erran por una pulgada o una milla.
Los investigadores han puesto esfuerzos admirables en la eliminación de los errores aleatorios (fiabilidad) de la recolección de datos de periódicos mientras que generalmente descuidan los errores no aleatorios (validez). Eso es todo, el error no aleatorio (validez) es mucho más probable de distorsionar los datos del periódico que el error aleatorio (fiabilidad). Dado los recursos limitados con los que la mayoría de nosotros nos enfrentamos, la pregunta de validez versus fiabilidad tal vez se convierta en una pregunta de elección entre más validez versus menos fiabilidad. Aunque, espero haber mostrado que niveles más altos de validez pueden ser alcanzados sin sacrificar fiabilidad simplemente al utilizar técnicas más eficientes en la recolección de datos.
En conclusión, ya que los periódicos proveen largos registros de procesos históricos, a veces no disponibles de otra manera y particularmente bien situados para la “formulación sistemática y testeo de hipótesis de investigación” [McAdam 1982: 235] mucho se puede ganar de su uso. Aunque para utilizarlas efectivamente, más atención se le debe dar a los problemas de medición. Mas precisamente, dada la atención desproporcionada que se le da a los problemas de fiabilidad con respecto a los de validez, recomendaría un cambio en el foco de los problemas de fiabilidad a los problemas de validez. La validación de los datos a través de medidas independientes y alternativas debería ser una parte integral de cualquier diseño de investigación que involucre recolección de datos de periódicos. Es solo a través de estos estudios de validación que podemos tener esperanzas de obtener un mejor entendimiento de los contornos del universo de eventos de interés y delinear mapas que vinculen la población y la muestra no aleatoria a mano.
Citas
♠ Tomado de Franzosi, Roberto 1987 The Press as a Source of Socio-Historical Data: Issues in the Methodology of Data Collection from Newspapers. Historical Methods: A Journal of Quantitative and Interdisciplinary History, 20 (1), 1 de enero: 5–16. doi: 10.1080/01615440.1987.10594173. Agradecemos la autorización otorgada por el autor y Taylor & Francis Group para traducir y publicar el presente texto en nuestra revista.
* Roberto Franzosi es Dr. en Sociología por la Universidad Johns Hopkins (1981). Actualmente se desempeña como profesor de Sociología y Lingüística en la Universidad Emory, en Estados Unidos de Norte América. Sus intereses de investigación han estado vinculados al estudio de la protesta social y la violencia y sus relaciones con el lenguaje y la narrativa. Entre sus publicaciones se destacan las siguientes: The Puzzle of Strikes: Class and State Strategies in Postwar Italy (Cambridge University Press 1994); From Words to Number: Narrative, Data, and Social Science (Cambridge University Press 2005); “Content Analysis” (Sage 2008); and “Quantitative Narrative Analysis” (Sage 2009). Correo electrónico: rfranzo@emory.edu
** Profesor de Historia por la UNMdP (Universidad Nacional de Mar del Plata), integrante del GESMar (Grupo de Estudios Marítimos Sociales) y del SISMOS (Seminario de Investigación Sobre el Movimiento de la Sociedad), Argentina.
*** Doctor en Ciencias Sociales por la UBA (Universidad de Buenos Aires). Investigador Adjunto del CONICET (Consejo Nacional de Investigaciones Científicas y Técnicas), IIGG (Instituto de Investigaciones Gino Germani), Argentina.
**** Profesora de Inglés por la Universidad Nacional de Mar del Plata. Maestranda en Práctica Docente. Integrante del Grupo de Investigación en Educación y Estudios Culturales de la Universidad Nacional de Mar del Plata, Argentina.
[1] Para una discusión de los problemas de los datos de huelgas oficiales, ver Shalev [1978].
[2] Para la noción de repertorio ver Tilly [1981].
[3] Ver, por ejemplo, Benson [1978].
[4] Sobre estos temas, para la aplicación específica en conflictos intra-societales, ver el excelente artículo de Jacobson [1973].
[5] Los periódicos han sido utilizados en múltiples estudios comparativos internacionales sobre eventos conflictivos. Ver Rummel [1963, 1965], Russet [1964], Tanter [1966], Feierabend y Feierabend [1966], Bwy [1968], Gurr [1968], Paige [1975]. Sobre estudios nacionales de múltiples eventos de conflictos ver Eisinger [1973], Danzger [1975], Kriesi, Levy, Ganguillet y Zwicky [1981]. Sobre estudios nacionales de eventos conflictivos individuales tales como los disturbios raciales en Estados Unidos, ver Lieberson y Silverman [1965], Bloombaum [1968], Downes [1968], Downes [1970], Wanderer [1969], Spilerman [1970], McAdam [1982]. Para huelgas en Francia, ver Shorter y Tilly [1974]. Para linchamientos en Estados Unidos, ver los recientes trabajos de Spilerman.
[6] Ver también Eisinger [1973].
[7] Tuchman [1973] etiqueta al primer tipo de noticias como “suaves” y al segundo tipo como “duras”; ver también Danzger [1975].
[8] Ver, por ejemplo, McAdam [1982: 237].
[9] Ver también Eco [1971]; Dardano [1973]; Morley [1976].
[10] Danzger argumenta que esta probabilidad es mayor en el caso anterior, mientras que Snyder y Kelly argumentan exactamente lo opuesto. Ver Danzger [1975: 570, 581]; Snyder y Kelly [1977: 119-120].
[11] Ver también McAdam [1982: 235].
[12] Para el problema de errores de medición con referencia específica al análisis de contenido, ver Budd, Thorp y Donohew [1966: 66-71]; Holsti [1969: 127-149]; Krippendorff [1980: 129-168].
[13] Sobre la oportunidad de diseñar el esquema de codificación de tal manera que permita una actualización sencilla, especialmente para proyectos de análisis de contenido que contengan un gran cuerpo de material que no sea fácil o que no esté completamente pre codificable, ver Budd, Thorp y Donohew [1966: 54].
[14] Technical Report 100.5, 9.30.1980:2; para una detallada descripción del proceso de comparación ver Tecnical Reports 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4, y 100.5.
[15] Para más detalles, ver Franzosi [1986]. Sobre la base de estos conceptos, he desarrollado una gramática para recolectar datos desde el periódico sobre conflictos industriales. También desarrollé un programa de computadora (PC-ACE, Program for Computer-Aided Coding of Events) que corre en computadoras y sigue de cerca la gramática.
[16]Sobre este punto ver también Danzger [1975].
[17] Sobre noticias de periódicos sobre tamaños de multitudes, ver Jacobs [1967]; ver también Danzger [1975: 574].
[18] Sobre el problema acerca del muestreo por aceptación, ver American Statistical Association [1950].
[19] Para más mediciones de fiabilidad, ver Krippendorf [1980: 129-54].
[20] Para muestreo en análisis de contenido, ver Budd, Thorp y Donohew [1966: 4-9]; Krippendorf [1980: 65-70].
[21] Uno tal vez se pregunte si el recurso a tales conceptos agregados como disputa o campañas colectivas descalifican a los periódicos como fuentes de datos históricos. La duda es legítima: después de todo, ¿no es verdad que los periódicos solo realizan crónicas de eventos como huelgas, manifestaciones, etc.? Las dos cosas no son mutuamente excluyentes, aunque tal vez lo parezca a primera vista. El hecho de que una disputa sea una unidad de análisis más significativa que una huelga, simplemente significa que la información recolectada en el nivel de eventos discretos deba ser añadid a niveles más altos de agregación; ver también la sección Agregando datos: Unidades de análisis.
[22] Sobre estos puntos ver Budd, Thorp y Donohew [1966: 31-38]; Krippendorf [1980: 57-64].
[23] Sobre unidades referenciales en análisis de contenido, ver Budd, Thorp y Donohew [1966: 61-62].
[24] Para estos puntos, ver también Tilly [1969: 28-31].
[25] “Básicamente (un sistema de base de datos) es nada más que un sistema de registro computarizado, esto es, un sistema cuyo entero propósito es registrar y mantener información”. Citado de Date [1981]. Normalmente, un sistema de base de datos consiste en varios archivos diferentes que contienen información significativa organizada bajo la gestión del potente software DataBase Management Systems (DBMS). Hay tres maneras principales por las cuales DBMS organiza los datos en la base de datos: relacional, jerárquico, en redes. El DBMS relacional, por ejemplo, no solo permite a los usuarios crear bases de datos desde cero, nos permite también realizar inserciones, borrados y modificaciones de entradas. Lo más importante, nos permite realizar consultas, esto es, búsquedas a través de la base de datos para relaciones específicas con el propósito de extraerlas. Además, podríamos realizar consultas de todos los eventos en donde intervino la policía o en qué estado, en sus varios niveles, intervino como árbitro en disputas entre capital/trabajo. También, podríamos realizar consultas de todas las disputas que ocurrieron en determinada firma, territorio o periodo. En efecto, el usuario no debería preocuparse, en cómo DBMS establece los indicadores (los vínculos entre ítems de información) y guarda la información; DBMS hace eso por ella o por él, haciendo que el guardado y el manejo de estructuras de datos complejos sea muy simple. Los vínculos y relaciones explicitas entre símbolos incrustados en una gramática, como se discutió arriba, crea datos de los eventos recolectados utilizando una gramática adecuada para las aplicaciones de DBMS.
[26] Sobre los diferentes niveles en los cuales los análisis de eventos de protesta han sido realizados ver Tilly [1969] y Snyder y Kelly [1977: 105].
Bibliografía
American Statistical Association
1950 Acceptance Sampling. American Statistical Association, Washington, DC.
Benson, Susan Porter
1978 The clerking sisterhood, rationalization and the work culture of saleswomen American department stores, 1890-1960. Radical America, 12:41-55.
Beharrell, Peter y Greg Philo
1977 Trade Unions and the media. MacMillan, London.
Berk, Richard
1983 An introducction to simple selection bias in sociological data. American Sociological Review, 48:386-98.
Bloombaum, Milton
1968 The conditions underlying race riots as portrayed by multidimensional scalogram analysis: A reanalysis of Lieberson and Silverman’s data. American Sociological Review, 33:76-91.
Bowers, David
1967 A report on activity by publishers in directing newsroom decisions. Journalism Quaterly, 1:43-52.
Breed, Warren
1955 Social control in the newsroom: A functional analysis. Social Forces, 33:326-335.
Budd, Richard, Robert Thorp y Lewis Donohew
1966 Content analysis of communications. MacMillan, Nueva York.
Burch, Philip
1972 The managerial revolution reassessed. Health and Co, Lexington (Mass).
Bwy, Douglas
1968 Political instability in Latin America: The cross-cultural test of a casual model. Latin America Research Review, III: 17-67.
Capecchi, Vittorio y Marino Livolsi
1971 La stampa quotidiana in Italia. Bompiani, Milano.
Center for Demography
100.5, 9.30.1980:2; 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4 Technical Report, The University of Wisconsin.
Charlesworth, Andrew
1979 Social protest in a rural society: The spatial diffusion of the Captain Swing disturbances of 1830-1831. Historical Geography Research Series. University of East Anglia. Geo Abstracts Ltd, Norwich.
Chomsky, Noam
1971 Chomsky: Selected readings, J. P. B. Allen and Paul Van Buren (edit.). Oxford University Press, Londres.
Danzger, M. Herbert
1975 Validating conflict data. American Sociological Review, 40: 570-84.
Dardano, Maurizio
1973 Il linguaggio dei giornali italiani. Laterza, Bari.
Date Chris
1981 An introduction to database systems. Adisson-Wesley, Reading, Mass.
De Luna, Giovanni, Nanda Torcellan y Paolo Murialdi
1980 La stampa italiana dalla resistenza agli anni sessanta. Laterza, Bari: 304-308.
Downes, Bryan
1968 Social and political characteristics of riot cities: A comparative study. Social Science Quaterly, 49:504-520.
1970 A critical reexamination of the social and political characteristics of riot cities. Social Science Quaterly, 51:349-360.
Downing, John
1980 The media machine. Pluto Press, Londres.
Eco, Umberto
1971 Guida all’interpretazione del linguaggio giornalistico, en La stampa quotidiana in Italia, Vittorio Capecchi y Marino Livolsi (edit.). Bompiani, Milano.
Eisinger, Peter
1973 The conditions of protest behavior in American cities. American Political Science Review, 67:11-28.
Feierabend, Ivo y Rosalind Feierabend
1966 Aggressive behaviors within polities, 1948-1962: A cross-national study. Journal of Conflict Resolution, 10:249-271.
Franzosi, Roberto
1986 From words to numbers: A generalized and computer-based coding procedure for collecting event-data from newspapers.
Galambos, Louis
1975 Public image about big business, 1880-1940: A quantitative study in social change. The Johns Hopkins University Press, Baltimore.
Gans, Herbert
1980 Deciding what’s news. Vintage Books, Nueva York.
Gitlin, Todd
1980 The whole world is watching. University of California Press, Berkeley.
Glasgow University Media Group
1976 Bad News. Routlege and Kegan Paul, London.
Gurr, Ted Robert
1968 A casual model of civil strife: A comparative analysis using new indices. American Political Science Review, 62:1104-1124.
Hall, Stuart
1977 Culture, the media, and ideological effect, en Mass communication and society, J. Curran, M. Gurevitch and J. Woollacott (edit.). Sage, Beverly Hills.
Hartmann, Paul
1975/76 Industrial relations in the news media. Industrial Relations Journal, 6:4-18.
1979 News and public perceptions of industrial relations. Media, culture and society, I: 255-270.
Heckman, James
1979 Sample selection bias as a specification error. Econometrica, 47:153-161.
Hobsbawm, Eric y George Rude
1968 Captain Swing. W. W Norton & Co., New York.
Hofstetter, C. Richard
1976 Bias in the news. Ohio State University Press, Columbus (Ohio).
Holsti, Ole
1969 Content analysis for the social sciences and humanities. Addison-Wesley, Reading (Mass).
Jacobs, Herbert
1967 To count a crowd. Columbia Journalism Review, 1:37-40.
Jacobson, Alvin
1973 Some theoretical and methodological considerations for measuring intrasocietal conflict. Sociological Methods and Research, 1:439-461.
Kriesi, Hanspeter, R. Levy, G. Ganguillet, y H. Zwicky
1981 Politische Aktivierang in der Schweiz, 1945-1978. Verlag Ruegger, Switzerland.
Krippendorff, Klaus
1980 Content analysis, an introduction to its methodology. Sage, Beverly Hills.
Laswell, Harold, Daniel Lerner y Ithiel de Sola
1952 The comparative study of symbols. Stanford University Press, Stanford.
Lieberson, Stanley y Arnold Silverman
1965 The precipitants and underlying conditions of race riots. American Sociological Review, 30:887-898.
Marwell, Gerald y Pamela Oliver
1984 Collective action theory and social movements research, en Research in social movements, conflicts, and change (Vol. 7), Louis Kriesberg (edit.). JAI Press INC., Londres.
McAdam, Doug
1982 Political process and the development of black insurgency 1930-1970. The University of Chicago Press, Chicago.
Molotoch, Harvey y Marilyn Lester
1974 News as purposive behavior: On the strategic use of routine events, accidents, and scandals. American Sociological Review, 39:101-112.
Morley, David
1976 Industrial conflict and the mass media. Sociological Review, 24.
Murdock, Graham y Peter Golding
1977 Capitalism communications and class relations, en Mass communication and society, James Curran, Michael Gurevitch and Janet Woollacott (edit.). Sage, Beverly Hills.
Nedzynski, Stefan
1973 Inequality in Access to communication facilities for working class organizationsn, en Communications, technology, and social policy, George Gerbner, Larry Gross, and William Melody (edit.). Wiley, Nueva York: 413-423.
Paige, Jeffery
1975 Agrarian revolution. The Free Press, New York.
Pizzorno, Alessandro
1973 I sindacati nel sistema político italiano; aspetti storici, en Il Sistema político Italiano, Paolo Farneti (edit.). Il Mulino, Bolonga.
Rummel, Rudolph
1963 Dimensions of conflict behavior within and between nations. General Systems Yearbook, VIII: 1-50.
1965 A field theory of social action with applications to conflict within nations. General Systems Yearbook, X: 183-211.
Russet, Bruce
1964 Inequality and instability: The relation of land tenure to politics. World Politics, XVI: 442-454.
Shalev, Michael
1978 Lies, Dammed Lies, and Strike Statistics, en The resurgence of class conflict in Western Europe since 1968, Colin Crouch and Alessandro Pizzorno (edit.). MacMillan, Londres.
Shorter, Edward y Charles Tilly
1974 Strikes in France. Cambridge University Press, Cambridge.
Snyder, David y William Kelly
1977 Conflict intensity, media sensitivity, and the validity of newspaper data. American Sociological Review, 42:105-123.
Spilerman, Seymour
1970 The causes of racial disturbances: A comparison of alternative explanations. American Sociological Review, 35:627-649.
Tanter, Raymond
1966 Dimensions of conflict behavior within and between nations 1958-1960. The Journal of Conflict Resolution, X: 41-64.
Tilly, Charles
1969 Methods for the study of collective violence, en Problems in research on community violence, Ralph Conant and Molly Apple Levin (edit.). Praeger, Nueva York.
1981 As Sociology meets history. Academic Press, Nueva York.
Tuchman, Gaye
1973 Making News by Doing Work: Routinizing the Unexpected. American Journal of Sociology, Vol. 79 (1): 110-131.
Wanderer, Jules
1969 An index of riot severity and some correlates. American Journal of sociology, 74:500-509.
Zeller, Richard y Edward Carmines
1980 Measurement in the social sciences, the link between theory and data. Cambridge University Press, Cambridge.
~•~
Cómo citar ¬
Roberto Franzosi, «La prensa como fuente de datos socio-históricos: Cuestiones sobre la metodología de recolección de datos a partir de periódicos», Revista de Estudios Marítimos y Sociales [En línea], publicado el [insert_php] echo get_the_time('j \d\e\ F \d\e\ Y');[/insert_php], consultado el . URL: https://wp.me/P7xjsR-Pv