La prensa como fuente de datos socio-históricos:
Cuestiones sobre la metodología de recolección de datos a partir de periódicos

The Press as a Source of Socio-His­tor­i­cal Data: Issues in the Method­ol­o­gy of Data Col­lec­tion from News­pa­pers

Rober­to Fran­zosi*

Tra­duc­ción: Daniel Nicolás Rabi­no**                     Revisión: Agustín San­tel­la*** y Luciana Salan­dro****

Introducción

Los cien­tí­fi­cos sociales involu­cra­dos en inves­ti­ga­ciones cuan­ti­ta­ti­vas de carác­ter empíri­co sue­len estar rel­a­ti­va­mente despre­ocu­pa­dos por los prob­le­mas de medición. La may­oría pre­fiere comen­zar inmedi­ata­mente con esti­ma­ciones estadís­ti­cas y la con­struc­ción de teoría. Esto es par­tic­u­lar­mente cier­to en relación a los inves­ti­gadores que uti­lizan estadís­ti­cas ofi­ciales recolec­tadas por el gob­ier­no. El hecho de que estas estadís­ti­cas estén impre­sas en pub­li­ca­ciones ofi­ciales las hace irre­prochables. En todo caso, al uti­lizar estadís­ti­cas ofi­ciales, sen­ti­mos que el prob­le­ma no es nue­stro, ya que no recolec­ta­mos la infor­ma­ción nosotros mis­mos. En el mejor de los casos, los prob­le­mas de medición son recono­ci­dos en notas de pági­na o apéndices metodológi­cos difí­ciles de encon­trar. La lit­er­atu­ra cuan­ti­ta­ti­va sobre huel­gas es un buen ejem­p­lo. Se ha real­iza­do una gran can­ti­dad de inves­ti­ga­ciones uti­lizan­do estadís­ti­cas guber­na­men­tales de huel­gas des­de comien­zos de este siglo; pero, a pesar de la baja cal­i­dad de estos datos, se le ha dado poca aten­ción a los prob­le­mas de medición.[1]

Es más difí­cil igno­rar com­ple­ta­mente los prob­le­mas de medición cuan­do recolec­ta­mos nue­stros pro­pios datos, ya que nos sen­ti­mos oblig­a­dos por lo menos a describir los pro­ced­imien­tos de recolec­ción. Gen­eral­mente, no vamos más allá de eso. Las inves­ti­ga­ciones cuan­ti­ta­ti­vas de acción colec­ti­va y vio­len­cia colec­ti­va brin­dan un buen ejem­p­lo –la may­oría de estas inves­ti­ga­ciones se basaron en fuentes pri­marias extraí­das de per­iódi­cos. Pero, inclu­so en esta lit­er­atu­ra, los prob­le­mas de medición han “recibido sólo una con­sid­eración sim­bóli­ca” [Sny­der y Kel­ly 1977]. Esto impi­de ver las for­mas en que los pro­ce­sos de medición puedan afec­tar los resul­ta­dos de los análi­sis estadís­ti­cos, y en últi­ma instan­cia, nues­tras con­clu­siones teóri­c­as.

En este tex­to, analizaré var­ios aspec­tos involu­cra­dos en la recolec­ción de datos prove­nientes de per­iódi­cos. La primera parte se encar­gará especí­fi­ca­mente de los aspec­tos rela­ciona­dos con los errores de medición (val­i­dación y selec­ción de mues­tras par­ciales, dis­eños de pro­ced­imien­tos de cod­i­fi­cación y fia­bil­i­dad entre cod­i­fi­cadores). La segun­da sec­ción ofrece algu­nas sug­eren­cias sobre la selec­ción de las mues­tras de per­iódi­cos para ser usadas como fuentes y su fre­cuen­cia de lec­tura. Tam­bién se dis­cu­tirán las diver­sas unidades de medición y análi­sis.

Este tex­to se basa prin­ci­pal­mente en mi inves­ti­gación actu­al sobre la con­flic­tivi­dad en Italia, basa­da en infor­ma­ción de per­iódi­cos; sin embar­go, las defini­ciones de los prob­le­mas involu­cra­dos y las solu­ciones prop­ues­tas son gen­eral­mente vál­i­das. La prin­ci­pal recomen­dación de este tex­to es que se le debería dar más énfa­sis a los prob­le­mas de val­i­dación que a los de fia­bil­i­dad. La mag­ni­tud de los errores gen­er­a­dos por prob­le­mas de val­i­dación es prob­a­ble­mente mucho may­or que los prob­le­mas de fia­bil­i­dad. Pero, gen­eral­mente se le pres­ta may­or aten­ción a los prob­le­mas de fia­bil­i­dad, prob­a­ble­mente a causa de la creen­cia gen­er­al­iza­da de que los inves­ti­gadores no pueden hac­er nada para super­ar los efec­tos de los ses­gos de infor­ma­ción (validez) pro­duci­dos por los per­iódi­cos. Las téc­ni­cas dis­cu­ti­das en este tex­to ofre­cen varias solu­ciones poten­ciales a los prob­le­mas de val­i­dación de nue­stros datos.

Errores de medición
Validez y fiabilidad en los datos de eventos periodísticos

“La medición se pre­ocu­pa por el prob­le­ma de vin­cu­lar con­cep­tos abstrac­tos con indi­cadores empíri­cos” [Zeller y Carmines 1980]. Hay dos com­po­nentes para cualquier prob­le­ma de medición, uno teóri­co y otro empíri­co. El com­po­nente teóri­co de la medición se apli­ca a la relación entre indi­cadores empíri­cos y con­cep­tos teóri­cos. Por ejem­p­lo, la lit­er­atu­ra sobre even­tos se intere­sa por los con­cep­tos abstrac­tos como “lucha de clase”, “agitación políti­ca” y sim­i­lares. ¿Qué es lo que los cien­tí­fi­cos sociales tienen en mente cuan­do pien­san en la “lucha de clases”? ¿Serán los even­tos de gran escala que son tan car­ac­terís­ti­cos del reper­to­rio de acción colec­ti­va de los tra­ba­jadores como las huel­gas, las man­i­festa­ciones, las mar­chas y los mítines?[2] ¿O están pen­san­do en for­mas de con­flic­to más sub­ter­ráneas, difí­ciles de detec­tar des­de afuera, pero cuyos sig­nifi­ca­dos sociales son bas­tante claros para los indi­vid­u­os involu­cra­dos?[3] Además, dada la var­iedad de for­mas especí­fi­cas de “lucha de clase” ¿puede un solo indi­cador (huel­gas por ejem­p­lo) servir para proveer una medi­da ade­cua­da, o sería mejor uti­lizar múlti­ples indi­cadores? Si fuese así, ¿cómo podría uno entonces analizar­los?[4]

La pre­gun­ta es: ¿Has­ta qué pun­to los indi­cadores empíri­cos elegi­dos miden el con­cep­to para el que fueron dis­eña­dos? El con­cep­to de validez se refiere a la noción de “un instru­men­to que mide exac­ta­mente lo que supues­ta­mente debe medir y nada más” [Zeller y Carmines 1980]. Otra for­ma de decir esto es que la validez se refiere al gra­do del error sis­temáti­co involu­cra­do en el pro­ce­so de medición; un ter­mómetro no sería un instru­men­to váli­do para medir la pre­sión san­guínea en lugar de la tem­per­atu­ra cor­po­ral [Zeller y Carmines 1980]. De igual man­era, las huel­gas gen­erales podrían no proveer una bue­na medición del gra­do del con­flic­to de clase pre­sente en la sociedad en cualquier con­tex­to históri­co.

Los pro­ce­sos que inter­vienen en opera­cionalizar y en dar­le rep­re­sentación empíri­ca a con­cep­tos abstrac­tos refieren al com­po­nente empíri­co de medición. Al respec­to, la pre­gun­ta es: habi­en­do acep­ta­do las huel­gas, por ejem­p­lo, como un buen indi­cador empíri­co del con­flic­to de clase, ¿se ha intro­duci­do algún error al medirlas? El foco de aten­ción aquí es el error aleato­rio y el con­cep­to que ofrece diál­o­go con él es el de fia­bil­i­dad. “La fia­bil­i­dad da cuen­ta del gra­do de repeti­ción y con­sis­ten­cia de las mediciones empíri­c­as” [Zeller y Carmines 1980].

Aunque la validez refiere gen­eral­mente al gra­do en que un indi­cador mide un con­cep­to abstrac­to, los prob­le­mas de validez sur­gen en difer­entes nive­les de abstrac­ción. Por ejem­p­lo, la validez tal vez se refiere al gra­do en que las huel­gas proveen una bue­na medi­da del con­flic­to de clase. A un niv­el más con­cre­to, habi­en­do elegi­do a las huel­gas como una medi­da vál­i­da del con­flic­to de clase, la validez refiere al gra­do en que los archivos poli­ciales, las estadís­ti­cas de huel­gas ofi­ciales o los per­iódi­cos proveen indi­cadores vali­dos de huel­gas. ¿Cuán acer­tadas son estas fuentes en su reg­istro de las huel­gas? ¿Qué for­ma de par­cial­i­dad sis­temáti­ca intro­ducen? En ref­er­en­cia a los per­iódi­cos, ¿son algunos even­tos más sus­cep­ti­bles o posi­bles de ser repor­ta­dos que otros? ¿Cuáles son las car­ac­terís­ti­cas de estos even­tos? Estas son las pre­gun­tas de validez que me concier­nen especí­fi­ca­mente y que voy a inten­tar respon­der.

La prensa como fuente de datos socio-históricos. El problema de la validez de los informes

Los per­iódi­cos han sido con­sid­er­a­dos por his­to­ri­adores y cien­tí­fi­cos sociales, en for­ma gen­er­al, como fuentes infor­males de datos históri­cos. Aunque, en inves­ti­ga­ciones sociales recientes, los per­iódi­cos han sido uti­liza­dos sis­temáti­ca­mente como fuente de datos. Por ejem­p­lo, Philip Burch uti­lizó per­iódi­cos sem­anales y diar­ios entre los años 1950 y 1971 para eval­u­ar el gra­do de con­trol geren­cial en las grandes cor­po­ra­ciones. Louis Galam­bos acud­ió a los per­iódi­cos para estu­di­ar los cam­bios en la acti­tud de la opinión públi­ca acer­ca de los grandes nego­cios durante el cam­bio de siglo [Burch 1972]. Sin embar­go, es en el estu­dio de la acción colec­ti­va y de vio­len­cia políti­ca donde los per­iódi­cos fueron más uti­liza­dos como fuentes de datos.[5]

El prob­le­ma en uti­lizar la pren­sa como fuente de datos sobre even­tos, es que la validez de la infor­ma­ción de parte de los per­iódi­cos es cues­tion­able. Se ha argu­men­ta­do que los per­iódi­cos difieren ampli­a­mente en sus reportes y cober­turas de noti­cias [Capec­chi y Livol­si 1971; Glas­gow Uni­ver­si­ty Media Group 1976; Kegan y Hart­mann 1975/76] y que, en todo caso, las noti­cias son par­ciales y selec­ti­vas [Breed 1955; Bow­ers 1967, 1973; Gans 1980]. La selec­tivi­dad ha sido vista como pro­duc­to de la pro­fe­sion­al­ización del peri­odista, con sus pro­pios están­dares de obje­tivi­dad reforza­dos por cri­te­rios autónomos para entre­namien­to, reclu­tamien­to e imper­a­tivos de pro­mo­ción com­er­ciales, restric­ciones de espa­cio y tiem­po, y lim­ita­ciones impues­tas por la estruc­tura orga­ni­za­cional de las salas de noti­cias [Gitlin 1980]. De for­ma más extrema, Har­vey Molo­toch y Mar­i­lyn Lester [1974] “ven a los medios masivos de comu­ni­cación como el refle­jo, no del mun­do, sino de las prác­ti­cas de aque­l­los que tienen el poder para deter­mi­nar las expe­ri­en­cias de los otros”. Argu­men­tos sim­i­lares han sido expre­sa­dos por algunos estu­diosos que tra­ba­jan con la tradi­ción gram­s­ciana de hege­monía e ide­ología cul­tur­al. Estos estu­diosos ven tan­to a los per­iódi­cos como a los medios masivos de comu­ni­cación como partes inte­grales del apara­to ide­ológi­co de las sociedades cap­i­tal­is­tas y una de las prin­ci­pales agen­cias para la repro­duc­ción de estas sociedades a través de su inter­pretación, embal­a­je y dis­tribu­ción de la real­i­dad en toda la sociedad [Gitlin 1980]. De acuer­do a esta escuela de pen­samien­to, la selec­ción de noti­cias no es aleato­ria ‑refle­ja las inten­ciones, vol­un­tades e intere­ses de los gru­pos económi­cos dom­i­nantes [Hall 1977]. La cober­tu­ra de noti­cias rep­re­sen­ta de man­era errónea par­tic­u­lar­mente las cues­tiones lab­o­rales y de clase [Capec­chi y Livol­si 1971; Nedzyn­s­ki 1973; Glas­gow Uni­ver­si­ty Media Group 1976; Mor­ley 1976; Behar­rell y Phi­lo 1977; Mur­dock y Gold­ing 1977; Hart­mann 1979; Down­ing 1980].

Si estas críti­cas son acep­tadas, tam­bién deberíamos pre­gun­tarnos si los “hal­laz­gos en con­flic­tos pueden ser de hecho artilu­gios de patrones de pub­li­cación de noti­cias” [Danzger 1975]. La pre­gun­ta aquí es si anal­izamos patrones de even­tos históri­cos o patrones de reportes de noti­cias [Danzger 1975; Tilly 1969]. Aunque esta es una pre­gun­ta seria y dañi­na, ya que apun­ta a la poten­cial con­t­a­m­i­nación entre el fenó­meno de interés y los pro­ced­imien­tos para reg­is­trar­lo, hay varias razones para ser opti­mis­tas.

Primero, más allá de las lim­ita­ciones de los per­iódi­cos como fuentes de datos históri­cos, a menudo con­sti­tuyen la úni­ca fuente de infor­ma­ción disponible. En su estu­dio sobre las rev­olu­ciones agrarias, Jef­frey Paige [1975] escribe, “ningu­na com­pi­lación de even­tos, tal cual están definidos en esta mono­grafía (como una acción o serie de acciones colec­ti­vas en el sec­tor de la agri­cul­tura de exportación) está disponible, por lo que fue nece­sario para com­putar la can­ti­dad de even­tos uti­lizar las fuentes peri­odís­ti­cas”.[6] La exclusión de los datos peri­odís­ti­cos impediría inves­ti­ga­ciones en cam­pos donde no hay datos alter­na­tivos disponibles [McAdam 1982].

Segun­do, mien­tras hay prob­le­mas con la pren­sa como fuente de datos históri­cos sobre con­flic­tos, deberíamos recor­dar que no hay fuentes de datos sin errores, incluyen­do las estadís­ti­cas ofi­ciales [Shalev 1978]. En la ausen­cia de val­i­da­ciones sis­temáti­cas y com­par­a­ti­vas, no hay razón a pri­ori para creer que los datos recogi­dos de per­iódi­cos serán menos vali­dos que otras fuentes común­mente uti­lizadas.

Ter­cero, no todos los even­tos o artícu­los de infor­ma­ción son igual­mente mal­in­ter­pre­ta­dos en la pren­sa. Algu­nas noti­cias parecier­an estar más afec­tadas por las políti­cas edi­to­ri­ales.[7] Por ejem­p­lo, los per­iódi­cos gen­eral­mente con­cuer­dan en sus reportes en el tipo de acción involu­cra­da (huel­ga, demostración, sen­ta­da, etc.), su local­ización y fecha, la iden­ti­dad gen­er­al de los par­tic­i­pantes (tra­ba­jadores, estu­di­antes, negros, policía, etc.) y si la gente fue arresta­da, las­ti­ma­da o asesina­da. Aunque pareciera que habrá varia­ciones en sus reportes acer­ca de las razones que le dan a la acción de la gente o la respon­s­abil­i­dad dada a cier­tos gru­pos (tra­ba­jadores con­tra policía, por ejem­p­lo) por acciones especí­fi­cas (daño a la propiedad o vio­len­cia) a gru­pos en par­tic­u­lar, más que a otros gru­pos (tra­ba­jadores o policías).[8] La inter­pretación de los even­tos, tal cual fueron expre­sa­dos por las edi­to­ri­ales o algu­nas veces mez­cla­dos con los reportes de hechos con­cre­tos, son par­tic­u­lar­mente sus­cep­ti­bles a influ­en­cias. Diver­sos tipos de acciones con­flic­ti­vas tam­bién tienen diver­sas prob­a­bil­i­dades de ser repor­ta­dos. Por ejem­p­lo, David Sny­der y William Kel­ly argu­men­tan que “por razones de tamaño, vio­len­cia e impacto políti­co”, las guer­ras civiles, golpes de esta­dos y arrestos masivos son repor­ta­dos más exhaus­ti­va­mente que los exil­ios, arrestos de per­sonas insignif­i­cantes, cri­sis den­tro de orga­ni­za­ciones no guber­na­men­tales o huel­gas [Sny­der y Kel­ly 1977: 109–110].

Cuar­to, tal cual indi­can Sny­der y Kel­ly, la prob­a­bil­i­dad de errores en los reportes siem­pre puede reducirse ele­van­do el umbral mín­i­mo de recolec­tores (50 indi­vid­u­os en vez de 10, actuan­do colec­ti­va­mente) [Tilly 1969: 29–30; Sny­der y Kel­ly 1977: 109]. La may­oría de los estu­dios sobre la cober­tu­ra de medios de comu­ni­cación está de acuer­do con que los even­tos a gran escala difí­cil­mente pasen desapercibidos en los medios.

Final­mente, el tipo de influ­en­cias que más común­mente puede ocur­rir en los medios masivos de comu­ni­cación con­siste, más en el silen­cio o en el énfa­sis, que en dar fal­sa infor­ma­ción. Como dicen Vit­to­rio Capec­chi y Mari­no Livol­si:

La distorsión de noticias no opera demasiado a través de una alteración obvia de un evento (por ejemplo: la noticia de que “A ama a B” reportada por un diario de derecha y que aparece como “A odia a B” es un diario de izquierda), sino más bien a través de la bajada de línea como de la insistencia en algunas características de un evento [Capecchi y Livolsi, 1971: 264].

La infor­ma­ción se manip­u­la a través del uso de adje­tivos, la fre­cuen­cia de cier­tos sus­tan­tivos, el uso de sinón­i­mos y paráfra­sis, comen­tar­ios y edi­to­ri­ales, y títu­los y sub­tí­tu­los, des­de el énfa­sis en algu­nas car­ac­terís­ti­cas de un even­to a la omisión de otras, y la rup­tura de la infor­ma­ción y su recon­struc­ción de una for­ma que sug­iere rela­ciones causales pre­cisas.[9] El lengua­je es la her­ramien­ta de manip­u­lación mediáti­ca, “el sonido de ambi­ente que ampli­fi­ca o reduce las reac­ciones emo­cionales del lec­tor, y que sub­raya las car­ac­terís­ti­cas pos­i­ti­vas o neg­a­ti­vas que el per­iódi­co atribuye a un actor en par­tic­u­lar” [Capec­chi y Livol­si 1971: 270]. Así el pre­juicio de los per­iódi­cos ten­dría menos que ver con el vín­cu­lo del obje­to de infor­ma­ción con la real­i­dad que con la prob­a­bil­i­dad de que un obje­to de infor­ma­ción aparez­ca una o más veces en uno o más artícu­los con­cernientes a un even­to. Por con­sigu­iente, al uti­lizar la pren­sa como una fuente de datos históri­cos, tomamos el ries­go de recolec­tar insu­fi­ciente, en vez de defec­tu­osa, infor­ma­ción. En este sen­ti­do, el prob­le­ma puede ser menos severo de lo que las inves­ti­ga­ciones sobre medios nos han lle­ga­do a hac­er creer.

El sesgo en la elección de la muestra. El problema y algunas soluciones

Como hemos vis­to, los datos recolec­ta­dos de los per­iódi­cos sue­len care­cer de validez en cier­tas for­mas no aleato­rias. Como con­se­cuen­cia, esos datos pueden no con­sid­er­arse como un sub­con­jun­to aleato­rio de una población de even­tos. Al final, esto sig­nifi­ca que los test estadís­ti­cos por infer­en­cia que nos per­miten gen­er­alizar los resul­ta­dos a par­tir de una mues­tra a toda una población no son aplic­a­bles. No podemos sim­ple­mente igno­rar el prob­le­ma pre­ten­di­en­do no gen­er­alizar los resul­ta­dos de la mues­tra al uni­ver­so [Berk 1983: 396]. La exclusión sis­temáti­ca de una parte de las obser­va­ciones intro­duce errores de especi­fi­cación que influyen en la relación entre las vari­ables en el mod­e­lo. La direc­ción y el peso de estas influ­en­cias no son fáciles de pre­de­cir. “La difi­cul­tad es que uno arries­ga con­fundir el fenó­meno sub­stan­ti­vo de interés con el pro­ce­so de selec­ción” [Berk 1983: 391]. ¿Refle­jaría un incre­men­to del 10% en la fre­cuen­cia de reportes de deter­mi­na­dos even­tos ten­den­cias reales sim­i­lares, o este incre­men­to solo responde a un interés repenti­no de los medios? De man­era sim­i­lar, “la fal­ta de con­flic­tos repor­ta­dos tal vez no sig­nifi­ca que los con­flic­tos no ocur­rieron… los reportes de per­iódi­cos pueden ser acep­ta­dos como datos de que el even­to ocur­rió, pero la ausen­cia de reportes no puede tomarse como indi­cador de que los even­tos no ocur­rieron” [Danzger 1975: 570, 581].

Por supuesto, si el niv­el de infor­ma­ción errónea fuese con­stante a través de varias unidades de agre­gación de datos (tiem­po, espa­cio, sec­tor económi­co u otro), el prob­le­ma no sería tan serio. Jef­frey Paige, por ejem­p­lo, fue capaz de mostrar que hubo acuer­dos con­sid­er­ables en la dis­tribu­ción espa­cial y sec­to­r­i­al de los even­tos entre pren­sa pri­maria (local) y secun­darias (inter­na­cional) para los casos de Perú y Ango­la, a pesar del gran número de even­tos reg­istra­dos en la pren­sa local [Paige 1975]. Aunque, en gen­er­al, la evi­den­cia disponible parece indicar que los patrones tem­po­rales y espa­ciales de las noti­cias peri­odís­ti­cas no se cor­re­spon­den con los patrones de la vida real. Por ejem­p­lo, se ha argu­men­ta­do que los desór­denes raciales ocur­ri­dos en ciu­dades con o sin expe­ri­en­cias pre­vias de con­flic­tos raciales tienen difer­entes prob­a­bil­i­dades de ser repor­ta­dos, dis­tor­sio­n­an­do así la dis­tribu­ción geográ­fi­ca de los even­tos.[10]

Además, es prob­a­ble que haya difer­en­cias geográ­fi­cas inter­na­cionales y nacionales al momen­to de repor­tar. Primero, la posi­ción geopolíti­ca de un país y el interés del mun­do en sus asun­tos domés­ti­cos así como tam­bién la pres­en­cia de la cen­sura de medios podrían afec­tar la prob­a­bil­i­dad de repor­tar los even­tos que ocur­ren en ese país, por la pren­sa inter­na­cional [Rum­mel 1963; Tan­ter 1966]. Inclu­so las cober­turas de even­tos nacionales sufren par­cial­i­dad geográ­fi­ca. Por ejem­p­lo, David Sny­der y William Kel­ly “se dieron cuen­ta de que muy pocas protes­tas ocur­ri­das en las ciu­dades del oeste de Esta­dos Unidos aparecían en el New York Times” [Sny­der y Kel­ly 1977: 119–120]. Ambos, los patrones geográ­fi­cos y tem­po­rales, son prob­a­ble­mente dis­tor­sion­a­dos por la pren­sa. De nue­vo, Sny­der y Kel­ly argu­men­tan que, en el largo pla­zo, hay una relación en U inver­ti­da entre la fre­cuen­cia y los even­tos con­flic­tivos [Sny­der y Kel­ly 1977: 119–120]. Aunque sería difí­cil especi­ficar cuán­tos días, meses o años tomarían para que el largo pla­zo fun­cione, Sny­der y Kel­ly apun­tan a un impor­tante aspec­to del reporte de los con­flic­tos, que los patrones tem­po­rales de los informes peri­odís­ti­cos no serían sin­cróni­cos con los patrones de even­tos históri­cos.[11]

Para resolver el prob­le­ma de la selec­ción de mues­tras par­ciales des­de el pun­to de vista estadís­ti­co, nece­si­taríamos un mod­e­lo de la deter­mi­nación de la par­cial­i­dad, es decir, una teoría de la selec­ción. Si la infor­ma­ción sep­a­ra­da estu­viese disponible en ambos sub­con­jun­tos, el selec­ciona­do y el no selec­ciona­do, sería posi­ble esti­mar un mod­e­lo estruc­tur­al for­mal de ecuación con una ecuación “sub­stan­ti­va” y una ecuación “par­cial” [Heck­man 1979; Berk 1983]. Desafor­tu­nada­mente, en el caso de recolec­tar even­tos de protes­ta a par­tir de per­iódi­cos, no pareciera que una ecuación for­mal de la mues­tra de selec­ción de par­cial­i­dad pud­iese ser esti­ma­da. En gen­er­al, sabe­mos demasi­a­do poco acer­ca de los mecan­is­mos de selec­ción de noti­cias. Aunque sería posi­ble aplicar el pro­ced­imien­to de cor­rec­ción para even­tos selec­ciona­dos o peri­o­dos de mues­tra selec­ciona­dos para los cuales fuentes alter­na­ti­vas de infor­ma­ción estén disponibles. En otros casos, es posi­ble que sim­ple­mente incluyen­do en el mod­e­lo medi­das en las local­iza­ciones de los cor­re­spon­s­ables de los per­iódi­cos locales pudiera mejo­rar el poder explica­ti­vo del mod­e­lo [Danzger 1975; ver, no obstante, Sny­der y Kel­ly 1977].

Más allá de que el prob­le­ma de la selec­ción de mues­tra par­cial puede ser resuel­to for­mal­mente en un mod­e­lo estadís­ti­co o no, se le debería dar más aten­ción a este asun­to del que se le da nor­mal­mente en la lit­er­atu­ra de protes­ta. Como mín­i­mo, recomien­do la real­ización de recolec­ciones para­le­las de infor­ma­ción de “con­trol”, inclu­so solo por un sub­con­jun­to del total del peri­o­do de mues­tra, dis­tribu­ción geográ­fi­ca y tipos de even­tos de interés. El propósi­to gen­er­al de recoger infor­ma­ción de con­trol poco difiere en espíritu de las téc­ni­cas común­mente uti­lizadas en encues­tas de inves­ti­gación para recoger tan­ta infor­ma­ción como sea posi­ble sobre los no encues­ta­dos. Inves­ti­ga­ciones cuida­dosas sobre las car­ac­terís­ti­cas de los encues­ta­dos ver­sus no encues­ta­dos son de mucha ayu­da en eval­u­ar la validez de nues­tras infer­en­cias. Tales inves­ti­ga­ciones son prác­ti­cas están­dar en las inves­ti­ga­ciones por encues­tas, pero rara­mente se encuen­tran en los estu­dios sobre even­tos históri­cos. Especí­fi­ca­mente, sug­eriría recolec­tar la sigu­iente infor­ma­ción de “con­trol”.

Primero, los inves­ti­gadores que se ded­i­can a peri­o­dos históri­cos que incluyan el pre­sente deberían estable­cer pro­ced­imien­tos de reg­istro inde­pen­di­ente, inclu­so si fuese solo por un pequeño sub­con­jun­to de un ter­ri­to­rio de interés y por un lim­i­ta­do peri­o­do de tiem­po. Empleadores, sindi­catos locales y aso­ciación de empleadores, depar­ta­men­tos de policía, u orga­ni­za­ciones de dere­chos civiles, pueden ser per­sua­di­dos a recolec­tar y proveer infor­ma­ción valiosa “de acuer­do con están­dares acept­a­bles para los inves­ti­gadores” [Tilly 1969: 31]. La infor­ma­ción así recogi­da podría entonces ser com­para­da con la infor­ma­ción repor­ta­da por los per­iódi­cos.

Segun­do, por lo menos para estu­dios sobre con­flic­tos indus­tri­ales, la infor­ma­ción de algu­na empre­sa sig­ni­fica­ti­va repor­ta­da por la pren­sa podría com­para­rse con la infor­ma­ción recolec­ta­da por las empre­sas mis­mas (en la medi­da en estas ten­gan la vol­un­tad de abrir sus reg­istros a los inves­ti­gadores). La ven­ta­ja de este abor­da­je por sobre la ante­ri­or es que ofrece una dimen­sión históri­ca poten­cial, ya que las empre­sas podrían ten­er archivos de con­flic­tos a lo largo del tiem­po. La desven­ta­ja es que la mues­tra de las empre­sas cuya infor­ma­ción podría usarse (más allá de la vol­un­tad de las empre­sas para habil­i­tar esa infor­ma­ción) lo más prob­a­ble es que sea par­cial a favor de las grandes fir­mas. Es menos prob­a­ble que las pequeñas o medi­anas fir­mas ten­gan infor­ma­ción sobre huel­gas.

Una ter­cera aprox­i­mación aprovecharía cualquier otra enu­meración pre­ex­is­tente de even­tos, en la medi­da en que estas lis­tas sean real­mente inde­pen­di­entes y que no proven­gan de la mis­ma fuente peri­odís­ti­ca. Muy a menudo, como obser­va Her­bert Danzger, “lo que parecier­an ser fuentes numerosas son tras un exa­m­en cer­cano, pri­mari­a­mente la mis­ma fuente con difer­ente dis­fraz” [Danzger 1975: 573]. Anuar­ios, pro­ced­imien­tos de la corte, resul­ta­dos de inves­ti­ga­ciones de un comité par­la­men­tario ad hoc, encues­tas de agen­cias espe­cial­izadas en la recolec­ción infor­ma­ción, y por supuesto, archivos poli­ciales (a pesar de que estos últi­mos gen­eral­mente no están abier­tos al públi­co para las décadas más recientes) pueden proveer infor­ma­ción útil [Tilly 1969: 23–24, 30]. Asimis­mo, en el caso del con­flic­to indus­tri­al en Italia, com­para­ciones día a día de los even­tos de huel­ga recolec­ta­dos de per­iódi­cos se podrían com­parar sis­temáti­ca­mente con los casos repor­ta­dos por ISTAT, la agen­cia guber­na­men­tal ofi­cial de estadís­ti­cas, des­de 1976 cuan­do ISTAT comen­zó a guardar diari­a­mente los datos de huel­gas en cin­tas mag­néti­cas.

Cuar­to, deberían hac­erse com­para­ciones per­iódi­cas sis­temáti­cas a lo largo de var­ios diar­ios de difer­entes posi­ciones ide­ológ­i­cas y peri­odís­ti­cas. Inclu­so una sem­ana cada tres o cin­co años sería sufi­ciente; con­sul­tan­do var­ios diar­ios, inclu­so por tan cor­to peri­o­do de mues­tra y con ese inter­va­lo de muestreo tan largo seríamos capaces de medir el efec­to de uti­lizar solo un diario del tipo de dato recolec­ta­do. Además, las com­para­ciones sis­temáti­cas en difer­entes pun­tos en el tiem­po ayu­darían a mon­i­tore­ar los cam­bios en el gra­do de cober­tu­ra de la fuente selec­ciona­da para el análi­sis.

Final­mente, si las defini­ciones que cal­i­f­i­can los even­tos para recolec­tar han sido man­tenidas sufi­cien­te­mente amplias, se pueden realizar análi­sis sep­a­ra­dos a var­ios nive­les de umbrales. Los resul­ta­dos estadís­ti­cos obtenidos en los nive­les de umbral más altos, y con­se­cuente­mente a nive­les más altos de validez, entonces pueden ser uti­liza­dos como varas de medición con­tra las cuales puedan com­para­rse los resul­ta­dos obtenidos en nive­les más bajos [Tilly 1969: 23–24, 30].

Como escribió Charles Tilly, “las com­para­ciones entre even­tos de per­iódi­cos y otras fuentes desan­i­man cualquier esper­an­za de arrib­ar a la “mis­ma” lista de dis­tur­bios de estas diver­sas fuentes, pero sí indi­can que los per­iódi­cos proveen la más com­ple­ta enu­meración y de que sus pre­juicios prin­ci­pales se diri­gen sobre todo a sobre-repor­tar even­tos en grandes ciu­dades” [Tilly 1969: 23–24, 30]. De nue­vo, el propósi­to en estos esfuer­zos en la recolec­ción inde­pen­di­ente de datos, no es lle­gar a una enu­meración de even­tos lo más cer­cana posi­ble a los even­tos de la población, que de por sí sería lo más deseable, sino para desar­rol­lar una mejor com­pren­sión de las car­ac­terís­ti­cas de los even­tos en la mues­tra del per­iódi­co. La recolec­ción de datos com­par­a­tivos debería ser una parte inte­gral del dis­eño de proyec­tos de inves­ti­ga­ciones que involu­cren recolec­ción de datos peri­odís­ti­cos.

Esquemas de codificación y fiabilidad del registro

Has­ta este pun­to, he trata­do prin­ci­pal­mente con prob­le­mas de validez de datos (o el error sis­temáti­co de los reportes de per­iódi­cos). En las apli­ca­ciones especí­fi­cas involu­cradas en uti­lizar datos de per­iódi­cos, los errores gen­er­a­dos por prob­le­mas de validez parecier­an eclip­sar a los prob­le­mas gen­er­a­dos por la fia­bil­i­dad. No obstante, hay al menos dos fuentes de errores aleato­rios (con­fi­a­bil­i­dad) involu­cra­dos en recolec­tar datos de per­iódi­cos, que se pro­ducen de los errores de tran­scrip­ción o reg­istro. Ocur­ren cuan­do 1) los cod­i­fi­cadores inter­pre­tan errónea­mente uno o más ítems de la infor­ma­ción con­teni­da en un artícu­lo de per­iódi­co (los errores de cod­i­fi­cación rela­ciona­dos al prob­le­ma más gen­er­al de con­fi­a­bil­i­dad entre difer­entes cod­i­fi­cadores); o 2) los cod­i­fi­cadores reg­is­tran equiv­o­cada­mente la infor­ma­ción en pape­les o direc­ta­mente en la com­puta­do­ra (error de entra­da de datos). Esta y la sigu­iente sec­ción tratan estos tipos de errores de con­fi­a­bil­i­dad.[12]

La recolec­ción de infor­ma­ción de per­iódi­cos está gen­eral­mente basa­da en análi­sis de con­tenidos emple­an­do esque­mas de cod­i­fi­cación que con­sis­ten en una serie de cat­e­gorías. El sigu­iente cri­te­rio debería guiar la preparación de esque­mas de cod­i­fi­cación:

  1. Las cat­e­gorías deberían ten­er un vín­cu­lo direc­to, indi­vid­ual­mente o en un grupo de otras cat­e­gorías, con una o más hipóte­sis de interés [Laswell et al. 1952, cita­do en Budd et al. 1966];
  2. Las cat­e­gorías deberían ser mutual­mente excluyentes [Krip­pen­dorf 1980: 83];
  3. Las cat­e­gorías deberían man­ten­er una seme­jan­za con el lengua­je uti­liza­do por los per­iódi­cos [Krip­pen­dorf 1980: 84].

Ítems o cat­e­gorías sean muy abstrac­tas o gen­erales posi­ble­mente lle­varán a amplias difer­en­cias de inter­pretación entre los lec­tores. Para mejo­rar la homo­genei­dad de los datos y la con­fi­a­bil­i­dad entre los cod­i­fi­cadores, los con­cep­tos y cat­e­gorías gen­erales deberían con­ver­tirse en ítems ele­men­tales de infor­ma­ción tal cual fueron infor­ma­dos por los mis­mos per­iódi­cos. Es preferi­ble recom­pon­er las cat­e­gorías más gen­erales de interés teóri­co durante la fase tardía del análi­sis de datos, agre­gan­do los ítems más ele­men­tales de infor­ma­ción a tra­ba­jar con cat­e­gorías cuyos pro­ce­sos de agre­gación sub­y­a­centes pare­ciesen vari­ar ampli­a­mente entre los lec­tores. Esto, en cam­bio, impli­ca famil­iari­dad con el mate­r­i­al tex­tu­al o teóri­co a ser cod­i­fi­ca­do antes de la preparación del esque­ma de cod­i­fi­cación.

Una vez que el esque­ma de cod­i­fi­cación esté lis­to y haya pasa­do por exten­sas prue­bas, el proyec­to puede lle­varse a su segun­da fase: el reg­istro de infor­ma­ción de los per­iódi­cos. Tradi­cional­mente, la cod­i­fi­cación se ha real­iza­do con esque­mas de cod­i­fi­cación en base a papel. La lle­ga­da de las micro­com­puta­do­ras pareciera haber con­ver­tido a esta téc­ni­ca en obso­le­ta ya que pueden ser uti­lizadas para cod­i­ficar infor­ma­ción direc­ta­mente a la máquina.

Las ven­ta­jas de las entradas direc­tas por sobre las tran­scrip­ciones man­uales son dos: 1) las entradas direc­tas son menos cos­tosas; y 2) pro­ducen datos más con­fi­ables. La entra­da direc­ta evi­ta el paso inter­me­dio de cod­i­ficar en papel. Aunque requiere la adquisi­ción de una micro­com­puta­do­ra, este cos­to pareciera ser com­pen­sa­do por los ahor­ros efec­tu­a­dos al no ten­er que imprim­ir esque­mas de cod­i­fi­cación o de ingre­sar cod­i­fi­ca­ciones de datos en la com­puta­do­ra a mano; aunque la ver­dadera ven­ta­ja de la entra­da direc­ta es que per­mite un inmedi­a­to con­trol automáti­co, online, de la infor­ma­ción cod­i­fi­ca­da (ortografía de nom­bres de local­i­dades y sec­tores indus­tri­ales, tiem­po de los even­tos, con­sis­ten­cia inter­na de cat­e­gorías cod­i­fi­cadas). Asimis­mo, la entra­da direc­ta per­mite una fácil actu­al­ización del esque­ma de cod­i­fi­cación.[13] Otros proyec­tos de recolec­ción de datos a gran escala han elegi­do la mis­ma estrate­gia. En la base de una com­para­ción ade­cua­da de los tiem­pos de cod­i­fi­ca­cion y la pro­por­ción de error en las tran­scrip­ciones man­uales y en las entradas direc­tas, las inves­ti­ga­ciones involu­cradas en el “40–50 Project” del Bureau de Esta­dos Unidos del Cen­sus con­cluye, “la entra­da de datos direc­tos es más ráp­i­da que el pro­ce­so de tran­scrip­ción manual…además, los datos ingre­sa­dos direc­ta­mente son de una cal­i­dad supe­ri­or”.[14]

Final­mente, la entra­da direc­ta de datos puede com­bi­na­rse con con­cep­tos poderosos desar­rol­la­dos en el cam­po de la inteligen­cia arti­fi­cial y el lengua­je matemáti­co para pro­ducir archivos históri­cos que son mucho más flex­i­bles y ricos en infor­ma­ción de con­tenidos que los per­mi­ti­dos a través de los esque­mas de cod­i­fi­cación tradi­cionales. El con­cep­to de gramáti­ca es par­tic­u­lar­mente útil [Chom­sky 1971]. La gramáti­ca de un lengua­je indi­ca las reglas para com­bi­nar pal­abras en fras­es. Ambos, los esque­mas de gramáti­ca y de cod­i­fi­cación, nos per­miten ajus­tar hilos tex­tuales en casilleros, ya sea a través de la cod­i­fi­cación de cat­e­gorías o estruc­turas gra­mat­i­cales, como suje­to, ver­bo, obje­to y otros. La ven­ta­ja de una gramáti­ca es que provee una for­ma poderosa de conec­tar cat­e­gorías, con las conex­iones especi­fi­cas por la mis­ma gramáti­ca. En un esque­ma de cod­i­fi­cación tradi­cional, los vín­cu­los y conex­iones entre cat­e­gorías no pueden imple­men­tarse fácil­mente.[15]

Inclu­so la entra­da direc­ta (basa­da en esque­mas de cod­i­fi­cación tradi­cionales o gramáti­cas), para todo chequeo online, no puede garan­ti­zar datos libres de errores de reg­istro. Como hemos vis­to, los reg­istradores pueden come­ter errores al ingre­sar datos en la com­puta­do­ra (errores de entra­da de datos) o inter­pre­tar equiv­o­cada­mente uno o más ítems de infor­ma­ción con­teni­da en los artícu­los peri­odís­ti­cos.

Muchos errores en la entra­da de datos son iden­ti­fi­ca­dos automáti­ca­mente por la com­puta­do­ra (Nuw York en vez de New York, Enero 35, 1952, etc.) otros errores no son automáti­ca­mente iden­ti­fi­ca­dos (por ejem­p­lo, la duración de una huel­ga de dos horas, tipea­da equiv­o­cada­mente como de 22 horas). El pro­gra­ma de com­puta­do­ra que real­iza la entra­da direc­ta de datos podría ser dis­eña­do para mostrar toda la infor­ma­ción cod­i­fi­ca­da por cada artícu­lo en la pan­talla; este le pedirá al lec­tor ver­i­ficar los datos recién ingre­sa­dos antes de con­tin­uar la cod­i­fi­cación del sigu­iente artícu­lo. Aunque la posi­bil­i­dad de error pue­da exi­s­tir, al poder los reg­istradores inter­pre­tar el sig­nifi­ca­do de cier­tas cat­e­gorías de cod­i­fi­cación en for­mas difer­entes. En la sigu­iente sec­ción, voy a enu­mer­ar las cues­tiones de la fia­bil­i­dad entre cod­i­fi­cadores.

La fiabilidad entre codificadores

La fia­bil­i­dad entre cod­i­fi­cadores es un prob­le­ma que afec­ta a todos los proyec­tos de análi­sis de con­tenido, inclu­i­dos poten­cial­mente aque­l­los que repor­tan un alto coe­fi­ciente de fia­bil­i­dad entre cod­i­fi­cadores [Krip­pen­dorf 1980: 74]. Expre­sa­do en for­ma sim­ple, la fia­bil­i­dad entre cod­i­fi­cadores, como otras for­mas de fia­bil­i­dad, mide la repeti­ción: los resul­ta­dos obtenidos por un cod­i­fi­cador pueden repe­tirse por otros cod­i­fi­cadores uti­lizan­do las mis­mas téc­ni­cas sobre el mis­mo mate­r­i­al con el mis­mo set de reglas. La repeti­ción podría ser más o menos difí­cil depen­di­en­do de la apli­cación especí­fi­ca de análi­sis de con­tenidos (cuen­tas sim­ples de pal­abras claves o medición de lon­gi­tud) de artícu­los en números de líneas o cen­tímet­ros clara­mente son menos propen­sos a prob­le­mas de fia­bil­i­dad entre cod­i­fi­cadores que los análi­sis temáti­cos. Por esta razón, “la fia­bil­i­dad en un estu­dio debe haber sido com­para­da con estu­dios sim­i­lares” [Budd et al. 1966: 67]. La fia­bil­i­dad entre cod­i­fi­cadores depende tam­bién de la for­ma en la cual fue dis­eña­da la for­ma de cod­i­fi­cación de cat­e­gorías, el tipo de instruc­ciones dadas a los cod­i­fi­cadores y la clar­i­dad con que las reglas de cod­i­fi­cación han sido escritas.

Ideal­mente, deberíamos poder obten­er altos coe­fi­cientes de fia­bil­i­dad entre cod­i­fi­cadores, sola­mente sobre la base de las instruc­ciones escritas [Krip­pen­dorf 1980: 74]. Por estas razones, durante las fas­es de preparación y prue­ba de los proyec­tos basa­dos en la cod­i­fi­cación de per­iódi­cos, mucho esfuer­zo debería dedicárse­le a escribir un man­u­al detal­la­do de instruc­ciones de cod­i­fi­cación y dis­eño de cat­e­gorías prob­lemáti­cas.

Una for­ma de max­i­mizar la fia­bil­i­dad entre cod­i­fi­cadores y min­i­mizar el error de reg­istro es ten­er a var­ios cod­i­fi­cadores real­izan­do la cod­i­fi­cación en fas­es suce­si­vas, cada uno leyen­do cada artícu­lo. En teoría, eso sería lo mejor; en la prác­ti­ca, tal vez no val­ga los recur­sos gas­ta­dos. Dada la mag­ni­tud prob­a­ble de validez ver­sus los errores de fia­bil­i­dad (errores de infor­ma­ción ver­sus errores de reg­istro), en una situación de recur­sos lim­i­ta­dos, inver­tiría en datos para­le­los los esfuer­zos de recolec­ción apun­tan­do a eval­u­ar la nat­u­raleza y exten­sión del error de infor­ma­ción. En otras pal­abras, yo inten­taría medir la direc­ción y mag­ni­tud de las influ­en­cias del per­iódi­co.[16]

El tipo de error sis­temáti­co intro­duci­do por las prác­ti­cas de reporte de infor­ma­ción pareciera ten­er un efec­to mucho más grande en con­clu­siones empíri­c­as que en los errores aleato­rios intro­duci­dos a través de los pro­ced­imien­tos de reg­istro. Sin embar­go, la aten­ción de los inves­ti­gadores se ha focal­iza­do casi exclu­si­va­mente en los errores de reg­istro y en los de fia­bil­i­dad entre cod­i­fi­cadores. Tal vez todos nos sen­ti­mos com­pro­meti­dos a hac­er todo lo posi­ble para recolec­tar datos con­fi­ables ya que que ten­emos poco con­trol sobre la validez de los datos del per­iódi­co. Pero ¿cuál es el pun­to en inver­tir tan­tos recur­sos en ase­gu­rarse, por ejem­p­lo, que una for­ma de con­glom­er­a­do de 200 mil per­sonas sea reg­istra­da apropi­ada­mente? Dicha for­ma puede estar al bor­de de lo fan­tás­ti­co y, además, hay una igual prob­a­bil­i­dad de que esté sien­do sobrees­ti­ma­do o subes­ti­ma­da.[17] Los inves­ti­gadores poco pueden hac­er para cam­biar el niv­el de error al repor­tar (validez); aunque, pueden –y deberían- hac­er un may­or esfuer­zo para medir su exten­sión.

La ante­ri­or dis­cusión no sig­nifi­ca que los errores de reg­istro deberían tomarse liviana­mente –es más, no deberían. Sug­iero que deberíamos con­sid­er­ar estrate­gias alter­na­ti­vas. Los muestre­os por aceptación, por ejem­p­lo, pueden proveer sufi­ciente pro­tec­ción con­tra los errores de reg­istro. No todas las bom­bil­las de luz que provienen de una línea de ensam­ble son testeadas para ver su rendimien­to, aunque uno rara­mente deba devolver una bom­bil­la al nego­cio donde la com­pró. ¿Cómo fun­ciona el muestreo por aceptación? Una mues­tra de la can­ti­dad de artícu­los cod­i­fi­ca­dos todos los días por cada lec­tor es selec­ciona­da aleato­ri­a­mente para inspec­cionarla[18]. Cuan­do el por­centa­je de errores es may­or que el umbral mín­i­mo, la pro­duc­ción diaria del lec­tor es entera­mente descar­ta­da y rehecha. De lo con­trario, los errores serán cor­regi­dos. En este caso, ambos, el viejo códi­go incor­rec­to y el nue­vo códi­go cor­rec­to se guardarían en el archi­vo. Este archi­vo de datos proveería un reg­istro útil de desem­peños de las cat­e­gorías. Los muestre­os por aceptación no pueden garan­ti­zar un pro­duc­to libre de errores, pero puede garan­ti­zar que los errores se man­ten­drán den­tro de cier­tos límites de tol­er­an­cia pre­definidos.

El prob­le­ma con el muestreo por aceptación es que las cod­i­fi­ca­ciones del cod­i­fi­cador y del ver­i­fi­cador no son inde­pen­di­entes. El ver­i­fi­cador podría verse afec­ta­do por las cod­i­fi­ca­ciones pre­vias que él o ella inspec­ciono. Para evi­tar este prob­le­ma y todavía hac­er posi­ble el con­trol de la fia­bil­i­dad entre cod­i­fi­cadores, mien­tras el proyec­to con­tinúa el equipo entero debería reg­is­trar per­iódica­mente y en for­ma indi­vid­ual los mis­mos artícu­los de per­iódi­co. Los coe­fi­cientes de la fia­bil­i­dad entre cod­i­fi­cadores luego serán com­puta­dos para cada cat­e­goría [Hol­sti 1969; Budd et al. 1966: 68].[19] Richard Budd, Robert Thorp y Lewis Dono­hew escriben “si un cod­i­fi­cador está con­stan­te­mente fuera de la línea con respec­to a los otros, debe ser instru­i­do o elim­i­na­do; si var­ios cod­i­fi­cadores están en desacuer­do, las instruc­ciones y defini­ciones deben ser reex­am­i­nadas” [1966: 67].

Clara­mente, los están­dares mín­i­mos de fia­bil­i­dad varían con la cat­e­goría (la cat­e­goría “nom­bre del lugar”, por ejem­p­lo, es menos vaga que la cat­e­goría “obje­ti­vo de la acción”); gen­eral­mente deberían ser toma­dos como acept­a­bles ran­gos de coin­ci­den­cia entre el 80 y 90 %. Para elim­i­nar posi­bles ten­den­cias espurias en los datos recolec­ta­dos debidos solo a la idios­in­cra­sia del cod­i­fi­cador es recomend­able que la cod­i­fi­cación sea orga­ni­za­da de tal for­ma que ningún lec­tor tra­ba­je en un solo peri­o­do de sub­mues­tra [Hof­stet­ter 1976: 25]. Aunque hay difi­cul­tades prác­ti­cas y cos­tos con una colec­ción entera­mente aleato­ria, una orga­ni­zación nor­mal­mente posee solo una copia de micro­film de per­iódi­co, y cada car­rete del micro­film con­tiene var­ios meses de artícu­los. Además, la famil­iari­dad con el con­tex­to históri­co y el desar­rol­lo día a día de un even­to debería proveer al lec­tor un mejor entendimien­to de las dinámi­cas de los actores y temas involu­cra­dos en el peri­o­do, reducien­do la prob­a­bil­i­dad de errores de inter­pretación. Así, la plan­i­fi­cación de la cod­i­fi­cación de pro­duc­ción debe lle­gar a un pun­to medio entre dos ten­den­cias opues­tas. Una solu­ción sería asig­nar un sub­pe­ri­o­do de tres a cin­co años a un grupo de lec­tores, con cada lec­tor cod­i­f­i­can­do temas del per­iódi­co que le hayan sido asig­na­dos aleato­ri­a­mente den­tro de todo el sub­pe­ri­o­do.

Seleccionar el periódico para ser usado como fuente de datos y la frecuencia de su lectura

Las prác­ti­cas de repor­tar por parte de los per­iódi­cos han diferi­do en tér­mi­nos de 1) el gra­do de la cir­cu­lación del per­iódi­co [Capec­chi y Livol­si 1971], 2) la prox­im­i­dad de los even­tos al mer­ca­do con­sum­i­dor del per­iódi­co o de las agen­cias de noti­cias [Danzger 1975; Sny­der y Kel­ly, 1977] y 3) la posi­ción ide­ológ­i­ca del per­iódi­co [Hart­mann 1975/76]. Dadas estas difer­en­cias, ideal­mente, a uno le gus­taría recolec­tar datos de la may­or can­ti­dad de per­iódi­cos posi­ble. Basarse en var­ios per­iódi­cos incre­men­ta la can­ti­dad de even­tos y ayu­da al inves­ti­gador a estar menos suje­to a la idios­in­cra­sia de cualquier fuente indi­vid­ual. El prob­le­ma es que la can­ti­dad de los per­iódi­cos en la may­oría de los país­es es muy alta [De Luna et al. 1980: 304–308], demasi­a­do alta para que un inves­ti­gador los pue­da con­sul­tar todos, al menos en un largo peri­o­do de mues­tra y con lec­turas diarias. Debe tomarse una decisión. De cualquier for­ma, en ningu­na parte he vis­to reportes de inves­ti­ga­ciones pre­lim­inares con­duci­dos para jus­ti­ficar la elec­ción de un per­iódi­co en par­tic­u­lar, ni he vis­to un cri­te­rio claro que haya guia­do tal decisión. La con­ve­nien­cia de ten­er un índice que facilite la búsque­da de artícu­los parece ser el cri­te­rio no men­ciona­do para la elec­ción del New York Times en muchos estu­dios de datos sobre even­tos.

Una elec­ción más racional estaría basa­da en com­para­ciones pre­lim­inares sis­temáti­cas de un gran número de per­iódi­cos para eval­u­ar la exten­sión y tipo de cober­tu­ra de cada uno. El peri­o­do de mues­tra no nece­si­ta ser demasi­a­do largo; inclu­so de una sem­ana a dos o más pun­tos de tiem­po den­tro del peri­o­do total de muestreo de interés puede ser sufi­ciente. Los análi­sis pre­lim­inares de estos datos com­para­dos pueden ayu­dar a los inves­ti­gadores a realizar elec­ciones infor­madas, dic­tadas por la nat­u­raleza del prob­le­ma en mano en vez de la con­ve­nien­cia.

Habi­en­do elegi­do el/los per­iódi­cos a uti­lizar como fuente, el inter­va­lo de muestreo – la fre­cuen­cia de lec­tura y cod­i­fi­cación de los per­iódi­cos- todavía debe ser selec­ciona­do. Los per­iódi­cos pueden leerse todos los días, uti­lizan­do todos los artícu­los pub­li­ca­dos, o para ahor­rar recur­sos, podría leerse uno o más días a la sem­ana, uno o más sem­anas al mes, uno o más meses al año, cada tres años, cada cin­co años y así. Después de todo, la población entera de un país nun­ca es entre­vis­ta­da para pre­de­cir el com­por­tamien­to elec­toral en las próx­i­mas elec­ciones políti­cas nacionales. Las mues­tras elegi­das cuida­dosa­mente pueden dar resul­ta­dos muy cer­canos a los que se podría obten­er sobre la base de la población total. Sin embar­go, mien­tras que el muestreo puede ser un pro­ced­imien­to apropi­a­do en el cam­po de los análi­sis de con­tenido clási­cos, tiene prob­a­bil­i­dad de incur­rir dos obstácu­los fun­da­men­tales cuan­do es apli­ca­do en estu­dios de pro­ce­sos socio-históri­cos[20].

Primero, si el fenó­meno bajo estu­dio está car­ac­ter­i­za­do por un com­por­tamien­to cícli­co – que es la nat­u­raleza de muchos pro­ce­sos históri­cos- los cic­los podrían escab­ul­lirse por la cuadric­u­la de muestreo, apare­cien­do con cortes de picos aquí y menores allí. Con­se­cuente­mente, los cic­los no serían iden­ti­fi­ca­dos fácil­mente durante el análi­sis. Uno podría estrat­i­ficar la mues­tra sobre la base de dicho com­por­tamien­to cícli­co, pero estas téc­ni­cas de muestreo supon­drían, a pri­ori, conocimien­to de los cic­los.

Segun­do, la dis­tribu­ción de los even­tos en el fenó­meno a estu­di­ar estaría ata­da en vín­cu­los estratégi­cos de even­tos en cade­na. En esos casos, los even­tos en cade­na con­sti­tuyen la real unidad de análi­sis por sobre los even­tos sin­gu­lares. Por ejem­p­lo, yo argu­men­taría que la unidad sig­ni­fica­ti­va para enten­der el con­flic­to indus­tri­al en Italia no es la huel­ga, con­ce­bi­da como inter­rup­ción de tra­ba­jo indi­vid­ual, pero sí la dis­pu­ta, que tal vez incluya no solo uno o más inter­rup­ciones de tra­ba­jo, sino tam­bién difer­entes for­mas de acción colec­ti­va – man­i­festa­ciones, con­cen­tra­ciones, asam­bleas, reuniones de nego­ciación, etc. Ger­ald Mar­well y Pamela Oliv­er han argu­men­ta­do en for­ma sim­i­lar que una “cam­paña colec­ti­va” es la unidad de análi­sis más apropi­a­da en las inves­ti­ga­ciones de la acción colec­ti­va y de los movimien­tos sociales [Mar­well y Oliv­er 1984] por sobre una activi­dad o even­to sin­gu­lar. Al recolec­tar infor­ma­ción sobre la base de téc­ni­cas de muestreo con un inter­va­lo may­or que el de la pub­li­cación de los per­iódi­cos –un día- se arries­ga no solo a trun­car cic­los sino tam­bién a perder even­tos den­tro de las dis­putas (o cam­pañas colec­ti­vas), además alteran­do fun­da­men­tal­mente el con­jun­to de acciones colec­ti­vas. Bajo estas condi­ciones, el con­flic­to sería una unidad de mues­tra más apropi­a­da que el artícu­lo o el tema del per­iódi­co.[21] Esto requeriría un poco de tra­ba­jo pre­lim­i­nar para iden­ti­ficar el uni­ver­so de todas las dis­putas repor­tadas para pro­bar, pero sub­sigu­ien­te­mente ahor­raría tiem­po en cod­i­ficar.

En con­clusión, en vista del alto cos­to en la recolec­ción de datos de per­iódi­cos, yo recomen­daría el sigu­iente dis­eño de inves­ti­gación:

  • Depen­der de uno o posi­ble­mente unos pocos per­iódi­cos cuida­dosa­mente selec­ciona­dos sobre la base de análi­sis com­par­a­tivos pre­lim­inares;
  • Tomar mues­tras solo si la nat­u­raleza del fenó­meno a estu­di­ar no es propen­sa a pro­ducir datos defor­ma­dos.
Unidades de medición

Las últi­mas dos sec­ciones tratan acer­ca de las cues­tiones de cómo un lec­tor decide qué cal­i­fi­ca para cod­i­ficar y qué hace un inves­ti­gador con todos estos datos. Hay dos elec­ciones involu­cradas en el pro­ce­so de pro­duc­ción de la decisión, implíc­i­tas en la primera pre­gun­ta. Estas elec­ciones tratan con la unidad de mues­tra –la unidad de con­tex­to y la unidad de reg­istro (o cod­i­fi­cación).

La unidad de con­tex­to se refiere a la por­ción del mate­r­i­al sim­bóli­co que debe ser anal­iza­do para car­ac­teri­zar la unidad de reg­istro, por ejem­p­lo, los ítems y sím­bo­los a ser cod­i­fi­ca­dos. Es den­tro de la unidad más amplia de con­tex­to que debe­mos bus­car las unidades de reg­istro– una pal­abra, oración, pár­rafo, tema, etc. Las unidades de reg­istro están con­tenidas entera­mente en las unidades de con­tex­to. Las unidades de con­tex­to pueden ser a su vez unidades de reg­istro den­tro de con­tex­tos más amplios.[22] Los artícu­los con­sti­tuyen las típi­cas unidades de con­tex­to. Las unidades sin­tác­ti­cas– suje­to, acción, obje­ti­vo- y unidades temáti­cas son unidades de reg­istro ele­men­tales para cualquier even­to dado. Las cat­e­gorías de cod­i­fi­cación proveen las unidades temáti­cas bási­cas para la recolec­ción. Usual­mente, un artícu­lo es una unidad fácil­mente iden­ti­fi­ca­ble con un títu­lo (encabeza­do) y, fre­cuente­mente, un sub­tí­tu­lo. Una noti­cia cor­ta que aparece bajo tales encabeza­dos como “Resumen de Pren­sa”, “Actu­al­ización”, “Resumen del noticiero”, y por el esti­lo cal­i­f­i­can como un artícu­lo. Un artícu­lo podría ser tam­bién la cap­tura de una fotografía si la infor­ma­ción que esta con­tiene no aparece en un artícu­lo.

Sin embar­go, des­de el pun­to de vista opera­cional, no siem­pre es fácil decidir cuán­do un artícu­lo cal­i­fi­ca o no para ser reg­istra­do. Con fines ilus­tra­tivos, util­ice­mos nue­va­mente el con­flic­to indus­tri­al en Italia, por ejem­p­lo, con­flic­tos en los que los tra­ba­jadores orga­ni­za­dos sean los prin­ci­pales actores. Con esta defini­ción opera­cional en mano, debería ser fácil decidir qué even­tos cal­i­f­i­can y cuáles no. El prob­le­ma es que, dadas las car­ac­terís­ti­cas de clase de los sindi­catos ital­ianos, los con­flic­tos indus­tri­ales a menudo concier­nen a la políti­ca en vez del lugar de tra­ba­jo [Piz­zorno 1973]. ¿Debería este últi­mo tipo de con­flic­to ser exclu­i­do de la recolec­ción de datos? Al excluir­lo, se perderían impor­tantes car­ac­terís­ti­cas de los con­flic­tos indus­tri­ales ital­ianos.

Si nosotros recolec­ta­mos tam­bién aque­l­las for­mas de acción colec­ti­va que van más allá de las razones pura­mente económi­cas, ¿qué debería hac­erse en aque­l­los casos donde no son los sindi­catos sino el Par­tido Comu­nista –la otra gran estruc­tura orga­ni­za­cional de la clase tra­ba­jado­ra ital­iana- el que orga­ni­za las acciones masi­vas? ¿Debería una acción políti­ca colec­ti­va reg­is­trarse solo cuan­do se orga­nizó por los sindi­catos o solo cuan­do está car­ac­ter­i­za­da por inter­rup­ciones lab­o­rales? ¿Qué debería hac­erse cuan­do los orga­ni­zadores, ya sean los sindi­catos o el Par­tido Comu­nista, pro­tag­on­i­zan acciones que no involu­cran a tra­ba­jadores en asun­tos rela­ciona­dos al tra­ba­jo (acciones por vivien­das, medio ambi­ente, paz, etc.) o involu­cran a no tra­ba­jadores (por ejem­p­lo, los des­ocu­pa­dos o los jubi­la­dos)? ¿Qué pasa en una situación donde el lid­er­az­go del movimien­to no proven­ga ni de los sindi­catos ni del par­tido (movimien­tos civiles por el abor­to, divor­cio, desarme, etc.)?

Una de muchas solu­ciones opera­cionales posi­bles puede ser la sigu­iente: cod­i­ficar todos los artícu­los que refier­an a acciones colec­ti­vas donde cualquier número de tra­ba­jadores esté pre­sente como actor colec­ti­vo y que sea iden­ti­fi­ca­do especí­fi­ca­mente así (de esa for­ma) por el per­iódi­co, inclu­so si están es una posi­ción minori­taria e inde­pen­di­en­te­mente del tipo de deman­da lle­va­da ade­lante y el tipo y niv­el de orga­ni­zación involu­cra­da (sindi­catos, par­tidos políti­cos, los tra­ba­jadores mis­mos o cualquier otro tipo de orga­ni­zación). Para los casos ambigu­os, el nom­bre del per­iódi­co, el número de colum­na y de pági­na, el tipo de even­to y la fecha, se reg­is­tra en for­ma sep­a­ra­da. Se puede decidir luego cuan­do estos artícu­los cal­i­f­i­can para reg­is­trar o deberán ser descar­ta­dos.

Aunque una com­pli­cación pos­te­ri­or es intro­duci­da por aque­l­los artícu­los que no involu­cran acciones colec­ti­vas de la clase tra­ba­jado­ra fácil­mente iden­ti­fi­ca­bles –huel­gas, man­i­festa­ciones, asam­bleas, etc.-. ¿Deberían cal­i­ficar los artícu­los que dis­cuten un juicio con­tra algunos tra­ba­jadores por su par­tic­i­pación en acciones colec­ti­vas en el pasa­do? ¿Debería cal­i­ficar un artícu­lo que nos cuen­ta que una comisión par­la­men­taria ha sido estable­ci­da para inves­ti­gar las condi­ciones de tra­ba­jo en las fábri­c­as? Esta infor­ma­ción puede ser muy útil luego para eval­u­ar las car­ac­terís­ti­cas del sis­tema de rela­ciones indus­tri­ales en Italia. Si este es el caso, deberíamos mod­i­ficar los cri­te­rios de cal­i­fi­cación lle­va­dos ade­lante. Los artícu­los donde los tra­ba­jadores apare­cen como actores deberían ser cod­i­fi­ca­dos, como tam­bién aque­l­los artícu­los en los que los tra­ba­jadores apare­cen como ref­er­entes y obje­tivos implíc­i­tos o explíc­i­tos de otros actores: el esta­do, la policía, el sis­tema judi­cial, los gob­ier­nos cen­tral y local, etc.- par­tidos políti­cos, o cualquier otro grupo orga­ni­za­do cuyas acciones pueden afec­tar pos­i­ti­va o neg­a­ti­va­mente, de una man­era sig­ni­fica­ti­va, a un con­jun­to de tra­ba­jadores o a la clase tra­ba­jado­ra entera.[23] De nue­vo, yo recomien­do man­ten­er defini­ciones sufi­cien­te­mente amplias que per­mi­tan recolec­tar la may­or can­ti­dad de infor­ma­ción rel­e­vante posi­ble. El cos­to económi­co de esta estrate­gia es más alto, pero la solu­ción alter­na­ti­va de tra­ba­jar con un umbral más alto tal vez resulte en un cos­to teóri­co más alto. Un umbral más alto provee más datos váli­dos, pero su desven­ta­ja es que perdemos gen­er­al­i­dad y número de casos. Yo pre­fiero man­ten­er el umbral bajo durante la fase de recolec­ción de datos y ele­var­la luego durante la fase de análi­sis de datos, eje­cu­tan­do análi­sis estadís­ti­cos en var­ios nive­les umbrales. Lo con­trario no sería posi­ble.[24]

En el con­tex­to de un artícu­lo, los cod­i­fi­cadores van a iden­ti­ficar uno o más even­tos. En el con­tex­to de cada even­to, los cod­i­fi­cadores iden­ti­fi­carán las unidades sin­tác­ti­cas y temáti­cas ele­men­tales. La mejor for­ma de orga­ni­zar las unidades de reg­istro es por temas, en lugar de pal­abras clave. La expre­sión “la recolec­ción de fon­dos para los huel­guis­tas” se refiere a un tema gen­er­al de despliegue prác­ti­co de sol­i­dari­dad de los tra­ba­jadores, inde­pen­di­en­te­mente de la expre­sión ver­bal especi­fi­ca uti­liza­da por el per­iódi­co. Expre­siones como “una recolec­ción de con­tribu­ciones vol­un­tarias para ser uti­lizadas como fon­do para los huel­guis­tas”, “tra­ba­jadores de fir­mas cer­canas han ofre­ci­do su apoyo financiero”, y sim­i­lares serían todas cod­i­fi­cadas bajo la cat­e­goría temáti­ca “recolec­ción de fon­dos para huel­guis­tas”. Las cat­e­gorías temáti­cas pueden ser más o menos especí­fi­cas o genéri­c­as. La cat­e­goría “comien­zo de huel­ga” clara­mente es com­pat­i­ble con un ran­go más estre­cho de sinón­i­mos que “están sat­is­fe­chos con el resul­ta­do de la huel­ga”. En con­sid­eración del hecho de que la fia­bil­i­dad de los datos recolec­ta­dos se vin­cu­la al dis­eño de las cat­e­gorías y al conocimien­to de los cod­i­fi­cadores sobre qué cod­i­ficar den­tro de cada cat­e­goría, el man­u­al de instruc­ciones de reg­istro debería proveer un gran número de expre­siones sim­i­lares para cada cat­e­goría.

Agregando Datos — Unidades de análisis

Como hemos vis­to, el uso de com­puta­do­ras para recolec­tar datos de per­iódi­cos ha posi­bil­i­ta­do obten­er infor­ma­ción históri­ca mucho más rica que la que era posi­ble bajo los mar­cos tradi­cionales de cod­i­fi­cación. Estos datos son alta­mente desagre­ga­dos a lo largo de varias dimen­siones – espa­cio, tiem­po, sector/firma/planta (o tipo de orga­ni­zación), y cat­e­goría de infor­ma­ción. En el gra­do en que los per­iódi­cos provean infor­ma­ción sobre el lugar del con­flic­to, uno podrá ten­er un mapa geográ­fi­co detal­la­do y alta­mente desagre­ga­do del pro­ce­so históri­co a estu­di­ar (bar­rio, cuadra, calle). En cuan­to al tiem­po, los per­iódi­cos nun­ca son muy pre­cisos. Las expre­siones típi­ca­mente uti­lizadas para referirse al tiem­po son “ayer”, “mañana”, “hace algunos días”, o “al poco tiem­po de eso”. El tiem­po es rara­mente definido más pre­cisa­mente, como “el lunes, 7 de octubre de 1983 a las 10:45 PM”. Los lengua­jes matemáti­cos han pro­vis­to de cuan­tifi­cadores gen­er­al­iza­dos que per­miten reg­is­trar en for­ma pre­cisa inclu­so las for­mas más vagas de expre­siones tem­po­rales [ver Fran­zosi 1986]. Cuan­do el tiem­po exac­to de un even­to no está disponible, es todavía posi­ble lograr un orde­namien­to par­cial en relación a otros even­tos. Esto daría como resul­ta­do un alto gra­do de datos desagre­ga­dos sobre el tiem­po –has­ta el mis­mo min­u­to, si así se hizo ref­er­en­cia en el per­iódi­co. En el caso de un con­flic­to indus­tri­al, lo mis­mo se podría aplicar para las fir­mas y los sec­tores económi­cos; allí donde la infor­ma­ción fuese pro­vista, se podrían reg­is­trar el sec­tor económi­co, el grupo, la fir­ma, la plan­ta, y nego­cio donde se dieron los even­tos.

La alta desagre­gación de datos sobre tiem­po y espa­cio per­mi­tirá a los inves­ti­gadores enten­der mejor los pro­ce­sos de mov­i­lización involu­cra­dos en oleadas de even­tos de protes­ta. Los tra­ba­jos pio­neros de Eric Hob­s­bawm y George Rude, Andrew Charleswoth, y los tra­ba­jos actuales de Charles Tilly han mostra­do que los pro­ce­sos de difusión a larga escala, como las olas de huel­gas u otro com­por­tamien­to con­flic­ti­vo, siguen patrones pre­dic­tivos tan­to de tiem­po como de espa­cio [Hob­s­bawm y Rude 1968; Charlesworth 1979]. Por ejem­p­lo, en el caso del con­flic­to indus­tri­al, estaríamos intere­sa­dos en saber que fir­mas y sec­tores y que áreas geográ­fi­cas lid­er­an la lucha o son alcan­zadas por esta en cualquier tiem­po dado.

Tan alta desagre­gación de los datos nos per­mite lle­var ade­lante análi­sis por ter­ri­to­rio (primero recu­per­ar y luego analizar toda la infor­ma­ción de Pia­monte, por ejem­p­lo, o Milán, o la provin­cia de Géno­va), por tiem­po (selec­cio­nan­do toda la infor­ma­ción disponible en un peri­o­do dado), por sec­tor (selec­cionar toda la infor­ma­ción sobre tra­ba­jadores tex­tiles), por firma/planta/negocio (recu­per­ar toda la infor­ma­ción sobre FIAT), por ítem especi­fi­co de infor­ma­ción (ej., todos los casos de inter­ven­ción poli­cial), o por cualquier com­bi­nación de las ante­ri­or­mente citadas (recu­per­ar toda la infor­ma­ción de inter­ven­ciones poli­ciales en las plan­tas de FIAT de Turín durante el peri­o­do 1945–1956). La disponi­bil­i­dad com­er­cial del potente “Rela­tion­al Data Base Man­age­ment Sys­tems” (DBMS), como INGRES, ORACLE, DL1, o RDB, hace que recu­per­ar e inter­rog­ar infor­ma­ción de tan grandes ban­cos de datos sea muy sim­ple.[25]

Los datos, sin embar­go, tam­bién pueden ser agre­ga­dos en var­ios nive­les –espa­cio y tiem­po, sector/firma, o even­to.[26] Depen­di­en­do del tipo de infor­ma­ción proce­sa­da, la agre­gación tal vez involu­cre añadir infor­ma­ción (ej., número de gente heri­da, asesina­da, arresta­da, etc.) por unidad de tiem­po (mes, cuatrimestre, año), por unidad espa­cial (provin­cia, región, país como un todo), por sector/firma (ej., FIAT o indus­tria quími­ca), o por even­to (huel­ga, man­i­festación, etc.). Tam­bién puede involu­crar la sim­ple acu­mu­lación del número de car­ac­terís­ti­cas de los even­tos (por ejem­p­lo, la entre­ga de fol­letos) o de los mis­mos even­tos. Los análi­sis luego pueden ser desar­rol­la­dos en estos var­ios nive­les. Aunque mucho del detalle fino de los datos se pierde a través de la agre­gación, en algunos casos esto es inevitable si se van a desar­rol­lar análi­sis de mul­ti­vari­ables. En efec­to, las vari­ables de otras fuentes tal vez estén disponibles solo en los nive­les más altos de agre­gación (solo pub­li­ca­ciones trimes­trales, por ejem­p­lo, están disponibles sobre desem­pleo). Final­mente, pueden for­marse com­bi­na­ciones de las cat­e­gorías que proveen difer­entes mediciones de un con­cep­to sub­y­a­cente úni­co (por ejem­p­lo, a través de análi­sis de fac­tores; algunos paque­tes de com­puta­do­ras como LISREL, aunque per­mi­ta esti­ma­ciones direc­tas de mod­e­los estruc­turales de ecua­ciones uti­lizan­do var­ios indi­cadores de un con­cep­to sub­y­a­cente úni­co).

Conclusiones

Este artícu­lo puso a la vista un número de temas involu­cra­dos en la recolec­ción de datos de even­tos de los per­iódi­cos. En resumen, me gus­taría destacar unos cuan­tos pun­tos con­cernientes especí­fi­ca­mente a la validez y fia­bil­i­dad. Primero, una pre­gun­ta: ¿son los per­iódi­cos datos vali­dos? Mi respues­ta es, gen­eral­mente no. David Sny­der y William Kel­ly argu­men­tan que los estu­dios basa­dos en múlti­ples indi­cadores de con­flic­to sean prob­a­ble­mente propen­sos a ser influ­en­ci­a­dos, mien­tras que los estu­dios basa­dos en for­mas especí­fi­cas de con­flic­to (huel­gas, dis­tur­bios raciales, etc.) “son gen­eral­mente váli­dos, espe­cial­mente cuan­do se lim­i­tan a con­sid­er­ar com­por­tamien­tos rel­a­ti­va­mente altos en inten­si­dad [Sny­der y Kel­ly 1977: 117, 121]. A la luz de la ante­ri­or dis­cusión, sus dichos pare­cen demasi­a­do opti­mis­tas. Ellos admiten que, al menos en el caso del con­flic­to indus­tri­al –que, de paso, es un indi­cador indi­vid­ual- hay evi­den­cia de una “drás­ti­ca influ­en­cia en sub repor­tar” [Sny­der y Kel­ly 1977: 110]. No hay duda de que a may­or inten­si­dad de un even­to, may­or es la prob­a­bil­i­dad de ser repor­ta­do. Además, la validez siem­pre puede alcan­zarse sim­ple­mente subi­en­do el umbral de los even­tos. Aunque esto impli­ca per­di­da de gen­er­al­i­dad y de número de casos. Si uno no desea hac­er este sac­ri­fi­cio, la pre­gun­ta sobre validez se vuelve más prob­lemáti­ca.

Dis­cu­tiría que los datos de even­tos recolec­ta­dos de per­iódi­cos parecier­an verse afec­ta­dos por errores sis­temáti­cos y, por lo tan­to, no son váli­dos. Aunque esto no impor­ta mien­tras especi­fique­mos la nat­u­raleza de los errores no aleato­rios aso­ci­a­dos con la validez. Esto prob­a­ble­mente no pue­da hac­erse en for­ma exac­ta, en tan­to que esta­mos lid­ian­do con mues­tras de even­tos no aleato­rios extraí­dos de una población descono­ci­da, pero, a través de las téc­ni­cas dis­cu­ti­das arri­ba podemos realizar juicios infor­ma­dos sobre la direc­ción y la mag­ni­tud del error.

Una segun­da pre­gun­ta es si los datos recolec­ta­dos de los per­iódi­cos son con­fi­ables. Mi respues­ta es, gen­eral­mente sí. Como hemos vis­to, la may­oría de los estu­dios sobre con­flic­tivi­dad real­izan muchos esfuer­zos para ase­gu­rar que cualquier cosa que es repor­ta­do por los per­iódi­cos sea reg­istra­do sin errores. Una pre­gun­ta rela­ciona­da entonces sería: ¿Vale real­mente la pena? Retomem­os el ejem­p­lo de Richard Zeller y Edward Carmine de un rifle de amarre sano que en for­ma repet­i­ti­va y con­stante gol­pea el mis­mo pun­to (per­fec­ta), excep­to que no gol­pea el blan­co desea­do (cero validez) [Zeller y Carmines 1980]. Es lo sufi­cien­te­mente fácil mover el rifle has­ta que golpee el blan­co, ya que gen­eral­mente lo más reciente está bien definido. Aunque, en el caso de los per­iódi­cos, los con­tornos del blan­co son descono­ci­dos, y los inves­ti­gadores no saben real­mente si están dán­dole cor­rec­ta­mente en el blan­co o le erran por una pul­ga­da o una mil­la.

Los inves­ti­gadores han puesto esfuer­zos admirables en la elim­i­nación de los errores aleato­rios (fia­bil­i­dad) de la recolec­ción de datos de per­iódi­cos mien­tras que gen­eral­mente des­cuidan los errores no aleato­rios (validez). Eso es todo, el error no aleato­rio (validez) es mucho más prob­a­ble de dis­tor­sion­ar los datos del per­iódi­co que el error aleato­rio (fia­bil­i­dad). Dado los recur­sos lim­i­ta­dos con los que la may­oría de nosotros nos enfrenta­mos, la pre­gun­ta de validez ver­sus fia­bil­i­dad tal vez se con­vier­ta en una pre­gun­ta de elec­ción entre más validez ver­sus menos fia­bil­i­dad. Aunque, espero haber mostra­do que nive­les más altos de validez pueden ser alcan­za­dos sin sac­ri­ficar fia­bil­i­dad sim­ple­mente al uti­lizar téc­ni­cas más efi­cientes en la recolec­ción de datos.

En con­clusión, ya que los per­iódi­cos proveen lar­gos reg­istros de pro­ce­sos históri­cos, a veces no disponibles de otra man­era y par­tic­u­lar­mente bien situ­a­dos para la “for­mu­lación sis­temáti­ca y tes­teo de hipóte­sis de inves­ti­gación” [McAdam 1982: 235] mucho se puede ganar de su uso. Aunque para uti­lizarlas efec­ti­va­mente, más aten­ción se le debe dar a los prob­le­mas de medición. Mas pre­cisa­mente, dada la aten­ción despro­por­ciona­da que se le da a los prob­le­mas de fia­bil­i­dad con respec­to a los de validez, recomen­daría un cam­bio en el foco de los prob­le­mas de fia­bil­i­dad a los prob­le­mas de validez. La val­i­dación de los datos a través de medi­das inde­pen­di­entes y alter­na­ti­vas debería ser una parte inte­gral de cualquier dis­eño de inves­ti­gación que involu­cre recolec­ción de datos de per­iódi­cos. Es solo a través de estos estu­dios de val­i­dación que podemos ten­er esper­an­zas de obten­er un mejor entendimien­to de los con­tornos del uni­ver­so de even­tos de interés y delin­ear mapas que vin­culen la población y la mues­tra no aleato­ria a mano.

Citas

Toma­do de Fran­zosi, Rober­to 1987 The Press as a Source of Socio-His­tor­i­cal Data: Issues in the Method­ol­o­gy of Data Col­lec­tion from News­pa­pers. His­tor­i­cal Meth­ods: A Jour­nal of Quan­ti­ta­tive and Inter­dis­ci­pli­nary His­to­ry, 20 (1), 1 de enero: 5–16. doi: 10.1080/01615440.1987.10594173. Agrade­ce­mos la autor­ización otor­ga­da por el autor y Tay­lor & Fran­cis Group para tra­ducir y pub­licar el pre­sente tex­to en nues­tra revista.

* Rober­to Fran­zosi es Dr. en Soci­ología por la Uni­ver­si­dad Johns Hop­kins (1981). Actual­mente se desem­peña como pro­fe­sor de Soci­ología y Lingüís­ti­ca en la Uni­ver­si­dad Emory, en Esta­dos Unidos de Norte Améri­ca. Sus intere­ses de inves­ti­gación han esta­do vin­cu­la­dos al estu­dio de la protes­ta social y la vio­len­cia y sus rela­ciones con el lengua­je y la nar­ra­ti­va. Entre sus pub­li­ca­ciones se desta­can las sigu­ientes: The Puz­zle of Strikes: Class and State Strate­gies in Post­war Italy (Cam­bridge Uni­ver­si­ty Press 1994); From Words to Num­ber: Nar­ra­tive, Data, and Social Sci­ence (Cam­bridge Uni­ver­si­ty Press 2005); “Con­tent Analy­sis” (Sage 2008); and “Quan­ti­ta­tive Nar­ra­tive Analy­sis” (Sage 2009). Correo elec­tróni­co: rfranzo@emory.edu

** Pro­fe­sor de His­to­ria por la UNMdP (Uni­ver­si­dad Nacional de Mar del Pla­ta), inte­grante del GES­Mar (Grupo de Estu­dios Marí­ti­mos Sociales) y del SISMOS (Sem­i­nario de Inves­ti­gación Sobre el Movimien­to de la Sociedad), Argenti­na.

*** Doc­tor en Cien­cias Sociales por la UBA (Uni­ver­si­dad de Buenos Aires). Inves­ti­gador Adjun­to del CONICET (Con­se­jo Nacional de Inves­ti­ga­ciones Cien­tí­fi­cas y Téc­ni­cas), IIGG (Insti­tu­to de Inves­ti­ga­ciones Gino Ger­mani), Argenti­na.

**** Pro­fe­so­ra de Inglés por la Uni­ver­si­dad Nacional de Mar del Pla­ta. Maes­tran­da en Prác­ti­ca Docente. Inte­grante del Grupo de Inves­ti­gación en Edu­cación y Estu­dios Cul­tur­ales de la Uni­ver­si­dad Nacional de Mar del Pla­ta, Argenti­na.

[1] Para una dis­cusión de los prob­le­mas de los datos de huel­gas ofi­ciales, ver Shalev [1978].

[2] Para la noción de reper­to­rio ver Tilly [1981].

[3] Ver, por ejem­p­lo, Ben­son [1978].

[4] Sobre estos temas, para la apli­cación especí­fi­ca en con­flic­tos intra-soci­etales, ver el exce­lente artícu­lo de Jacob­son [1973].

[5] Los per­iódi­cos han sido uti­liza­dos en múlti­ples estu­dios com­par­a­tivos inter­na­cionales sobre even­tos con­flic­tivos. Ver Rum­mel [1963, 1965], Rus­set [1964], Tan­ter [1966], Feier­abend y Feier­abend [1966], Bwy [1968], Gurr [1968], Paige [1975]. Sobre estu­dios nacionales de múlti­ples even­tos de con­flic­tos ver Eisinger [1973], Danzger [1975], Kriesi, Levy, Gan­guil­let y Zwicky [1981]. Sobre estu­dios nacionales de even­tos con­flic­tivos indi­vid­uales tales como los dis­tur­bios raciales en Esta­dos Unidos, ver Lieber­son y Sil­ver­man [1965], Bloom­baum [1968], Downes [1968], Downes [1970], Wan­der­er [1969], Spiler­man [1970], McAdam [1982]. Para huel­gas en Fran­cia, ver Short­er y Tilly [1974]. Para lin­chamien­tos en Esta­dos Unidos, ver los recientes tra­ba­jos de Spiler­man.

[6] Ver tam­bién Eisinger [1973].

[7] Tuch­man [1973] eti­que­ta al primer tipo de noti­cias como “suaves” y al segun­do tipo como “duras”; ver tam­bién Danzger [1975].

[8] Ver, por ejem­p­lo, McAdam [1982: 237].

[9] Ver tam­bién Eco [1971]; Dar­d­ano [1973]; Mor­ley [1976].

[10] Danzger argu­men­ta que esta prob­a­bil­i­dad es may­or en el caso ante­ri­or, mien­tras que Sny­der y Kel­ly argu­men­tan exac­ta­mente lo opuesto. Ver Danzger [1975: 570, 581]; Sny­der y Kel­ly [1977: 119–120].

[11] Ver tam­bién McAdam [1982: 235].

[12] Para el prob­le­ma de errores de medición con ref­er­en­cia especí­fi­ca al análi­sis de con­tenido, ver Budd, Thorp y Dono­hew [1966: 66–71]; Hol­sti [1969: 127–149]; Krip­pen­dorff [1980: 129–168].

[13] Sobre la opor­tu­nidad de dis­eñar el esque­ma de cod­i­fi­cación de tal man­era que per­mi­ta una actu­al­ización sen­cil­la, espe­cial­mente para proyec­tos de análi­sis de con­tenido que con­tengan un gran cuer­po de mate­r­i­al que no sea fácil o que no esté com­ple­ta­mente pre cod­i­fi­ca­ble, ver Budd, Thorp y Dono­hew [1966: 54].

[14] Tech­ni­cal Report 100.5, 9.30.1980:2; para una detal­la­da descrip­ción del pro­ce­so de com­para­ción ver Tec­ni­cal Reports 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4, y 100.5.

[15] Para más detalles, ver Fran­zosi [1986]. Sobre la base de estos con­cep­tos, he desar­rol­la­do una gramáti­ca para recolec­tar datos des­de el per­iódi­co sobre con­flic­tos indus­tri­ales. Tam­bién desar­rol­lé un pro­gra­ma de com­puta­do­ra (PC-ACE, Pro­gram for Com­put­er-Aid­ed Cod­ing of Events) que corre en com­puta­do­ras y sigue de cer­ca la gramáti­ca.

[16]Sobre este pun­to ver tam­bién Danzger [1975].

[17] Sobre noti­cias de per­iódi­cos sobre tamaños de mul­ti­tudes, ver Jacobs [1967]; ver tam­bién Danzger [1975: 574].

[18] Sobre el prob­le­ma acer­ca del muestreo por aceptación, ver Amer­i­can Sta­tis­ti­cal Asso­ci­a­tion [1950].

[19] Para más mediciones de fia­bil­i­dad, ver Krip­pen­dorf [1980: 129–54].

[20] Para muestreo en análi­sis de con­tenido, ver Budd, Thorp y Dono­hew [1966: 4–9]; Krip­pen­dorf [1980: 65–70].

[21] Uno tal vez se pre­gunte si el recur­so a tales con­cep­tos agre­ga­dos como dis­pu­ta o cam­pañas colec­ti­vas descal­i­f­i­can a los per­iódi­cos como fuentes de datos históri­cos. La duda es legí­ti­ma: después de todo, ¿no es ver­dad que los per­iódi­cos solo real­izan cróni­cas de even­tos como huel­gas, man­i­festa­ciones, etc.? Las dos cosas no son mutu­a­mente excluyentes, aunque tal vez lo parez­ca a primera vista. El hecho de que una dis­pu­ta sea una unidad de análi­sis más sig­ni­fica­ti­va que una huel­ga, sim­ple­mente sig­nifi­ca que la infor­ma­ción recolec­ta­da en el niv­el de even­tos dis­cre­tos deba ser aña­did a nive­les más altos de agre­gación; ver tam­bién la sec­ción Agre­gan­do datos: Unidades de análi­sis.

[22] Sobre estos pun­tos ver Budd, Thorp y Dono­hew [1966: 31–38]; Krip­pen­dorf [1980: 57–64].

[23] Sobre unidades ref­er­en­ciales en análi­sis de con­tenido, ver Budd, Thorp y Dono­hew [1966: 61–62].

[24] Para estos pun­tos, ver tam­bién Tilly [1969: 28–31].

[25] “Bási­ca­mente (un sis­tema de base de datos) es nada más que un sis­tema de reg­istro com­puta­riza­do, esto es, un sis­tema cuyo entero propósi­to es reg­is­trar y man­ten­er infor­ma­ción”. Cita­do de Date [1981]. Nor­mal­mente, un sis­tema de base de datos con­siste en var­ios archivos difer­entes que con­tienen infor­ma­ción sig­ni­fica­ti­va orga­ni­za­da bajo la gestión del potente soft­ware Data­Base Man­age­ment Sys­tems (DBMS). Hay tres man­eras prin­ci­pales por las cuales DBMS orga­ni­za los datos en la base de datos: rela­cional, jerárquico, en redes. El DBMS rela­cional, por ejem­p­lo, no solo per­mite a los usuar­ios crear bases de datos des­de cero, nos per­mite tam­bién realizar inser­ciones, bor­ra­dos y mod­i­fi­ca­ciones de entradas. Lo más impor­tante, nos per­mite realizar con­sul­tas, esto es, búsquedas a través de la base de datos para rela­ciones especí­fi­cas con el propósi­to de extraer­las. Además, podríamos realizar con­sul­tas de todos los even­tos en donde inter­vi­no la policía o en qué esta­do, en sus var­ios nive­les, inter­vi­no como árbi­tro en dis­putas entre capital/trabajo. Tam­bién, podríamos realizar con­sul­tas de todas las dis­putas que ocur­rieron en deter­mi­na­da fir­ma, ter­ri­to­rio o peri­o­do. En efec­to, el usuario no debería pre­ocu­parse, en cómo DBMS establece los indi­cadores (los vín­cu­los entre ítems de infor­ma­ción) y guar­da la infor­ma­ción; DBMS hace eso por ella o por él, hacien­do que el guarda­do y el mane­jo de estruc­turas de datos com­ple­jos sea muy sim­ple. Los vín­cu­los y rela­ciones explic­i­tas entre sím­bo­los incrus­ta­dos en una gramáti­ca, como se dis­cu­tió arri­ba, crea datos de los even­tos recolec­ta­dos uti­lizan­do una gramáti­ca ade­cua­da para las apli­ca­ciones de DBMS.

[26] Sobre los difer­entes nive­les en los cuales los análi­sis de even­tos de protes­ta han sido real­iza­dos ver Tilly [1969] y Sny­der y Kel­ly [1977: 105].

Bibliografía

Amer­i­can Sta­tis­ti­cal Asso­ci­a­tion
1950 Accep­tance Sam­pling. Amer­i­can Sta­tis­ti­cal Asso­ci­a­tion, Wash­ing­ton, DC.

Ben­son, Susan Porter
1978 The clerk­ing sis­ter­hood, ratio­nal­iza­tion and the work cul­ture of sales­women Amer­i­can depart­ment stores, 1890–1960. Rad­i­cal Amer­i­ca, 12:41–55.

Behar­rell, Peter y Greg Phi­lo
1977 Trade Unions and the media. MacMil­lan, Lon­don.

Berk, Richard
1983 An intro­duc­c­tion to sim­ple selec­tion bias in soci­o­log­i­cal data. Amer­i­can Soci­o­log­i­cal Review, 48:386–98.

Bloom­baum, Mil­ton
1968 The con­di­tions under­ly­ing race riots as por­trayed by mul­ti­di­men­sion­al scalo­gram analy­sis: A reanaly­sis of Lieber­son and Silverman’s data. Amer­i­can Soci­o­log­i­cal Review, 33:76–91.

Bow­ers, David
1967 A report on activ­i­ty by pub­lish­ers in direct­ing news­room deci­sions. Jour­nal­ism Quater­ly, 1:43–52.

Breed, War­ren
1955 Social con­trol in the news­room: A func­tion­al analy­sis. Social Forces, 33:326–335.

Budd, Richard, Robert Thorp y Lewis Dono­hew
1966 Con­tent analy­sis of com­mu­ni­ca­tions. MacMil­lan, Nue­va York.

Burch, Philip
1972 The man­age­r­i­al rev­o­lu­tion reassessed. Health and Co, Lex­ing­ton (Mass).

Bwy, Dou­glas
1968 Polit­i­cal insta­bil­i­ty in Latin Amer­i­ca: The cross-cul­tur­al test of a casu­al mod­el. Latin Amer­i­ca Research Review, III: 17–67.

Capec­chi, Vit­to­rio y Mari­no Livol­si
1971 La stam­pa quo­tid­i­ana in Italia. Bom­piani, Milano.

Cen­ter for Demog­ra­phy
100.5, 9.30.1980:2; 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4 Tech­ni­cal Report, The Uni­ver­si­ty of Wis­con­sin.

Charlesworth, Andrew
1979 Social protest in a rur­al soci­ety: The spa­tial dif­fu­sion of the Cap­tain Swing dis­tur­bances of 1830–1831. His­tor­i­cal Geog­ra­phy Research Series. Uni­ver­si­ty of East Anglia. Geo Abstracts Ltd, Nor­wich.

Chom­sky, Noam
1971 Chom­sky: Select­ed read­ings, J. P. B. Allen and Paul Van Buren (edit.). Oxford Uni­ver­si­ty Press, Lon­dres.

Danzger, M. Her­bert
1975 Val­i­dat­ing con­flict data. Amer­i­can Soci­o­log­i­cal Review, 40: 570–84.

Dar­d­ano, Mau­r­izio
1973 Il lin­guag­gio dei gior­nali ital­iani. Lat­erza, Bari.

Date Chris
1981 An intro­duc­tion to data­base sys­tems. Adis­son-Wes­ley, Read­ing, Mass.

De Luna, Gio­van­ni, Nan­da Tor­cel­lan y Pao­lo Murial­di
1980 La stam­pa ital­iana dal­la resisten­za agli anni ses­san­ta. Lat­erza, Bari: 304–308.

Downes, Bryan
1968 Social and polit­i­cal char­ac­ter­is­tics of riot cities: A com­par­a­tive study. Social Sci­ence Quater­ly, 49:504–520.
1970 A crit­i­cal reex­am­i­na­tion of the social and polit­i­cal char­ac­ter­is­tics of riot cities. Social Sci­ence Quater­ly, 51:349–360.

Down­ing, John
1980 The media machine. Plu­to Press, Lon­dres.

Eco, Umber­to
1971 Gui­da all’interpretazione del lin­guag­gio gior­nal­is­ti­co, en La stam­pa quo­tid­i­ana in Italia, Vit­to­rio Capec­chi y Mari­no Livol­si (edit.). Bom­piani, Milano.

Eisinger, Peter
1973 The con­di­tions of protest behav­ior in Amer­i­can cities. Amer­i­can Polit­i­cal Sci­ence Review, 67:11–28.

Feier­abend, Ivo y Ros­alind Feier­abend
1966 Aggres­sive behav­iors with­in poli­ties, 1948–1962: A cross-nation­al study. Jour­nal of Con­flict Res­o­lu­tion, 10:249–271.

Fran­zosi, Rober­to
1986 From words to num­bers: A gen­er­al­ized and com­put­er-based cod­ing pro­ce­dure for col­lect­ing event-data from news­pa­pers.

Galam­bos, Louis
1975 Pub­lic image about big busi­ness, 1880–1940: A quan­ti­ta­tive study in social change. The Johns Hop­kins Uni­ver­si­ty Press, Bal­ti­more.

Gans, Her­bert
1980 Decid­ing what’s news. Vin­tage Books, Nue­va York.

Gitlin, Todd
1980 The whole world is watch­ing. Uni­ver­si­ty of Cal­i­for­nia Press, Berke­ley.

Glas­gow Uni­ver­si­ty Media Group
1976 Bad News. Rout­lege and Kegan Paul, Lon­don.

Gurr, Ted Robert
1968 A casu­al mod­el of civ­il strife: A com­par­a­tive analy­sis using new indices. Amer­i­can Polit­i­cal Sci­ence Review, 62:1104–1124.

Hall, Stu­art
1977 Cul­ture, the media, and ide­o­log­i­cal effect, en Mass com­mu­ni­ca­tion and soci­ety, J. Cur­ran, M. Gure­vitch and J. Wool­la­cott (edit.). Sage, Bev­er­ly Hills.

Hart­mann, Paul
1975/76 Indus­tri­al rela­tions in the news media. Indus­tri­al Rela­tions Jour­nal, 6:4–18.
1979 News and pub­lic per­cep­tions of indus­tri­al rela­tions. Media, cul­ture and soci­ety, I: 255–270.

Heck­man, James
1979 Sam­ple selec­tion bias as a spec­i­fi­ca­tion error. Econo­met­ri­ca, 47:153–161.

Hob­s­bawm, Eric y George Rude
1968 Cap­tain Swing. W. W Nor­ton & Co., New York.

Hof­stet­ter, C. Richard
1976 Bias in the news. Ohio State Uni­ver­si­ty Press, Colum­bus (Ohio).

Hol­sti, Ole
1969 Con­tent analy­sis for the social sci­ences and human­i­ties. Addi­son-Wes­ley, Read­ing (Mass).

Jacobs, Her­bert
1967 To count a crowd. Colum­bia Jour­nal­ism Review, 1:37–40.

Jacob­son, Alvin
1973 Some the­o­ret­i­cal and method­olog­i­cal con­sid­er­a­tions for mea­sur­ing intraso­ci­etal con­flict. Soci­o­log­i­cal Meth­ods and Research, 1:439–461.

Kriesi, Hanspeter, R. Levy, G. Gan­guil­let, y H. Zwicky
1981 Poli­tis­che Aktivierang in der Schweiz, 1945–1978. Ver­lag Rueg­ger, Switzer­land.

Krip­pen­dorff, Klaus
1980 Con­tent analy­sis, an intro­duc­tion to its method­ol­o­gy. Sage, Bev­er­ly Hills.

Laswell, Harold, Daniel Lern­er y Ithiel de Sola
1952 The com­par­a­tive study of sym­bols. Stan­ford Uni­ver­si­ty Press, Stan­ford.

Lieber­son, Stan­ley y Arnold Sil­ver­man
1965 The pre­cip­i­tants and under­ly­ing con­di­tions of race riots. Amer­i­can Soci­o­log­i­cal Review, 30:887–898.

Mar­well, Ger­ald y Pamela Oliv­er
1984 Col­lec­tive action the­o­ry and social move­ments research, en Research in social move­ments, con­flicts, and change (Vol. 7), Louis Kries­berg (edit.). JAI Press INC., Lon­dres.

McAdam, Doug
1982 Polit­i­cal process and the devel­op­ment of black insur­gency 1930–1970. The Uni­ver­si­ty of Chica­go Press, Chica­go.

Molo­toch, Har­vey y Mar­i­lyn Lester
1974 News as pur­po­sive behav­ior: On the strate­gic use of rou­tine events, acci­dents, and scan­dals. Amer­i­can Soci­o­log­i­cal Review, 39:101–112.

Mor­ley, David
1976 Indus­tri­al con­flict and the mass media. Soci­o­log­i­cal Review, 24.

Mur­dock, Gra­ham y Peter Gold­ing
1977 Cap­i­tal­ism com­mu­ni­ca­tions and class rela­tions, en Mass com­mu­ni­ca­tion and soci­ety, James Cur­ran, Michael Gure­vitch and Janet Wool­la­cott (edit.). Sage, Bev­er­ly Hills.

Nedzyn­s­ki, Ste­fan
1973 Inequal­i­ty in Access to com­mu­ni­ca­tion facil­i­ties for work­ing class orga­ni­za­tion­sn, en Com­mu­ni­ca­tions, tech­nol­o­gy, and social pol­i­cy, George Gerb­n­er, Lar­ry Gross, and William Melody (edit.). Wiley, Nue­va York: 413–423.

Paige, Jef­fery
1975 Agrar­i­an rev­o­lu­tion. The Free Press, New York.

Piz­zorno, Alessan­dro
1973 I sin­da­cati nel sis­tema políti­co ital­iano; aspet­ti stori­ci, en Il Sis­tema políti­co Ital­iano, Pao­lo Far­neti (edit.). Il Muli­no, Bolon­ga.

Rum­mel, Rudolph
1963 Dimen­sions of con­flict behav­ior with­in and between nations. Gen­er­al Sys­tems Year­book, VIII: 1–50.
1965 A field the­o­ry of social action with appli­ca­tions to con­flict with­in nations. Gen­er­al Sys­tems Year­book, X: 183–211.

Rus­set, Bruce
1964 Inequal­i­ty and insta­bil­i­ty: The rela­tion of land tenure to pol­i­tics. World Pol­i­tics, XVI: 442–454.

Shalev, Michael
1978 Lies, Dammed Lies, and Strike Sta­tis­tics, en The resur­gence of class con­flict in West­ern Europe since 1968, Col­in Crouch and Alessan­dro Piz­zorno (edit.). MacMil­lan, Lon­dres.

Short­er, Edward y Charles Tilly
1974 Strikes in France. Cam­bridge Uni­ver­si­ty Press, Cam­bridge.

Sny­der, David y William Kel­ly
1977 Con­flict inten­si­ty, media sen­si­tiv­i­ty, and the valid­i­ty of news­pa­per data. Amer­i­can Soci­o­log­i­cal Review, 42:105–123.

Spiler­man, Sey­mour
1970 The caus­es of racial dis­tur­bances: A com­par­i­son of alter­na­tive expla­na­tions. Amer­i­can Soci­o­log­i­cal Review, 35:627–649.

Tan­ter, Ray­mond
1966 Dimen­sions of con­flict behav­ior with­in and between nations 1958–1960. The Jour­nal of Con­flict Res­o­lu­tion, X: 41–64.

Tilly, Charles
1969 Meth­ods for the study of col­lec­tive vio­lence, en Prob­lems in research on com­mu­ni­ty vio­lence, Ralph Conant and Mol­ly Apple Levin (edit.). Praeger, Nue­va York.

1981 As Soci­ol­o­gy meets his­to­ry. Aca­d­e­m­ic Press, Nue­va York.

Tuch­man, Gaye
1973 Mak­ing News by Doing Work: Rou­tiniz­ing the Unex­pect­ed. Amer­i­can Jour­nal of Soci­ol­o­gy, Vol. 79 (1): 110–131.

Wan­der­er, Jules
1969 An index of riot sever­i­ty and some cor­re­lates. Amer­i­can Jour­nal of soci­ol­o­gy, 74:500–509.

Zeller, Richard y Edward Carmines
1980 Mea­sure­ment in the social sci­ences, the link between the­o­ry and data. Cam­bridge Uni­ver­si­ty Press, Cam­bridge.

~•~

Cómo citar ¬

Roberto Franzosi, «La prensa como fuente de datos socio-históricos: Cuestiones sobre la metodología de recolección de datos a partir de periódicos», Revista de Estudios Marítimos y Sociales [En línea], publicado el [insert_php] echo get_the_time('j \d\e\ F \d\e\ Y');[/insert_php], consultado el . URL: https://wp.me/P7xjsR-Pv
~•~
Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento — No Comercial — Compartir Igual 4.0 Internacional.