La prensa como fuente de datos socio-históricos:
Cuestiones sobre la metodología de recolección de datos a partir de periódicos

The Press as a Sour­ce of Socio-His­to­ri­cal Data: Issues in the Metho­do­logy of Data Collec­tion from Newspapers

Rober­to Fran­zo­si*

Tra­duc­ción: Daniel Nico­lás Rabino**                     Revi­sión: Agus­tín San­te­lla*** y Lucia­na Salan­dro****

Introducción

Los cien­tí­fi­cos socia­les invo­lu­cra­dos en inves­ti­ga­cio­nes cuan­ti­ta­ti­vas de carác­ter empí­ri­co sue­len estar rela­ti­va­men­te des­preo­cu­pa­dos por los pro­ble­mas de medi­ción. La mayo­ría pre­fie­re comen­zar inme­dia­ta­men­te con esti­ma­cio­nes esta­dís­ti­cas y la cons­truc­ción de teo­ría. Esto es par­ti­cu­lar­men­te cier­to en rela­ción a los inves­ti­ga­do­res que uti­li­zan esta­dís­ti­cas ofi­cia­les reco­lec­ta­das por el gobierno. El hecho de que estas esta­dís­ti­cas estén impre­sas en publi­ca­cio­nes ofi­cia­les las hace irre­pro­cha­bles. En todo caso, al uti­li­zar esta­dís­ti­cas ofi­cia­les, sen­ti­mos que el pro­ble­ma no es nues­tro, ya que no reco­lec­ta­mos la infor­ma­ción noso­tros mis­mos. En el mejor de los casos, los pro­ble­mas de medi­ción son reco­no­ci­dos en notas de pági­na o apén­di­ces meto­do­ló­gi­cos difí­ci­les de encon­trar. La lite­ra­tu­ra cuan­ti­ta­ti­va sobre huel­gas es un buen ejem­plo. Se ha rea­li­za­do una gran can­ti­dad de inves­ti­ga­cio­nes uti­li­zan­do esta­dís­ti­cas guber­na­men­ta­les de huel­gas des­de comien­zos de este siglo; pero, a pesar de la baja cali­dad de estos datos, se le ha dado poca aten­ción a los pro­ble­mas de medi­ción.[1]

Es más difí­cil igno­rar com­ple­ta­men­te los pro­ble­mas de medi­ción cuan­do reco­lec­ta­mos nues­tros pro­pios datos, ya que nos sen­ti­mos obli­ga­dos por lo menos a des­cri­bir los pro­ce­di­mien­tos de reco­lec­ción. Gene­ral­men­te, no vamos más allá de eso. Las inves­ti­ga­cio­nes cuan­ti­ta­ti­vas de acción colec­ti­va y vio­len­cia colec­ti­va brin­dan un buen ejem­plo –la mayo­ría de estas inves­ti­ga­cio­nes se basa­ron en fuen­tes pri­ma­rias extraí­das de perió­di­cos. Pero, inclu­so en esta lite­ra­tu­ra, los pro­ble­mas de medi­ción han “reci­bi­do sólo una con­si­de­ra­ción sim­bó­li­ca” [Sny­der y Kelly 1977]. Esto impi­de ver las for­mas en que los pro­ce­sos de medi­ción pue­dan afec­tar los resul­ta­dos de los aná­li­sis esta­dís­ti­cos, y en últi­ma ins­tan­cia, nues­tras con­clu­sio­nes teóricas.

En este tex­to, ana­li­za­ré varios aspec­tos invo­lu­cra­dos en la reco­lec­ción de datos pro­ve­nien­tes de perió­di­cos. La pri­me­ra par­te se encar­ga­rá espe­cí­fi­ca­men­te de los aspec­tos rela­cio­na­dos con los erro­res de medi­ción (vali­da­ción y selec­ción de mues­tras par­cia­les, dise­ños de pro­ce­di­mien­tos de codi­fi­ca­ción y fia­bi­li­dad entre codi­fi­ca­do­res). La segun­da sec­ción ofre­ce algu­nas suge­ren­cias sobre la selec­ción de las mues­tras de perió­di­cos para ser usa­das como fuen­tes y su fre­cuen­cia de lec­tu­ra. Tam­bién se dis­cu­ti­rán las diver­sas uni­da­des de medi­ción y análisis.

Este tex­to se basa prin­ci­pal­men­te en mi inves­ti­ga­ción actual sobre la con­flic­ti­vi­dad en Ita­lia, basa­da en infor­ma­ción de perió­di­cos; sin embar­go, las defi­ni­cio­nes de los pro­ble­mas invo­lu­cra­dos y las solu­cio­nes pro­pues­tas son gene­ral­men­te váli­das. La prin­ci­pal reco­men­da­ción de este tex­to es que se le debe­ría dar más énfa­sis a los pro­ble­mas de vali­da­ción que a los de fia­bi­li­dad. La mag­ni­tud de los erro­res gene­ra­dos por pro­ble­mas de vali­da­ción es pro­ba­ble­men­te mucho mayor que los pro­ble­mas de fia­bi­li­dad. Pero, gene­ral­men­te se le pres­ta mayor aten­ción a los pro­ble­mas de fia­bi­li­dad, pro­ba­ble­men­te a cau­sa de la creen­cia gene­ra­li­za­da de que los inves­ti­ga­do­res no pue­den hacer nada para supe­rar los efec­tos de los ses­gos de infor­ma­ción (vali­dez) pro­du­ci­dos por los perió­di­cos. Las téc­ni­cas dis­cu­ti­das en este tex­to ofre­cen varias solu­cio­nes poten­cia­les a los pro­ble­mas de vali­da­ción de nues­tros datos.

Errores de medición
Validez y fiabilidad en los datos de eventos periodísticos

La medi­ción se preo­cu­pa por el pro­ble­ma de vin­cu­lar con­cep­tos abs­trac­tos con indi­ca­do­res empí­ri­cos” [Zeller y Car­mi­nes 1980]. Hay dos com­po­nen­tes para cual­quier pro­ble­ma de medi­ción, uno teó­ri­co y otro empí­ri­co. El com­po­nen­te teó­ri­co de la medi­ción se apli­ca a la rela­ción entre indi­ca­do­res empí­ri­cos y con­cep­tos teó­ri­cos. Por ejem­plo, la lite­ra­tu­ra sobre even­tos se intere­sa por los con­cep­tos abs­trac­tos como “lucha de cla­se”, “agi­ta­ción polí­ti­ca” y simi­la­res. ¿Qué es lo que los cien­tí­fi­cos socia­les tie­nen en men­te cuan­do pien­san en la “lucha de cla­ses”? ¿Serán los even­tos de gran esca­la que son tan carac­te­rís­ti­cos del reper­to­rio de acción colec­ti­va de los tra­ba­ja­do­res como las huel­gas, las mani­fes­ta­cio­nes, las mar­chas y los míti­nes?[2] ¿O están pen­san­do en for­mas de con­flic­to más sub­te­rrá­neas, difí­ci­les de detec­tar des­de afue­ra, pero cuyos sig­ni­fi­ca­dos socia­les son bas­tan­te cla­ros para los indi­vi­duos invo­lu­cra­dos?[3] Ade­más, dada la varie­dad de for­mas espe­cí­fi­cas de “lucha de cla­se” ¿pue­de un solo indi­ca­dor (huel­gas por ejem­plo) ser­vir para pro­veer una medi­da ade­cua­da, o sería mejor uti­li­zar múl­ti­ples indi­ca­do­res? Si fue­se así, ¿cómo podría uno enton­ces ana­li­zar­los?[4]

La pre­gun­ta es: ¿Has­ta qué pun­to los indi­ca­do­res empí­ri­cos ele­gi­dos miden el con­cep­to para el que fue­ron dise­ña­dos? El con­cep­to de vali­dez se refie­re a la noción de “un ins­tru­men­to que mide exac­ta­men­te lo que supues­ta­men­te debe medir y nada más” [Zeller y Car­mi­nes 1980]. Otra for­ma de decir esto es que la vali­dez se refie­re al gra­do del error sis­te­má­ti­co invo­lu­cra­do en el pro­ce­so de medi­ción; un ter­mó­me­tro no sería un ins­tru­men­to váli­do para medir la pre­sión san­guí­nea en lugar de la tem­pe­ra­tu­ra cor­po­ral [Zeller y Car­mi­nes 1980]. De igual mane­ra, las huel­gas gene­ra­les podrían no pro­veer una bue­na medi­ción del gra­do del con­flic­to de cla­se pre­sen­te en la socie­dad en cual­quier con­tex­to histórico.

Los pro­ce­sos que inter­vie­nen en ope­ra­cio­na­li­zar y en dar­le repre­sen­ta­ción empí­ri­ca a con­cep­tos abs­trac­tos refie­ren al com­po­nen­te empí­ri­co de medi­ción. Al res­pec­to, la pre­gun­ta es: habien­do acep­ta­do las huel­gas, por ejem­plo, como un buen indi­ca­dor empí­ri­co del con­flic­to de cla­se, ¿se ha intro­du­ci­do algún error al medir­las? El foco de aten­ción aquí es el error alea­to­rio y el con­cep­to que ofre­ce diá­lo­go con él es el de fia­bi­li­dad. “La fia­bi­li­dad da cuen­ta del gra­do de repe­ti­ción y con­sis­ten­cia de las medi­cio­nes empí­ri­cas” [Zeller y Car­mi­nes 1980].

Aun­que la vali­dez refie­re gene­ral­men­te al gra­do en que un indi­ca­dor mide un con­cep­to abs­trac­to, los pro­ble­mas de vali­dez sur­gen en dife­ren­tes nive­les de abs­trac­ción. Por ejem­plo, la vali­dez tal vez se refie­re al gra­do en que las huel­gas pro­veen una bue­na medi­da del con­flic­to de cla­se. A un nivel más con­cre­to, habien­do ele­gi­do a las huel­gas como una medi­da váli­da del con­flic­to de cla­se, la vali­dez refie­re al gra­do en que los archi­vos poli­cia­les, las esta­dís­ti­cas de huel­gas ofi­cia­les o los perió­di­cos pro­veen indi­ca­do­res vali­dos de huel­gas. ¿Cuán acer­ta­das son estas fuen­tes en su regis­tro de las huel­gas? ¿Qué for­ma de par­cia­li­dad sis­te­má­ti­ca intro­du­cen? En refe­ren­cia a los perió­di­cos, ¿son algu­nos even­tos más sus­cep­ti­bles o posi­bles de ser repor­ta­dos que otros? ¿Cuá­les son las carac­te­rís­ti­cas de estos even­tos? Estas son las pre­gun­tas de vali­dez que me con­cier­nen espe­cí­fi­ca­men­te y que voy a inten­tar responder.

La prensa como fuente de datos socio-históricos. El problema de la validez de los informes

Los perió­di­cos han sido con­si­de­ra­dos por his­to­ria­do­res y cien­tí­fi­cos socia­les, en for­ma gene­ral, como fuen­tes infor­ma­les de datos his­tó­ri­cos. Aun­que, en inves­ti­ga­cio­nes socia­les recien­tes, los perió­di­cos han sido uti­li­za­dos sis­te­má­ti­ca­men­te como fuen­te de datos. Por ejem­plo, Phi­lip Burch uti­li­zó perió­di­cos sema­na­les y dia­rios entre los años 1950 y 1971 para eva­luar el gra­do de con­trol geren­cial en las gran­des cor­po­ra­cio­nes. Louis Galam­bos acu­dió a los perió­di­cos para estu­diar los cam­bios en la acti­tud de la opi­nión públi­ca acer­ca de los gran­des nego­cios duran­te el cam­bio de siglo [Burch 1972]. Sin embar­go, es en el estu­dio de la acción colec­ti­va y de vio­len­cia polí­ti­ca don­de los perió­di­cos fue­ron más uti­li­za­dos como fuen­tes de datos.[5]

El pro­ble­ma en uti­li­zar la pren­sa como fuen­te de datos sobre even­tos, es que la vali­dez de la infor­ma­ción de par­te de los perió­di­cos es cues­tio­na­ble. Se ha argu­men­ta­do que los perió­di­cos difie­ren amplia­men­te en sus repor­tes y cober­tu­ras de noti­cias [Capec­chi y Livol­si 1971; Glas­gow Uni­ver­sity Media Group 1976; Kegan y Hart­mann 1975/76] y que, en todo caso, las noti­cias son par­cia­les y selec­ti­vas [Breed 1955; Bowers 1967, 1973; Gans 1980]. La selec­ti­vi­dad ha sido vis­ta como pro­duc­to de la pro­fe­sio­na­li­za­ción del perio­dis­ta, con sus pro­pios están­da­res de obje­ti­vi­dad refor­za­dos por cri­te­rios autó­no­mos para entre­na­mien­to, reclu­ta­mien­to e impe­ra­ti­vos de pro­mo­ción comer­cia­les, res­tric­cio­nes de espa­cio y tiem­po, y limi­ta­cio­nes impues­tas por la estruc­tu­ra orga­ni­za­cio­nal de las salas de noti­cias [Gitlin 1980]. De for­ma más extre­ma, Har­vey Molo­toch y Marilyn Les­ter [1974] “ven a los medios masi­vos de comu­ni­ca­ción como el refle­jo, no del mun­do, sino de las prác­ti­cas de aque­llos que tie­nen el poder para deter­mi­nar las expe­rien­cias de los otros”. Argu­men­tos simi­la­res han sido expre­sa­dos por algu­nos estu­dio­sos que tra­ba­jan con la tra­di­ción grams­cia­na de hege­mo­nía e ideo­lo­gía cul­tu­ral. Estos estu­dio­sos ven tan­to a los perió­di­cos como a los medios masi­vos de comu­ni­ca­ción como par­tes inte­gra­les del apa­ra­to ideo­ló­gi­co de las socie­da­des capi­ta­lis­tas y una de las prin­ci­pa­les agen­cias para la repro­duc­ción de estas socie­da­des a tra­vés de su inter­pre­ta­ción, emba­la­je y dis­tri­bu­ción de la reali­dad en toda la socie­dad [Gitlin 1980]. De acuer­do a esta escue­la de pen­sa­mien­to, la selec­ción de noti­cias no es alea­to­ria ‑refle­ja las inten­cio­nes, volun­ta­des e intere­ses de los gru­pos eco­nó­mi­cos domi­nan­tes [Hall 1977]. La cober­tu­ra de noti­cias repre­sen­ta de mane­ra erró­nea par­ti­cu­lar­men­te las cues­tio­nes labo­ra­les y de cla­se [Capec­chi y Livol­si 1971; Nedzyns­ki 1973; Glas­gow Uni­ver­sity Media Group 1976; Mor­ley 1976; Beha­rrell y Phi­lo 1977; Mur­dock y Gol­ding 1977; Hart­mann 1979; Dow­ning 1980].

Si estas crí­ti­cas son acep­ta­das, tam­bién debe­ría­mos pre­gun­tar­nos si los “hallaz­gos en con­flic­tos pue­den ser de hecho arti­lu­gios de patro­nes de publi­ca­ción de noti­cias” [Danz­ger 1975]. La pre­gun­ta aquí es si ana­li­za­mos patro­nes de even­tos his­tó­ri­cos o patro­nes de repor­tes de noti­cias [Danz­ger 1975; Tilly 1969]. Aun­que esta es una pre­gun­ta seria y dañi­na, ya que apun­ta a la poten­cial con­ta­mi­na­ción entre el fenó­meno de inte­rés y los pro­ce­di­mien­tos para regis­trar­lo, hay varias razo­nes para ser optimistas.

Pri­me­ro, más allá de las limi­ta­cio­nes de los perió­di­cos como fuen­tes de datos his­tó­ri­cos, a menu­do cons­ti­tu­yen la úni­ca fuen­te de infor­ma­ción dis­po­ni­ble. En su estu­dio sobre las revo­lu­cio­nes agra­rias, Jef­frey Pai­ge [1975] escri­be, “nin­gu­na com­pi­la­ción de even­tos, tal cual están defi­ni­dos en esta mono­gra­fía (como una acción o serie de accio­nes colec­ti­vas en el sec­tor de la agri­cul­tu­ra de expor­ta­ción) está dis­po­ni­ble, por lo que fue nece­sa­rio para compu­tar la can­ti­dad de even­tos uti­li­zar las fuen­tes perio­dís­ti­cas”.[6] La exclu­sión de los datos perio­dís­ti­cos impe­di­ría inves­ti­ga­cio­nes en cam­pos don­de no hay datos alter­na­ti­vos dis­po­ni­bles [McA­dam 1982].

Segun­do, mien­tras hay pro­ble­mas con la pren­sa como fuen­te de datos his­tó­ri­cos sobre con­flic­tos, debe­ría­mos recor­dar que no hay fuen­tes de datos sin erro­res, inclu­yen­do las esta­dís­ti­cas ofi­cia­les [Sha­lev 1978]. En la ausen­cia de vali­da­cio­nes sis­te­má­ti­cas y com­pa­ra­ti­vas, no hay razón a prio­ri para creer que los datos reco­gi­dos de perió­di­cos serán menos vali­dos que otras fuen­tes común­men­te utilizadas.

Ter­ce­ro, no todos los even­tos o artícu­los de infor­ma­ción son igual­men­te malin­ter­pre­ta­dos en la pren­sa. Algu­nas noti­cias pare­cie­ran estar más afec­ta­das por las polí­ti­cas edi­to­ria­les.[7] Por ejem­plo, los perió­di­cos gene­ral­men­te con­cuer­dan en sus repor­tes en el tipo de acción invo­lu­cra­da (huel­ga, demos­tra­ción, sen­ta­da, etc.), su loca­li­za­ción y fecha, la iden­ti­dad gene­ral de los par­ti­ci­pan­tes (tra­ba­ja­do­res, estu­dian­tes, negros, poli­cía, etc.) y si la gen­te fue arres­ta­da, las­ti­ma­da o ase­si­na­da. Aun­que pare­cie­ra que habrá varia­cio­nes en sus repor­tes acer­ca de las razo­nes que le dan a la acción de la gen­te o la res­pon­sa­bi­li­dad dada a cier­tos gru­pos (tra­ba­ja­do­res con­tra poli­cía, por ejem­plo) por accio­nes espe­cí­fi­cas (daño a la pro­pie­dad o vio­len­cia) a gru­pos en par­ti­cu­lar, más que a otros gru­pos (tra­ba­ja­do­res o poli­cías).[8] La inter­pre­ta­ción de los even­tos, tal cual fue­ron expre­sa­dos por las edi­to­ria­les o algu­nas veces mez­cla­dos con los repor­tes de hechos con­cre­tos, son par­ti­cu­lar­men­te sus­cep­ti­bles a influen­cias. Diver­sos tipos de accio­nes con­flic­ti­vas tam­bién tie­nen diver­sas pro­ba­bi­li­da­des de ser repor­ta­dos. Por ejem­plo, David Sny­der y William Kelly argu­men­tan que “por razo­nes de tama­ño, vio­len­cia e impac­to polí­ti­co”, las gue­rras civi­les, gol­pes de esta­dos y arres­tos masi­vos son repor­ta­dos más exhaus­ti­va­men­te que los exi­lios, arres­tos de per­so­nas insig­ni­fi­can­tes, cri­sis den­tro de orga­ni­za­cio­nes no guber­na­men­ta­les o huel­gas [Sny­der y Kelly 1977: 109–110].

Cuar­to, tal cual indi­can Sny­der y Kelly, la pro­ba­bi­li­dad de erro­res en los repor­tes siem­pre pue­de redu­cir­se ele­van­do el umbral míni­mo de reco­lec­to­res (50 indi­vi­duos en vez de 10, actuan­do colec­ti­va­men­te) [Tilly 1969: 29–30; Sny­der y Kelly 1977: 109]. La mayo­ría de los estu­dios sobre la cober­tu­ra de medios de comu­ni­ca­ción está de acuer­do con que los even­tos a gran esca­la difí­cil­men­te pasen des­aper­ci­bi­dos en los medios.

Final­men­te, el tipo de influen­cias que más común­men­te pue­de ocu­rrir en los medios masi­vos de comu­ni­ca­ción con­sis­te, más en el silen­cio o en el énfa­sis, que en dar fal­sa infor­ma­ción. Como dicen Vit­to­rio Capec­chi y Marino Livolsi:

La distorsión de noticias no opera demasiado a través de una alteración obvia de un evento (por ejemplo: la noticia de que “A ama a B” reportada por un diario de derecha y que aparece como “A odia a B” es un diario de izquierda), sino más bien a través de la bajada de línea como de la insistencia en algunas características de un evento [Capecchi y Livolsi, 1971: 264].

La infor­ma­ción se mani­pu­la a tra­vés del uso de adje­ti­vos, la fre­cuen­cia de cier­tos sus­tan­ti­vos, el uso de sinó­ni­mos y pará­fra­sis, comen­ta­rios y edi­to­ria­les, y títu­los y sub­tí­tu­los, des­de el énfa­sis en algu­nas carac­te­rís­ti­cas de un even­to a la omi­sión de otras, y la rup­tu­ra de la infor­ma­ción y su recons­truc­ción de una for­ma que sugie­re rela­cio­nes cau­sa­les pre­ci­sas.[9] El len­gua­je es la herra­mien­ta de mani­pu­la­ción mediá­ti­ca, “el soni­do de ambien­te que ampli­fi­ca o redu­ce las reac­cio­nes emo­cio­na­les del lec­tor, y que sub­ra­ya las carac­te­rís­ti­cas posi­ti­vas o nega­ti­vas que el perió­di­co atri­bu­ye a un actor en par­ti­cu­lar” [Capec­chi y Livol­si 1971: 270]. Así el pre­jui­cio de los perió­di­cos ten­dría menos que ver con el víncu­lo del obje­to de infor­ma­ción con la reali­dad que con la pro­ba­bi­li­dad de que un obje­to de infor­ma­ción apa­rez­ca una o más veces en uno o más artícu­los con­cer­nien­tes a un even­to. Por con­si­guien­te, al uti­li­zar la pren­sa como una fuen­te de datos his­tó­ri­cos, toma­mos el ries­go de reco­lec­tar insu­fi­cien­te, en vez de defec­tuo­sa, infor­ma­ción. En este sen­ti­do, el pro­ble­ma pue­de ser menos seve­ro de lo que las inves­ti­ga­cio­nes sobre medios nos han lle­ga­do a hacer creer.

El sesgo en la elección de la muestra. El problema y algunas soluciones

Como hemos vis­to, los datos reco­lec­ta­dos de los perió­di­cos sue­len care­cer de vali­dez en cier­tas for­mas no alea­to­rias. Como con­se­cuen­cia, esos datos pue­den no con­si­de­rar­se como un sub­con­jun­to alea­to­rio de una pobla­ción de even­tos. Al final, esto sig­ni­fi­ca que los test esta­dís­ti­cos por infe­ren­cia que nos per­mi­ten gene­ra­li­zar los resul­ta­dos a par­tir de una mues­tra a toda una pobla­ción no son apli­ca­bles. No pode­mos sim­ple­men­te igno­rar el pro­ble­ma pre­ten­dien­do no gene­ra­li­zar los resul­ta­dos de la mues­tra al uni­ver­so [Berk 1983: 396]. La exclu­sión sis­te­má­ti­ca de una par­te de las obser­va­cio­nes intro­du­ce erro­res de espe­ci­fi­ca­ción que influ­yen en la rela­ción entre las varia­bles en el mode­lo. La direc­ción y el peso de estas influen­cias no son fáci­les de pre­de­cir. “La difi­cul­tad es que uno arries­ga con­fun­dir el fenó­meno subs­tan­ti­vo de inte­rés con el pro­ce­so de selec­ción” [Berk 1983: 391]. ¿Refle­ja­ría un incre­men­to del 10% en la fre­cuen­cia de repor­tes de deter­mi­na­dos even­tos ten­den­cias reales simi­la­res, o este incre­men­to solo res­pon­de a un inte­rés repen­tino de los medios? De mane­ra simi­lar, “la fal­ta de con­flic­tos repor­ta­dos tal vez no sig­ni­fi­ca que los con­flic­tos no ocu­rrie­ron… los repor­tes de perió­di­cos pue­den ser acep­ta­dos como datos de que el even­to ocu­rrió, pero la ausen­cia de repor­tes no pue­de tomar­se como indi­ca­dor de que los even­tos no ocu­rrie­ron” [Danz­ger 1975: 570, 581].

Por supues­to, si el nivel de infor­ma­ción erró­nea fue­se cons­tan­te a tra­vés de varias uni­da­des de agre­ga­ción de datos (tiem­po, espa­cio, sec­tor eco­nó­mi­co u otro), el pro­ble­ma no sería tan serio. Jef­frey Pai­ge, por ejem­plo, fue capaz de mos­trar que hubo acuer­dos con­si­de­ra­bles en la dis­tri­bu­ción espa­cial y sec­to­rial de los even­tos entre pren­sa pri­ma­ria (local) y secun­da­rias (inter­na­cio­nal) para los casos de Perú y Ango­la, a pesar del gran núme­ro de even­tos regis­tra­dos en la pren­sa local [Pai­ge 1975]. Aun­que, en gene­ral, la evi­den­cia dis­po­ni­ble pare­ce indi­car que los patro­nes tem­po­ra­les y espa­cia­les de las noti­cias perio­dís­ti­cas no se corres­pon­den con los patro­nes de la vida real. Por ejem­plo, se ha argu­men­ta­do que los des­ór­de­nes racia­les ocu­rri­dos en ciu­da­des con o sin expe­rien­cias pre­vias de con­flic­tos racia­les tie­nen dife­ren­tes pro­ba­bi­li­da­des de ser repor­ta­dos, dis­tor­sio­nan­do así la dis­tri­bu­ción geo­grá­fi­ca de los even­tos.[10]

Ade­más, es pro­ba­ble que haya dife­ren­cias geo­grá­fi­cas inter­na­cio­na­les y nacio­na­les al momen­to de repor­tar. Pri­me­ro, la posi­ción geo­po­lí­ti­ca de un país y el inte­rés del mun­do en sus asun­tos domés­ti­cos así como tam­bién la pre­sen­cia de la cen­su­ra de medios podrían afec­tar la pro­ba­bi­li­dad de repor­tar los even­tos que ocu­rren en ese país, por la pren­sa inter­na­cio­nal [Rum­mel 1963; Tan­ter 1966]. Inclu­so las cober­tu­ras de even­tos nacio­na­les sufren par­cia­li­dad geo­grá­fi­ca. Por ejem­plo, David Sny­der y William Kelly “se die­ron cuen­ta de que muy pocas pro­tes­tas ocu­rri­das en las ciu­da­des del oes­te de Esta­dos Uni­dos apa­re­cían en el New York Times” [Sny­der y Kelly 1977: 119–120]. Ambos, los patro­nes geo­grá­fi­cos y tem­po­ra­les, son pro­ba­ble­men­te dis­tor­sio­na­dos por la pren­sa. De nue­vo, Sny­der y Kelly argu­men­tan que, en el lar­go pla­zo, hay una rela­ción en U inver­ti­da entre la fre­cuen­cia y los even­tos con­flic­ti­vos [Sny­der y Kelly 1977: 119–120]. Aun­que sería difí­cil espe­ci­fi­car cuán­tos días, meses o años toma­rían para que el lar­go pla­zo fun­cio­ne, Sny­der y Kelly apun­tan a un impor­tan­te aspec­to del repor­te de los con­flic­tos, que los patro­nes tem­po­ra­les de los infor­mes perio­dís­ti­cos no serían sin­cró­ni­cos con los patro­nes de even­tos his­tó­ri­cos.[11]

Para resol­ver el pro­ble­ma de la selec­ción de mues­tras par­cia­les des­de el pun­to de vis­ta esta­dís­ti­co, nece­si­ta­ría­mos un mode­lo de la deter­mi­na­ción de la par­cia­li­dad, es decir, una teo­ría de la selec­ción. Si la infor­ma­ción sepa­ra­da estu­vie­se dis­po­ni­ble en ambos sub­con­jun­tos, el selec­cio­na­do y el no selec­cio­na­do, sería posi­ble esti­mar un mode­lo estruc­tu­ral for­mal de ecua­ción con una ecua­ción “subs­tan­ti­va” y una ecua­ción “par­cial” [Heck­man 1979; Berk 1983]. Des­afor­tu­na­da­men­te, en el caso de reco­lec­tar even­tos de pro­tes­ta a par­tir de perió­di­cos, no pare­cie­ra que una ecua­ción for­mal de la mues­tra de selec­ción de par­cia­li­dad pudie­se ser esti­ma­da. En gene­ral, sabe­mos dema­sia­do poco acer­ca de los meca­nis­mos de selec­ción de noti­cias. Aun­que sería posi­ble apli­car el pro­ce­di­mien­to de correc­ción para even­tos selec­cio­na­dos o perio­dos de mues­tra selec­cio­na­dos para los cua­les fuen­tes alter­na­ti­vas de infor­ma­ción estén dis­po­ni­bles. En otros casos, es posi­ble que sim­ple­men­te inclu­yen­do en el mode­lo medi­das en las loca­li­za­cio­nes de los corres­pon­sa­bles de los perió­di­cos loca­les pudie­ra mejo­rar el poder expli­ca­ti­vo del mode­lo [Danz­ger 1975; ver, no obs­tan­te, Sny­der y Kelly 1977].

Más allá de que el pro­ble­ma de la selec­ción de mues­tra par­cial pue­de ser resuel­to for­mal­men­te en un mode­lo esta­dís­ti­co o no, se le debe­ría dar más aten­ción a este asun­to del que se le da nor­mal­men­te en la lite­ra­tu­ra de pro­tes­ta. Como míni­mo, reco­mien­do la rea­li­za­ción de reco­lec­cio­nes para­le­las de infor­ma­ción de “con­trol”, inclu­so solo por un sub­con­jun­to del total del perio­do de mues­tra, dis­tri­bu­ción geo­grá­fi­ca y tipos de even­tos de inte­rés. El pro­pó­si­to gene­ral de reco­ger infor­ma­ción de con­trol poco difie­re en espí­ri­tu de las téc­ni­cas común­men­te uti­li­za­das en encues­tas de inves­ti­ga­ción para reco­ger tan­ta infor­ma­ción como sea posi­ble sobre los no encues­ta­dos. Inves­ti­ga­cio­nes cui­da­do­sas sobre las carac­te­rís­ti­cas de los encues­ta­dos ver­sus no encues­ta­dos son de mucha ayu­da en eva­luar la vali­dez de nues­tras infe­ren­cias. Tales inves­ti­ga­cio­nes son prác­ti­cas están­dar en las inves­ti­ga­cio­nes por encues­tas, pero rara­men­te se encuen­tran en los estu­dios sobre even­tos his­tó­ri­cos. Espe­cí­fi­ca­men­te, suge­ri­ría reco­lec­tar la siguien­te infor­ma­ción de “con­trol”.

Pri­me­ro, los inves­ti­ga­do­res que se dedi­can a perio­dos his­tó­ri­cos que inclu­yan el pre­sen­te debe­rían esta­ble­cer pro­ce­di­mien­tos de regis­tro inde­pen­dien­te, inclu­so si fue­se solo por un peque­ño sub­con­jun­to de un terri­to­rio de inte­rés y por un limi­ta­do perio­do de tiem­po. Emplea­do­res, sin­di­ca­tos loca­les y aso­cia­ción de emplea­do­res, depar­ta­men­tos de poli­cía, u orga­ni­za­cio­nes de dere­chos civi­les, pue­den ser per­sua­di­dos a reco­lec­tar y pro­veer infor­ma­ción valio­sa “de acuer­do con están­da­res acep­ta­bles para los inves­ti­ga­do­res” [Tilly 1969: 31]. La infor­ma­ción así reco­gi­da podría enton­ces ser com­pa­ra­da con la infor­ma­ción repor­ta­da por los periódicos.

Segun­do, por lo menos para estu­dios sobre con­flic­tos indus­tria­les, la infor­ma­ción de algu­na empre­sa sig­ni­fi­ca­ti­va repor­ta­da por la pren­sa podría com­pa­rar­se con la infor­ma­ción reco­lec­ta­da por las empre­sas mis­mas (en la medi­da en estas ten­gan la volun­tad de abrir sus regis­tros a los inves­ti­ga­do­res). La ven­ta­ja de este abor­da­je por sobre la ante­rior es que ofre­ce una dimen­sión his­tó­ri­ca poten­cial, ya que las empre­sas podrían tener archi­vos de con­flic­tos a lo lar­go del tiem­po. La des­ven­ta­ja es que la mues­tra de las empre­sas cuya infor­ma­ción podría usar­se (más allá de la volun­tad de las empre­sas para habi­li­tar esa infor­ma­ción) lo más pro­ba­ble es que sea par­cial a favor de las gran­des fir­mas. Es menos pro­ba­ble que las peque­ñas o media­nas fir­mas ten­gan infor­ma­ción sobre huelgas.

Una ter­ce­ra apro­xi­ma­ción apro­ve­cha­ría cual­quier otra enu­me­ra­ción pre­exis­ten­te de even­tos, en la medi­da en que estas lis­tas sean real­men­te inde­pen­dien­tes y que no pro­ven­gan de la mis­ma fuen­te perio­dís­ti­ca. Muy a menu­do, como obser­va Her­bert Danz­ger, “lo que pare­cie­ran ser fuen­tes nume­ro­sas son tras un examen cer­cano, pri­ma­ria­men­te la mis­ma fuen­te con dife­ren­te dis­fraz” [Danz­ger 1975: 573]. Anua­rios, pro­ce­di­mien­tos de la cor­te, resul­ta­dos de inves­ti­ga­cio­nes de un comi­té par­la­men­ta­rio ad hoc, encues­tas de agen­cias espe­cia­li­za­das en la reco­lec­ción infor­ma­ción, y por supues­to, archi­vos poli­cia­les (a pesar de que estos últi­mos gene­ral­men­te no están abier­tos al públi­co para las déca­das más recien­tes) pue­den pro­veer infor­ma­ción útil [Tilly 1969: 23–24, 30]. Asi­mis­mo, en el caso del con­flic­to indus­trial en Ita­lia, com­pa­ra­cio­nes día a día de los even­tos de huel­ga reco­lec­ta­dos de perió­di­cos se podrían com­pa­rar sis­te­má­ti­ca­men­te con los casos repor­ta­dos por ISTAT, la agen­cia guber­na­men­tal ofi­cial de esta­dís­ti­cas, des­de 1976 cuan­do ISTAT comen­zó a guar­dar dia­ria­men­te los datos de huel­gas en cin­tas magnéticas.

Cuar­to, debe­rían hacer­se com­pa­ra­cio­nes perió­di­cas sis­te­má­ti­cas a lo lar­go de varios dia­rios de dife­ren­tes posi­cio­nes ideo­ló­gi­cas y perio­dís­ti­cas. Inclu­so una sema­na cada tres o cin­co años sería sufi­cien­te; con­sul­tan­do varios dia­rios, inclu­so por tan cor­to perio­do de mues­tra y con ese inter­va­lo de mues­treo tan lar­go sería­mos capa­ces de medir el efec­to de uti­li­zar solo un dia­rio del tipo de dato reco­lec­ta­do. Ade­más, las com­pa­ra­cio­nes sis­te­má­ti­cas en dife­ren­tes pun­tos en el tiem­po ayu­da­rían a moni­to­rear los cam­bios en el gra­do de cober­tu­ra de la fuen­te selec­cio­na­da para el análisis.

Final­men­te, si las defi­ni­cio­nes que cali­fi­can los even­tos para reco­lec­tar han sido man­te­ni­das sufi­cien­te­men­te amplias, se pue­den rea­li­zar aná­li­sis sepa­ra­dos a varios nive­les de umbra­les. Los resul­ta­dos esta­dís­ti­cos obte­ni­dos en los nive­les de umbral más altos, y con­se­cuen­te­men­te a nive­les más altos de vali­dez, enton­ces pue­den ser uti­li­za­dos como varas de medi­ción con­tra las cua­les pue­dan com­pa­rar­se los resul­ta­dos obte­ni­dos en nive­les más bajos [Tilly 1969: 23–24, 30].

Como escri­bió Char­les Tilly, “las com­pa­ra­cio­nes entre even­tos de perió­di­cos y otras fuen­tes des­ani­man cual­quier espe­ran­za de arri­bar a la “mis­ma” lis­ta de dis­tur­bios de estas diver­sas fuen­tes, pero sí indi­can que los perió­di­cos pro­veen la más com­ple­ta enu­me­ra­ción y de que sus pre­jui­cios prin­ci­pa­les se diri­gen sobre todo a sobre-repor­tar even­tos en gran­des ciu­da­des” [Tilly 1969: 23–24, 30]. De nue­vo, el pro­pó­si­to en estos esfuer­zos en la reco­lec­ción inde­pen­dien­te de datos, no es lle­gar a una enu­me­ra­ción de even­tos lo más cer­ca­na posi­ble a los even­tos de la pobla­ción, que de por sí sería lo más desea­ble, sino para desa­rro­llar una mejor com­pren­sión de las carac­te­rís­ti­cas de los even­tos en la mues­tra del perió­di­co. La reco­lec­ción de datos com­pa­ra­ti­vos debe­ría ser una par­te inte­gral del dise­ño de pro­yec­tos de inves­ti­ga­cio­nes que invo­lu­cren reco­lec­ción de datos periodísticos.

Esquemas de codificación y fiabilidad del registro

Has­ta este pun­to, he tra­ta­do prin­ci­pal­men­te con pro­ble­mas de vali­dez de datos (o el error sis­te­má­ti­co de los repor­tes de perió­di­cos). En las apli­ca­cio­nes espe­cí­fi­cas invo­lu­cra­das en uti­li­zar datos de perió­di­cos, los erro­res gene­ra­dos por pro­ble­mas de vali­dez pare­cie­ran eclip­sar a los pro­ble­mas gene­ra­dos por la fia­bi­li­dad. No obs­tan­te, hay al menos dos fuen­tes de erro­res alea­to­rios (con­fia­bi­li­dad) invo­lu­cra­dos en reco­lec­tar datos de perió­di­cos, que se pro­du­cen de los erro­res de trans­crip­ción o regis­tro. Ocu­rren cuan­do 1) los codi­fi­ca­do­res inter­pre­tan erró­nea­men­te uno o más ítems de la infor­ma­ción con­te­ni­da en un artícu­lo de perió­di­co (los erro­res de codi­fi­ca­ción rela­cio­na­dos al pro­ble­ma más gene­ral de con­fia­bi­li­dad entre dife­ren­tes codi­fi­ca­do­res); o 2) los codi­fi­ca­do­res regis­tran equi­vo­ca­da­men­te la infor­ma­ción en pape­les o direc­ta­men­te en la compu­tado­ra (error de entra­da de datos). Esta y la siguien­te sec­ción tra­tan estos tipos de erro­res de con­fia­bi­li­dad.[12]

La reco­lec­ción de infor­ma­ción de perió­di­cos está gene­ral­men­te basa­da en aná­li­sis de con­te­ni­dos emplean­do esque­mas de codi­fi­ca­ción que con­sis­ten en una serie de cate­go­rías. El siguien­te cri­te­rio debe­ría guiar la pre­pa­ra­ción de esque­mas de codificación:

  1. Las cate­go­rías debe­rían tener un víncu­lo direc­to, indi­vi­dual­men­te o en un gru­po de otras cate­go­rías, con una o más hipó­te­sis de inte­rés [Las­well et al. 1952, cita­do en Budd et al. 1966];
  2. Las cate­go­rías debe­rían ser mutual­men­te exclu­yen­tes [Krip­pen­dorf 1980: 83];
  3. Las cate­go­rías debe­rían man­te­ner una seme­jan­za con el len­gua­je uti­li­za­do por los perió­di­cos [Krip­pen­dorf 1980: 84].

Ítems o cate­go­rías sean muy abs­trac­tas o gene­ra­les posi­ble­men­te lle­va­rán a amplias dife­ren­cias de inter­pre­ta­ción entre los lec­to­res. Para mejo­rar la homo­ge­nei­dad de los datos y la con­fia­bi­li­dad entre los codi­fi­ca­do­res, los con­cep­tos y cate­go­rías gene­ra­les debe­rían con­ver­tir­se en ítems ele­men­ta­les de infor­ma­ción tal cual fue­ron infor­ma­dos por los mis­mos perió­di­cos. Es pre­fe­ri­ble recom­po­ner las cate­go­rías más gene­ra­les de inte­rés teó­ri­co duran­te la fase tar­día del aná­li­sis de datos, agre­gan­do los ítems más ele­men­ta­les de infor­ma­ción a tra­ba­jar con cate­go­rías cuyos pro­ce­sos de agre­ga­ción sub­ya­cen­tes pare­cie­sen variar amplia­men­te entre los lec­to­res. Esto, en cam­bio, impli­ca fami­lia­ri­dad con el mate­rial tex­tual o teó­ri­co a ser codi­fi­ca­do antes de la pre­pa­ra­ción del esque­ma de codificación.

Una vez que el esque­ma de codi­fi­ca­ción esté lis­to y haya pasa­do por exten­sas prue­bas, el pro­yec­to pue­de lle­var­se a su segun­da fase: el regis­tro de infor­ma­ción de los perió­di­cos. Tra­di­cio­nal­men­te, la codi­fi­ca­ción se ha rea­li­za­do con esque­mas de codi­fi­ca­ción en base a papel. La lle­ga­da de las micro­compu­tado­ras pare­cie­ra haber con­ver­ti­do a esta téc­ni­ca en obso­le­ta ya que pue­den ser uti­li­za­das para codi­fi­car infor­ma­ción direc­ta­men­te a la máquina.

Las ven­ta­jas de las entra­das direc­tas por sobre las trans­crip­cio­nes manua­les son dos: 1) las entra­das direc­tas son menos cos­to­sas; y 2) pro­du­cen datos más con­fia­bles. La entra­da direc­ta evi­ta el paso inter­me­dio de codi­fi­car en papel. Aun­que requie­re la adqui­si­ción de una micro­compu­tado­ra, este cos­to pare­cie­ra ser com­pen­sa­do por los aho­rros efec­tua­dos al no tener que impri­mir esque­mas de codi­fi­ca­ción o de ingre­sar codi­fi­ca­cio­nes de datos en la compu­tado­ra a mano; aun­que la ver­da­de­ra ven­ta­ja de la entra­da direc­ta es que per­mi­te un inme­dia­to con­trol auto­má­ti­co, onli­ne, de la infor­ma­ción codi­fi­ca­da (orto­gra­fía de nom­bres de loca­li­da­des y sec­to­res indus­tria­les, tiem­po de los even­tos, con­sis­ten­cia inter­na de cate­go­rías codi­fi­ca­das). Asi­mis­mo, la entra­da direc­ta per­mi­te una fácil actua­li­za­ción del esque­ma de codi­fi­ca­ción.[13] Otros pro­yec­tos de reco­lec­ción de datos a gran esca­la han ele­gi­do la mis­ma estra­te­gia. En la base de una com­pa­ra­ción ade­cua­da de los tiem­pos de codi­fi­ca­cion y la pro­por­ción de error en las trans­crip­cio­nes manua­les y en las entra­das direc­tas, las inves­ti­ga­cio­nes invo­lu­cra­das en el “40–50 Pro­ject” del Bureau de Esta­dos Uni­dos del Cen­sus con­clu­ye, “la entra­da de datos direc­tos es más rápi­da que el pro­ce­so de trans­crip­ción manual…además, los datos ingre­sa­dos direc­ta­men­te son de una cali­dad supe­rior”.[14]

Final­men­te, la entra­da direc­ta de datos pue­de com­bi­nar­se con con­cep­tos pode­ro­sos desa­rro­lla­dos en el cam­po de la inte­li­gen­cia arti­fi­cial y el len­gua­je mate­má­ti­co para pro­du­cir archi­vos his­tó­ri­cos que son mucho más fle­xi­bles y ricos en infor­ma­ción de con­te­ni­dos que los per­mi­ti­dos a tra­vés de los esque­mas de codi­fi­ca­ción tra­di­cio­na­les. El con­cep­to de gra­má­ti­ca es par­ti­cu­lar­men­te útil [Chomsky 1971]. La gra­má­ti­ca de un len­gua­je indi­ca las reglas para com­bi­nar pala­bras en fra­ses. Ambos, los esque­mas de gra­má­ti­ca y de codi­fi­ca­ción, nos per­mi­ten ajus­tar hilos tex­tua­les en casi­lle­ros, ya sea a tra­vés de la codi­fi­ca­ción de cate­go­rías o estruc­tu­ras gra­ma­ti­ca­les, como suje­to, ver­bo, obje­to y otros. La ven­ta­ja de una gra­má­ti­ca es que pro­vee una for­ma pode­ro­sa de conec­tar cate­go­rías, con las cone­xio­nes espe­ci­fi­cas por la mis­ma gra­má­ti­ca. En un esque­ma de codi­fi­ca­ción tra­di­cio­nal, los víncu­los y cone­xio­nes entre cate­go­rías no pue­den imple­men­tar­se fácil­men­te.[15]

Inclu­so la entra­da direc­ta (basa­da en esque­mas de codi­fi­ca­ción tra­di­cio­na­les o gra­má­ti­cas), para todo che­queo onli­ne, no pue­de garan­ti­zar datos libres de erro­res de regis­tro. Como hemos vis­to, los regis­tra­do­res pue­den come­ter erro­res al ingre­sar datos en la compu­tado­ra (erro­res de entra­da de datos) o inter­pre­tar equi­vo­ca­da­men­te uno o más ítems de infor­ma­ción con­te­ni­da en los artícu­los periodísticos.

Muchos erro­res en la entra­da de datos son iden­ti­fi­ca­dos auto­má­ti­ca­men­te por la compu­tado­ra (Nuw York en vez de New York, Enero 35, 1952, etc.) otros erro­res no son auto­má­ti­ca­men­te iden­ti­fi­ca­dos (por ejem­plo, la dura­ción de una huel­ga de dos horas, tipea­da equi­vo­ca­da­men­te como de 22 horas). El pro­gra­ma de compu­tado­ra que rea­li­za la entra­da direc­ta de datos podría ser dise­ña­do para mos­trar toda la infor­ma­ción codi­fi­ca­da por cada artícu­lo en la pan­ta­lla; este le pedi­rá al lec­tor veri­fi­car los datos recién ingre­sa­dos antes de con­ti­nuar la codi­fi­ca­ción del siguien­te artícu­lo. Aun­que la posi­bi­li­dad de error pue­da exis­tir, al poder los regis­tra­do­res inter­pre­tar el sig­ni­fi­ca­do de cier­tas cate­go­rías de codi­fi­ca­ción en for­mas dife­ren­tes. En la siguien­te sec­ción, voy a enu­me­rar las cues­tio­nes de la fia­bi­li­dad entre codificadores.

La fiabilidad entre codificadores

La fia­bi­li­dad entre codi­fi­ca­do­res es un pro­ble­ma que afec­ta a todos los pro­yec­tos de aná­li­sis de con­te­ni­do, inclui­dos poten­cial­men­te aque­llos que repor­tan un alto coefi­cien­te de fia­bi­li­dad entre codi­fi­ca­do­res [Krip­pen­dorf 1980: 74]. Expre­sa­do en for­ma sim­ple, la fia­bi­li­dad entre codi­fi­ca­do­res, como otras for­mas de fia­bi­li­dad, mide la repe­ti­ción: los resul­ta­dos obte­ni­dos por un codi­fi­ca­dor pue­den repe­tir­se por otros codi­fi­ca­do­res uti­li­zan­do las mis­mas téc­ni­cas sobre el mis­mo mate­rial con el mis­mo set de reglas. La repe­ti­ción podría ser más o menos difí­cil depen­dien­do de la apli­ca­ción espe­cí­fi­ca de aná­li­sis de con­te­ni­dos (cuen­tas sim­ples de pala­bras cla­ves o medi­ción de lon­gi­tud) de artícu­los en núme­ros de líneas o cen­tí­me­tros cla­ra­men­te son menos pro­pen­sos a pro­ble­mas de fia­bi­li­dad entre codi­fi­ca­do­res que los aná­li­sis temá­ti­cos. Por esta razón, “la fia­bi­li­dad en un estu­dio debe haber sido com­pa­ra­da con estu­dios simi­la­res” [Budd et al. 1966: 67]. La fia­bi­li­dad entre codi­fi­ca­do­res depen­de tam­bién de la for­ma en la cual fue dise­ña­da la for­ma de codi­fi­ca­ción de cate­go­rías, el tipo de ins­truc­cio­nes dadas a los codi­fi­ca­do­res y la cla­ri­dad con que las reglas de codi­fi­ca­ción han sido escritas.

Ideal­men­te, debe­ría­mos poder obte­ner altos coefi­cien­tes de fia­bi­li­dad entre codi­fi­ca­do­res, sola­men­te sobre la base de las ins­truc­cio­nes escri­tas [Krip­pen­dorf 1980: 74]. Por estas razo­nes, duran­te las fases de pre­pa­ra­ción y prue­ba de los pro­yec­tos basa­dos en la codi­fi­ca­ción de perió­di­cos, mucho esfuer­zo debe­ría dedi­cár­se­le a escri­bir un manual deta­lla­do de ins­truc­cio­nes de codi­fi­ca­ción y dise­ño de cate­go­rías problemáticas.

Una for­ma de maxi­mi­zar la fia­bi­li­dad entre codi­fi­ca­do­res y mini­mi­zar el error de regis­tro es tener a varios codi­fi­ca­do­res rea­li­zan­do la codi­fi­ca­ción en fases suce­si­vas, cada uno leyen­do cada artícu­lo. En teo­ría, eso sería lo mejor; en la prác­ti­ca, tal vez no val­ga los recur­sos gas­ta­dos. Dada la mag­ni­tud pro­ba­ble de vali­dez ver­sus los erro­res de fia­bi­li­dad (erro­res de infor­ma­ción ver­sus erro­res de regis­tro), en una situa­ción de recur­sos limi­ta­dos, inver­ti­ría en datos para­le­los los esfuer­zos de reco­lec­ción apun­tan­do a eva­luar la natu­ra­le­za y exten­sión del error de infor­ma­ción. En otras pala­bras, yo inten­ta­ría medir la direc­ción y mag­ni­tud de las influen­cias del perió­di­co.[16]

El tipo de error sis­te­má­ti­co intro­du­ci­do por las prác­ti­cas de repor­te de infor­ma­ción pare­cie­ra tener un efec­to mucho más gran­de en con­clu­sio­nes empí­ri­cas que en los erro­res alea­to­rios intro­du­ci­dos a tra­vés de los pro­ce­di­mien­tos de regis­tro. Sin embar­go, la aten­ción de los inves­ti­ga­do­res se ha foca­li­za­do casi exclu­si­va­men­te en los erro­res de regis­tro y en los de fia­bi­li­dad entre codi­fi­ca­do­res. Tal vez todos nos sen­ti­mos com­pro­me­ti­dos a hacer todo lo posi­ble para reco­lec­tar datos con­fia­bles ya que que tene­mos poco con­trol sobre la vali­dez de los datos del perió­di­co. Pero ¿cuál es el pun­to en inver­tir tan­tos recur­sos en ase­gu­rar­se, por ejem­plo, que una for­ma de con­glo­me­ra­do de 200 mil per­so­nas sea regis­tra­da apro­pia­da­men­te? Dicha for­ma pue­de estar al bor­de de lo fan­tás­ti­co y, ade­más, hay una igual pro­ba­bi­li­dad de que esté sien­do sobre­es­ti­ma­do o sub­es­ti­ma­da.[17] Los inves­ti­ga­do­res poco pue­den hacer para cam­biar el nivel de error al repor­tar (vali­dez); aun­que, pue­den –y debe­rían- hacer un mayor esfuer­zo para medir su extensión.

La ante­rior dis­cu­sión no sig­ni­fi­ca que los erro­res de regis­tro debe­rían tomar­se livia­na­men­te –es más, no debe­rían. Sugie­ro que debe­ría­mos con­si­de­rar estra­te­gias alter­na­ti­vas. Los mues­treos por acep­ta­ción, por ejem­plo, pue­den pro­veer sufi­cien­te pro­tec­ción con­tra los erro­res de regis­tro. No todas las bom­bi­llas de luz que pro­vie­nen de una línea de ensam­ble son tes­tea­das para ver su ren­di­mien­to, aun­que uno rara­men­te deba devol­ver una bom­bi­lla al nego­cio don­de la com­pró. ¿Cómo fun­cio­na el mues­treo por acep­ta­ción? Una mues­tra de la can­ti­dad de artícu­los codi­fi­ca­dos todos los días por cada lec­tor es selec­cio­na­da alea­to­ria­men­te para ins­pec­cio­nar­la[18]. Cuan­do el por­cen­ta­je de erro­res es mayor que el umbral míni­mo, la pro­duc­ción dia­ria del lec­tor es ente­ra­men­te des­car­ta­da y rehe­cha. De lo con­tra­rio, los erro­res serán corre­gi­dos. En este caso, ambos, el vie­jo códi­go inco­rrec­to y el nue­vo códi­go correc­to se guar­da­rían en el archi­vo. Este archi­vo de datos pro­vee­ría un regis­tro útil de desem­pe­ños de las cate­go­rías. Los mues­treos por acep­ta­ción no pue­den garan­ti­zar un pro­duc­to libre de erro­res, pero pue­de garan­ti­zar que los erro­res se man­ten­drán den­tro de cier­tos lími­tes de tole­ran­cia predefinidos.

El pro­ble­ma con el mues­treo por acep­ta­ción es que las codi­fi­ca­cio­nes del codi­fi­ca­dor y del veri­fi­ca­dor no son inde­pen­dien­tes. El veri­fi­ca­dor podría ver­se afec­ta­do por las codi­fi­ca­cio­nes pre­vias que él o ella ins­pec­ciono. Para evi­tar este pro­ble­ma y toda­vía hacer posi­ble el con­trol de la fia­bi­li­dad entre codi­fi­ca­do­res, mien­tras el pro­yec­to con­ti­núa el equi­po ente­ro debe­ría regis­trar perió­di­ca­men­te y en for­ma indi­vi­dual los mis­mos artícu­los de perió­di­co. Los coefi­cien­tes de la fia­bi­li­dad entre codi­fi­ca­do­res lue­go serán compu­tados para cada cate­go­ría [Hols­ti 1969; Budd et al. 1966: 68].[19] Richard Budd, Robert Thorp y Lewis Donohew escri­ben “si un codi­fi­ca­dor está cons­tan­te­men­te fue­ra de la línea con res­pec­to a los otros, debe ser ins­trui­do o eli­mi­na­do; si varios codi­fi­ca­do­res están en des­acuer­do, las ins­truc­cio­nes y defi­ni­cio­nes deben ser reexa­mi­na­das” [1966: 67].

Cla­ra­men­te, los están­da­res míni­mos de fia­bi­li­dad varían con la cate­go­ría (la cate­go­ría “nom­bre del lugar”, por ejem­plo, es menos vaga que la cate­go­ría “obje­ti­vo de la acción”); gene­ral­men­te debe­rían ser toma­dos como acep­ta­bles ran­gos de coin­ci­den­cia entre el 80 y 90 %. Para eli­mi­nar posi­bles ten­den­cias espu­rias en los datos reco­lec­ta­dos debi­dos solo a la idio­sin­cra­sia del codi­fi­ca­dor es reco­men­da­ble que la codi­fi­ca­ción sea orga­ni­za­da de tal for­ma que nin­gún lec­tor tra­ba­je en un solo perio­do de sub­mues­tra [Hofs­tet­ter 1976: 25]. Aun­que hay difi­cul­ta­des prác­ti­cas y cos­tos con una colec­ción ente­ra­men­te alea­to­ria, una orga­ni­za­ción nor­mal­men­te posee solo una copia de micro­film de perió­di­co, y cada carre­te del micro­film con­tie­ne varios meses de artícu­los. Ade­más, la fami­lia­ri­dad con el con­tex­to his­tó­ri­co y el desa­rro­llo día a día de un even­to debe­ría pro­veer al lec­tor un mejor enten­di­mien­to de las diná­mi­cas de los acto­res y temas invo­lu­cra­dos en el perio­do, redu­cien­do la pro­ba­bi­li­dad de erro­res de inter­pre­ta­ción. Así, la pla­ni­fi­ca­ción de la codi­fi­ca­ción de pro­duc­ción debe lle­gar a un pun­to medio entre dos ten­den­cias opues­tas. Una solu­ción sería asig­nar un sub­pe­rio­do de tres a cin­co años a un gru­po de lec­to­res, con cada lec­tor codi­fi­can­do temas del perió­di­co que le hayan sido asig­na­dos alea­to­ria­men­te den­tro de todo el subperiodo.

Seleccionar el periódico para ser usado como fuente de datos y la frecuencia de su lectura

Las prác­ti­cas de repor­tar por par­te de los perió­di­cos han dife­ri­do en tér­mi­nos de 1) el gra­do de la cir­cu­la­ción del perió­di­co [Capec­chi y Livol­si 1971], 2) la pro­xi­mi­dad de los even­tos al mer­ca­do con­su­mi­dor del perió­di­co o de las agen­cias de noti­cias [Danz­ger 1975; Sny­der y Kelly, 1977] y 3) la posi­ción ideo­ló­gi­ca del perió­di­co [Hart­mann 1975/76]. Dadas estas dife­ren­cias, ideal­men­te, a uno le gus­ta­ría reco­lec­tar datos de la mayor can­ti­dad de perió­di­cos posi­ble. Basar­se en varios perió­di­cos incre­men­ta la can­ti­dad de even­tos y ayu­da al inves­ti­ga­dor a estar menos suje­to a la idio­sin­cra­sia de cual­quier fuen­te indi­vi­dual. El pro­ble­ma es que la can­ti­dad de los perió­di­cos en la mayo­ría de los paí­ses es muy alta [De Luna et al. 1980: 304–308], dema­sia­do alta para que un inves­ti­ga­dor los pue­da con­sul­tar todos, al menos en un lar­go perio­do de mues­tra y con lec­tu­ras dia­rias. Debe tomar­se una deci­sión. De cual­quier for­ma, en nin­gu­na par­te he vis­to repor­tes de inves­ti­ga­cio­nes pre­li­mi­na­res con­du­ci­dos para jus­ti­fi­car la elec­ción de un perió­di­co en par­ti­cu­lar, ni he vis­to un cri­te­rio cla­ro que haya guia­do tal deci­sión. La con­ve­nien­cia de tener un índi­ce que faci­li­te la bús­que­da de artícu­los pare­ce ser el cri­te­rio no men­cio­na­do para la elec­ción del New York Times en muchos estu­dios de datos sobre eventos.

Una elec­ción más racio­nal esta­ría basa­da en com­pa­ra­cio­nes pre­li­mi­na­res sis­te­má­ti­cas de un gran núme­ro de perió­di­cos para eva­luar la exten­sión y tipo de cober­tu­ra de cada uno. El perio­do de mues­tra no nece­si­ta ser dema­sia­do lar­go; inclu­so de una sema­na a dos o más pun­tos de tiem­po den­tro del perio­do total de mues­treo de inte­rés pue­de ser sufi­cien­te. Los aná­li­sis pre­li­mi­na­res de estos datos com­pa­ra­dos pue­den ayu­dar a los inves­ti­ga­do­res a rea­li­zar elec­cio­nes infor­ma­das, dic­ta­das por la natu­ra­le­za del pro­ble­ma en mano en vez de la conveniencia.

Habien­do ele­gi­do el/los perió­di­cos a uti­li­zar como fuen­te, el inter­va­lo de mues­treo – la fre­cuen­cia de lec­tu­ra y codi­fi­ca­ción de los perió­di­cos- toda­vía debe ser selec­cio­na­do. Los perió­di­cos pue­den leer­se todos los días, uti­li­zan­do todos los artícu­los publi­ca­dos, o para aho­rrar recur­sos, podría leer­se uno o más días a la sema­na, uno o más sema­nas al mes, uno o más meses al año, cada tres años, cada cin­co años y así. Des­pués de todo, la pobla­ción ente­ra de un país nun­ca es entre­vis­ta­da para pre­de­cir el com­por­ta­mien­to elec­to­ral en las pró­xi­mas elec­cio­nes polí­ti­cas nacio­na­les. Las mues­tras ele­gi­das cui­da­do­sa­men­te pue­den dar resul­ta­dos muy cer­ca­nos a los que se podría obte­ner sobre la base de la pobla­ción total. Sin embar­go, mien­tras que el mues­treo pue­de ser un pro­ce­di­mien­to apro­pia­do en el cam­po de los aná­li­sis de con­te­ni­do clá­si­cos, tie­ne pro­ba­bi­li­dad de incu­rrir dos obs­tácu­los fun­da­men­ta­les cuan­do es apli­ca­do en estu­dios de pro­ce­sos socio-his­tó­ri­cos[20].

Pri­me­ro, si el fenó­meno bajo estu­dio está carac­te­ri­za­do por un com­por­ta­mien­to cícli­co – que es la natu­ra­le­za de muchos pro­ce­sos his­tó­ri­cos- los ciclos podrían esca­bu­llir­se por la cua­dri­cu­la de mues­treo, apa­re­cien­do con cor­tes de picos aquí y meno­res allí. Con­se­cuen­te­men­te, los ciclos no serían iden­ti­fi­ca­dos fácil­men­te duran­te el aná­li­sis. Uno podría estra­ti­fi­car la mues­tra sobre la base de dicho com­por­ta­mien­to cícli­co, pero estas téc­ni­cas de mues­treo supon­drían, a prio­ri, cono­ci­mien­to de los ciclos.

Segun­do, la dis­tri­bu­ción de los even­tos en el fenó­meno a estu­diar esta­ría ata­da en víncu­los estra­té­gi­cos de even­tos en cade­na. En esos casos, los even­tos en cade­na cons­ti­tu­yen la real uni­dad de aná­li­sis por sobre los even­tos sin­gu­la­res. Por ejem­plo, yo argu­men­ta­ría que la uni­dad sig­ni­fi­ca­ti­va para enten­der el con­flic­to indus­trial en Ita­lia no es la huel­ga, con­ce­bi­da como inte­rrup­ción de tra­ba­jo indi­vi­dual, pero sí la dispu­ta, que tal vez inclu­ya no solo uno o más inte­rrup­cio­nes de tra­ba­jo, sino tam­bién dife­ren­tes for­mas de acción colec­ti­va – mani­fes­ta­cio­nes, con­cen­tra­cio­nes, asam­bleas, reunio­nes de nego­cia­ción, etc. Gerald Mar­well y Pame­la Oli­ver han argu­men­ta­do en for­ma simi­lar que una “cam­pa­ña colec­ti­va” es la uni­dad de aná­li­sis más apro­pia­da en las inves­ti­ga­cio­nes de la acción colec­ti­va y de los movi­mien­tos socia­les [Mar­well y Oli­ver 1984] por sobre una acti­vi­dad o even­to sin­gu­lar. Al reco­lec­tar infor­ma­ción sobre la base de téc­ni­cas de mues­treo con un inter­va­lo mayor que el de la publi­ca­ción de los perió­di­cos –un día- se arries­ga no solo a trun­car ciclos sino tam­bién a per­der even­tos den­tro de las dispu­tas (o cam­pa­ñas colec­ti­vas), ade­más alte­ran­do fun­da­men­tal­men­te el con­jun­to de accio­nes colec­ti­vas. Bajo estas con­di­cio­nes, el con­flic­to sería una uni­dad de mues­tra más apro­pia­da que el artícu­lo o el tema del perió­di­co.[21] Esto reque­ri­ría un poco de tra­ba­jo pre­li­mi­nar para iden­ti­fi­car el uni­ver­so de todas las dispu­tas repor­ta­das para pro­bar, pero sub­si­guien­te­men­te aho­rra­ría tiem­po en codificar.

En con­clu­sión, en vis­ta del alto cos­to en la reco­lec­ción de datos de perió­di­cos, yo reco­men­da­ría el siguien­te dise­ño de investigación:

  • Depen­der de uno o posi­ble­men­te unos pocos perió­di­cos cui­da­do­sa­men­te selec­cio­na­dos sobre la base de aná­li­sis com­pa­ra­ti­vos preliminares;
  • Tomar mues­tras solo si la natu­ra­le­za del fenó­meno a estu­diar no es pro­pen­sa a pro­du­cir datos deformados.
Unidades de medición

Las últi­mas dos sec­cio­nes tra­tan acer­ca de las cues­tio­nes de cómo un lec­tor deci­de qué cali­fi­ca para codi­fi­car y qué hace un inves­ti­ga­dor con todos estos datos. Hay dos elec­cio­nes invo­lu­cra­das en el pro­ce­so de pro­duc­ción de la deci­sión, implí­ci­tas en la pri­me­ra pre­gun­ta. Estas elec­cio­nes tra­tan con la uni­dad de mues­tra –la uni­dad de con­tex­to y la uni­dad de regis­tro (o codificación).

La uni­dad de con­tex­to se refie­re a la por­ción del mate­rial sim­bó­li­co que debe ser ana­li­za­do para carac­te­ri­zar la uni­dad de regis­tro, por ejem­plo, los ítems y sím­bo­los a ser codi­fi­ca­dos. Es den­tro de la uni­dad más amplia de con­tex­to que debe­mos bus­car las uni­da­des de regis­tro– una pala­bra, ora­ción, párra­fo, tema, etc. Las uni­da­des de regis­tro están con­te­ni­das ente­ra­men­te en las uni­da­des de con­tex­to. Las uni­da­des de con­tex­to pue­den ser a su vez uni­da­des de regis­tro den­tro de con­tex­tos más amplios.[22] Los artícu­los cons­ti­tu­yen las típi­cas uni­da­des de con­tex­to. Las uni­da­des sin­tác­ti­cas– suje­to, acción, obje­ti­vo- y uni­da­des temá­ti­cas son uni­da­des de regis­tro ele­men­ta­les para cual­quier even­to dado. Las cate­go­rías de codi­fi­ca­ción pro­veen las uni­da­des temá­ti­cas bási­cas para la reco­lec­ción. Usual­men­te, un artícu­lo es una uni­dad fácil­men­te iden­ti­fi­ca­ble con un títu­lo (enca­be­za­do) y, fre­cuen­te­men­te, un sub­tí­tu­lo. Una noti­cia cor­ta que apa­re­ce bajo tales enca­be­za­dos como “Resu­men de Pren­sa”, “Actua­li­za­ción”, “Resu­men del noti­cie­ro”, y por el esti­lo cali­fi­can como un artícu­lo. Un artícu­lo podría ser tam­bién la cap­tu­ra de una foto­gra­fía si la infor­ma­ción que esta con­tie­ne no apa­re­ce en un artículo.

Sin embar­go, des­de el pun­to de vis­ta ope­ra­cio­nal, no siem­pre es fácil deci­dir cuán­do un artícu­lo cali­fi­ca o no para ser regis­tra­do. Con fines ilus­tra­ti­vos, uti­li­ce­mos nue­va­men­te el con­flic­to indus­trial en Ita­lia, por ejem­plo, con­flic­tos en los que los tra­ba­ja­do­res orga­ni­za­dos sean los prin­ci­pa­les acto­res. Con esta defi­ni­ción ope­ra­cio­nal en mano, debe­ría ser fácil deci­dir qué even­tos cali­fi­can y cuá­les no. El pro­ble­ma es que, dadas las carac­te­rís­ti­cas de cla­se de los sin­di­ca­tos ita­lia­nos, los con­flic­tos indus­tria­les a menu­do con­cier­nen a la polí­ti­ca en vez del lugar de tra­ba­jo [Piz­zorno 1973]. ¿Debe­ría este últi­mo tipo de con­flic­to ser exclui­do de la reco­lec­ción de datos? Al excluir­lo, se per­de­rían impor­tan­tes carac­te­rís­ti­cas de los con­flic­tos indus­tria­les italianos.

Si noso­tros reco­lec­ta­mos tam­bién aque­llas for­mas de acción colec­ti­va que van más allá de las razo­nes pura­men­te eco­nó­mi­cas, ¿qué debe­ría hacer­se en aque­llos casos don­de no son los sin­di­ca­tos sino el Par­ti­do Comu­nis­ta –la otra gran estruc­tu­ra orga­ni­za­cio­nal de la cla­se tra­ba­ja­do­ra ita­lia­na- el que orga­ni­za las accio­nes masi­vas? ¿Debe­ría una acción polí­ti­ca colec­ti­va regis­trar­se solo cuan­do se orga­ni­zó por los sin­di­ca­tos o solo cuan­do está carac­te­ri­za­da por inte­rrup­cio­nes labo­ra­les? ¿Qué debe­ría hacer­se cuan­do los orga­ni­za­do­res, ya sean los sin­di­ca­tos o el Par­ti­do Comu­nis­ta, pro­ta­go­ni­zan accio­nes que no invo­lu­cran a tra­ba­ja­do­res en asun­tos rela­cio­na­dos al tra­ba­jo (accio­nes por vivien­das, medio ambien­te, paz, etc.) o invo­lu­cran a no tra­ba­ja­do­res (por ejem­plo, los des­ocu­pa­dos o los jubi­la­dos)? ¿Qué pasa en una situa­ción don­de el lide­raz­go del movi­mien­to no pro­ven­ga ni de los sin­di­ca­tos ni del par­ti­do (movi­mien­tos civi­les por el abor­to, divor­cio, desar­me, etc.)?

Una de muchas solu­cio­nes ope­ra­cio­na­les posi­bles pue­de ser la siguien­te: codi­fi­car todos los artícu­los que refie­ran a accio­nes colec­ti­vas don­de cual­quier núme­ro de tra­ba­ja­do­res esté pre­sen­te como actor colec­ti­vo y que sea iden­ti­fi­ca­do espe­cí­fi­ca­men­te así (de esa for­ma) por el perió­di­co, inclu­so si están es una posi­ción mino­ri­ta­ria e inde­pen­dien­te­men­te del tipo de deman­da lle­va­da ade­lan­te y el tipo y nivel de orga­ni­za­ción invo­lu­cra­da (sin­di­ca­tos, par­ti­dos polí­ti­cos, los tra­ba­ja­do­res mis­mos o cual­quier otro tipo de orga­ni­za­ción). Para los casos ambi­guos, el nom­bre del perió­di­co, el núme­ro de colum­na y de pági­na, el tipo de even­to y la fecha, se regis­tra en for­ma sepa­ra­da. Se pue­de deci­dir lue­go cuan­do estos artícu­los cali­fi­can para regis­trar o debe­rán ser descartados.

Aun­que una com­pli­ca­ción pos­te­rior es intro­du­ci­da por aque­llos artícu­los que no invo­lu­cran accio­nes colec­ti­vas de la cla­se tra­ba­ja­do­ra fácil­men­te iden­ti­fi­ca­bles –huel­gas, mani­fes­ta­cio­nes, asam­bleas, etc.-. ¿Debe­rían cali­fi­car los artícu­los que dis­cu­ten un jui­cio con­tra algu­nos tra­ba­ja­do­res por su par­ti­ci­pa­ción en accio­nes colec­ti­vas en el pasa­do? ¿Debe­ría cali­fi­car un artícu­lo que nos cuen­ta que una comi­sión par­la­men­ta­ria ha sido esta­ble­ci­da para inves­ti­gar las con­di­cio­nes de tra­ba­jo en las fábri­cas? Esta infor­ma­ción pue­de ser muy útil lue­go para eva­luar las carac­te­rís­ti­cas del sis­te­ma de rela­cio­nes indus­tria­les en Ita­lia. Si este es el caso, debe­ría­mos modi­fi­car los cri­te­rios de cali­fi­ca­ción lle­va­dos ade­lan­te. Los artícu­los don­de los tra­ba­ja­do­res apa­re­cen como acto­res debe­rían ser codi­fi­ca­dos, como tam­bién aque­llos artícu­los en los que los tra­ba­ja­do­res apa­re­cen como refe­ren­tes y obje­ti­vos implí­ci­tos o explí­ci­tos de otros acto­res: el esta­do, la poli­cía, el sis­te­ma judi­cial, los gobier­nos cen­tral y local, etc.- par­ti­dos polí­ti­cos, o cual­quier otro gru­po orga­ni­za­do cuyas accio­nes pue­den afec­tar posi­ti­va o nega­ti­va­men­te, de una mane­ra sig­ni­fi­ca­ti­va, a un con­jun­to de tra­ba­ja­do­res o a la cla­se tra­ba­ja­do­ra ente­ra.[23] De nue­vo, yo reco­mien­do man­te­ner defi­ni­cio­nes sufi­cien­te­men­te amplias que per­mi­tan reco­lec­tar la mayor can­ti­dad de infor­ma­ción rele­van­te posi­ble. El cos­to eco­nó­mi­co de esta estra­te­gia es más alto, pero la solu­ción alter­na­ti­va de tra­ba­jar con un umbral más alto tal vez resul­te en un cos­to teó­ri­co más alto. Un umbral más alto pro­vee más datos váli­dos, pero su des­ven­ta­ja es que per­de­mos gene­ra­li­dad y núme­ro de casos. Yo pre­fie­ro man­te­ner el umbral bajo duran­te la fase de reco­lec­ción de datos y ele­var­la lue­go duran­te la fase de aná­li­sis de datos, eje­cu­tan­do aná­li­sis esta­dís­ti­cos en varios nive­les umbra­les. Lo con­tra­rio no sería posi­ble.[24]

En el con­tex­to de un artícu­lo, los codi­fi­ca­do­res van a iden­ti­fi­car uno o más even­tos. En el con­tex­to de cada even­to, los codi­fi­ca­do­res iden­ti­fi­ca­rán las uni­da­des sin­tác­ti­cas y temá­ti­cas ele­men­ta­les. La mejor for­ma de orga­ni­zar las uni­da­des de regis­tro es por temas, en lugar de pala­bras cla­ve. La expre­sión “la reco­lec­ción de fon­dos para los huel­guis­tas” se refie­re a un tema gene­ral de des­plie­gue prác­ti­co de soli­da­ri­dad de los tra­ba­ja­do­res, inde­pen­dien­te­men­te de la expre­sión ver­bal espe­ci­fi­ca uti­li­za­da por el perió­di­co. Expre­sio­nes como “una reco­lec­ción de con­tri­bu­cio­nes volun­ta­rias para ser uti­li­za­das como fon­do para los huel­guis­tas”, “tra­ba­ja­do­res de fir­mas cer­ca­nas han ofre­ci­do su apo­yo finan­cie­ro”, y simi­la­res serían todas codi­fi­ca­das bajo la cate­go­ría temá­ti­ca “reco­lec­ción de fon­dos para huel­guis­tas”. Las cate­go­rías temá­ti­cas pue­den ser más o menos espe­cí­fi­cas o gené­ri­cas. La cate­go­ría “comien­zo de huel­ga” cla­ra­men­te es com­pa­ti­ble con un ran­go más estre­cho de sinó­ni­mos que “están satis­fe­chos con el resul­ta­do de la huel­ga”. En con­si­de­ra­ción del hecho de que la fia­bi­li­dad de los datos reco­lec­ta­dos se vin­cu­la al dise­ño de las cate­go­rías y al cono­ci­mien­to de los codi­fi­ca­do­res sobre qué codi­fi­car den­tro de cada cate­go­ría, el manual de ins­truc­cio­nes de regis­tro debe­ría pro­veer un gran núme­ro de expre­sio­nes simi­la­res para cada categoría.

Agregando Datos — Unidades de análisis

Como hemos vis­to, el uso de compu­tado­ras para reco­lec­tar datos de perió­di­cos ha posi­bi­li­ta­do obte­ner infor­ma­ción his­tó­ri­ca mucho más rica que la que era posi­ble bajo los mar­cos tra­di­cio­na­les de codi­fi­ca­ción. Estos datos son alta­men­te des­agre­ga­dos a lo lar­go de varias dimen­sio­nes – espa­cio, tiem­po, sector/firma/planta (o tipo de orga­ni­za­ción), y cate­go­ría de infor­ma­ción. En el gra­do en que los perió­di­cos pro­vean infor­ma­ción sobre el lugar del con­flic­to, uno podrá tener un mapa geo­grá­fi­co deta­lla­do y alta­men­te des­agre­ga­do del pro­ce­so his­tó­ri­co a estu­diar (barrio, cua­dra, calle). En cuan­to al tiem­po, los perió­di­cos nun­ca son muy pre­ci­sos. Las expre­sio­nes típi­ca­men­te uti­li­za­das para refe­rir­se al tiem­po son “ayer”, “maña­na”, “hace algu­nos días”, o “al poco tiem­po de eso”. El tiem­po es rara­men­te defi­ni­do más pre­ci­sa­men­te, como “el lunes, 7 de octu­bre de 1983 a las 10:45 PM”. Los len­gua­jes mate­má­ti­cos han pro­vis­to de cuan­ti­fi­ca­do­res gene­ra­li­za­dos que per­mi­ten regis­trar en for­ma pre­ci­sa inclu­so las for­mas más vagas de expre­sio­nes tem­po­ra­les [ver Fran­zo­si 1986]. Cuan­do el tiem­po exac­to de un even­to no está dis­po­ni­ble, es toda­vía posi­ble lograr un orde­na­mien­to par­cial en rela­ción a otros even­tos. Esto daría como resul­ta­do un alto gra­do de datos des­agre­ga­dos sobre el tiem­po –has­ta el mis­mo minu­to, si así se hizo refe­ren­cia en el perió­di­co. En el caso de un con­flic­to indus­trial, lo mis­mo se podría apli­car para las fir­mas y los sec­to­res eco­nó­mi­cos; allí don­de la infor­ma­ción fue­se pro­vis­ta, se podrían regis­trar el sec­tor eco­nó­mi­co, el gru­po, la fir­ma, la plan­ta, y nego­cio don­de se die­ron los eventos.

La alta des­agre­ga­ción de datos sobre tiem­po y espa­cio per­mi­ti­rá a los inves­ti­ga­do­res enten­der mejor los pro­ce­sos de movi­li­za­ción invo­lu­cra­dos en olea­das de even­tos de pro­tes­ta. Los tra­ba­jos pio­ne­ros de Eric Hobs­bawm y Geor­ge Rude, Andrew Char­les­woth, y los tra­ba­jos actua­les de Char­les Tilly han mos­tra­do que los pro­ce­sos de difu­sión a lar­ga esca­la, como las olas de huel­gas u otro com­por­ta­mien­to con­flic­ti­vo, siguen patro­nes pre­dic­ti­vos tan­to de tiem­po como de espa­cio [Hobs­bawm y Rude 1968; Char­les­worth 1979]. Por ejem­plo, en el caso del con­flic­to indus­trial, esta­ría­mos intere­sa­dos en saber que fir­mas y sec­to­res y que áreas geo­grá­fi­cas lide­ran la lucha o son alcan­za­das por esta en cual­quier tiem­po dado.

Tan alta des­agre­ga­ción de los datos nos per­mi­te lle­var ade­lan­te aná­li­sis por terri­to­rio (pri­me­ro recu­pe­rar y lue­go ana­li­zar toda la infor­ma­ción de Pia­mon­te, por ejem­plo, o Milán, o la pro­vin­cia de Géno­va), por tiem­po (selec­cio­nan­do toda la infor­ma­ción dis­po­ni­ble en un perio­do dado), por sec­tor (selec­cio­nar toda la infor­ma­ción sobre tra­ba­ja­do­res tex­ti­les), por firma/planta/negocio (recu­pe­rar toda la infor­ma­ción sobre FIAT), por ítem espe­ci­fi­co de infor­ma­ción (ej., todos los casos de inter­ven­ción poli­cial), o por cual­quier com­bi­na­ción de las ante­rior­men­te cita­das (recu­pe­rar toda la infor­ma­ción de inter­ven­cio­nes poli­cia­les en las plan­tas de FIAT de Turín duran­te el perio­do 1945–1956). La dis­po­ni­bi­li­dad comer­cial del poten­te “Rela­tio­nal Data Base Mana­ge­ment Sys­tems” (DBMS), como INGRES, ORACLE, DL1, o RDB, hace que recu­pe­rar e inte­rro­gar infor­ma­ción de tan gran­des ban­cos de datos sea muy sim­ple.[25]

Los datos, sin embar­go, tam­bién pue­den ser agre­ga­dos en varios nive­les –espa­cio y tiem­po, sector/firma, o even­to.[26] Depen­dien­do del tipo de infor­ma­ción pro­ce­sa­da, la agre­ga­ción tal vez invo­lu­cre aña­dir infor­ma­ción (ej., núme­ro de gen­te heri­da, ase­si­na­da, arres­ta­da, etc.) por uni­dad de tiem­po (mes, cua­tri­mes­tre, año), por uni­dad espa­cial (pro­vin­cia, región, país como un todo), por sector/firma (ej., FIAT o indus­tria quí­mi­ca), o por even­to (huel­ga, mani­fes­ta­ción, etc.). Tam­bién pue­de invo­lu­crar la sim­ple acu­mu­la­ción del núme­ro de carac­te­rís­ti­cas de los even­tos (por ejem­plo, la entre­ga de folle­tos) o de los mis­mos even­tos. Los aná­li­sis lue­go pue­den ser desa­rro­lla­dos en estos varios nive­les. Aun­que mucho del deta­lle fino de los datos se pier­de a tra­vés de la agre­ga­ción, en algu­nos casos esto es inevi­ta­ble si se van a desa­rro­llar aná­li­sis de mul­ti­va­ria­bles. En efec­to, las varia­bles de otras fuen­tes tal vez estén dis­po­ni­bles solo en los nive­les más altos de agre­ga­ción (solo publi­ca­cio­nes tri­mes­tra­les, por ejem­plo, están dis­po­ni­bles sobre des­em­pleo). Final­men­te, pue­den for­mar­se com­bi­na­cio­nes de las cate­go­rías que pro­veen dife­ren­tes medi­cio­nes de un con­cep­to sub­ya­cen­te úni­co (por ejem­plo, a tra­vés de aná­li­sis de fac­to­res; algu­nos paque­tes de compu­tado­ras como LISREL, aun­que per­mi­ta esti­ma­cio­nes direc­tas de mode­los estruc­tu­ra­les de ecua­cio­nes uti­li­zan­do varios indi­ca­do­res de un con­cep­to sub­ya­cen­te único).

Conclusiones

Este artícu­lo puso a la vis­ta un núme­ro de temas invo­lu­cra­dos en la reco­lec­ción de datos de even­tos de los perió­di­cos. En resu­men, me gus­ta­ría des­ta­car unos cuan­tos pun­tos con­cer­nien­tes espe­cí­fi­ca­men­te a la vali­dez y fia­bi­li­dad. Pri­me­ro, una pre­gun­ta: ¿son los perió­di­cos datos vali­dos? Mi res­pues­ta es, gene­ral­men­te no. David Sny­der y William Kelly argu­men­tan que los estu­dios basa­dos en múl­ti­ples indi­ca­do­res de con­flic­to sean pro­ba­ble­men­te pro­pen­sos a ser influen­cia­dos, mien­tras que los estu­dios basa­dos en for­mas espe­cí­fi­cas de con­flic­to (huel­gas, dis­tur­bios racia­les, etc.) “son gene­ral­men­te váli­dos, espe­cial­men­te cuan­do se limi­tan a con­si­de­rar com­por­ta­mien­tos rela­ti­va­men­te altos en inten­si­dad [Sny­der y Kelly 1977: 117, 121]. A la luz de la ante­rior dis­cu­sión, sus dichos pare­cen dema­sia­do opti­mis­tas. Ellos admi­ten que, al menos en el caso del con­flic­to indus­trial –que, de paso, es un indi­ca­dor indi­vi­dual- hay evi­den­cia de una “drás­ti­ca influen­cia en sub repor­tar” [Sny­der y Kelly 1977: 110]. No hay duda de que a mayor inten­si­dad de un even­to, mayor es la pro­ba­bi­li­dad de ser repor­ta­do. Ade­más, la vali­dez siem­pre pue­de alcan­zar­se sim­ple­men­te subien­do el umbral de los even­tos. Aun­que esto impli­ca per­di­da de gene­ra­li­dad y de núme­ro de casos. Si uno no desea hacer este sacri­fi­cio, la pre­gun­ta sobre vali­dez se vuel­ve más problemática.

Dis­cu­ti­ría que los datos de even­tos reco­lec­ta­dos de perió­di­cos pare­cie­ran ver­se afec­ta­dos por erro­res sis­te­má­ti­cos y, por lo tan­to, no son váli­dos. Aun­que esto no impor­ta mien­tras espe­ci­fi­que­mos la natu­ra­le­za de los erro­res no alea­to­rios aso­cia­dos con la vali­dez. Esto pro­ba­ble­men­te no pue­da hacer­se en for­ma exac­ta, en tan­to que esta­mos lidian­do con mues­tras de even­tos no alea­to­rios extraí­dos de una pobla­ción des­co­no­ci­da, pero, a tra­vés de las téc­ni­cas dis­cu­ti­das arri­ba pode­mos rea­li­zar jui­cios infor­ma­dos sobre la direc­ción y la mag­ni­tud del error.

Una segun­da pre­gun­ta es si los datos reco­lec­ta­dos de los perió­di­cos son con­fia­bles. Mi res­pues­ta es, gene­ral­men­te sí. Como hemos vis­to, la mayo­ría de los estu­dios sobre con­flic­ti­vi­dad rea­li­zan muchos esfuer­zos para ase­gu­rar que cual­quier cosa que es repor­ta­do por los perió­di­cos sea regis­tra­do sin erro­res. Una pre­gun­ta rela­cio­na­da enton­ces sería: ¿Vale real­men­te la pena? Reto­me­mos el ejem­plo de Richard Zeller y Edward Car­mi­ne de un rifle de ama­rre sano que en for­ma repe­ti­ti­va y cons­tan­te gol­pea el mis­mo pun­to (per­fec­ta), excep­to que no gol­pea el blan­co desea­do (cero vali­dez) [Zeller y Car­mi­nes 1980]. Es lo sufi­cien­te­men­te fácil mover el rifle has­ta que gol­pee el blan­co, ya que gene­ral­men­te lo más recien­te está bien defi­ni­do. Aun­que, en el caso de los perió­di­cos, los con­tor­nos del blan­co son des­co­no­ci­dos, y los inves­ti­ga­do­res no saben real­men­te si están dán­do­le correc­ta­men­te en el blan­co o le erran por una pul­ga­da o una milla.

Los inves­ti­ga­do­res han pues­to esfuer­zos admi­ra­bles en la eli­mi­na­ción de los erro­res alea­to­rios (fia­bi­li­dad) de la reco­lec­ción de datos de perió­di­cos mien­tras que gene­ral­men­te des­cui­dan los erro­res no alea­to­rios (vali­dez). Eso es todo, el error no alea­to­rio (vali­dez) es mucho más pro­ba­ble de dis­tor­sio­nar los datos del perió­di­co que el error alea­to­rio (fia­bi­li­dad). Dado los recur­sos limi­ta­dos con los que la mayo­ría de noso­tros nos enfren­ta­mos, la pre­gun­ta de vali­dez ver­sus fia­bi­li­dad tal vez se con­vier­ta en una pre­gun­ta de elec­ción entre más vali­dez ver­sus menos fia­bi­li­dad. Aun­que, espe­ro haber mos­tra­do que nive­les más altos de vali­dez pue­den ser alcan­za­dos sin sacri­fi­car fia­bi­li­dad sim­ple­men­te al uti­li­zar téc­ni­cas más efi­cien­tes en la reco­lec­ción de datos.

En con­clu­sión, ya que los perió­di­cos pro­veen lar­gos regis­tros de pro­ce­sos his­tó­ri­cos, a veces no dis­po­ni­bles de otra mane­ra y par­ti­cu­lar­men­te bien situa­dos para la “for­mu­la­ción sis­te­má­ti­ca y tes­teo de hipó­te­sis de inves­ti­ga­ción” [McA­dam 1982: 235] mucho se pue­de ganar de su uso. Aun­que para uti­li­zar­las efec­ti­va­men­te, más aten­ción se le debe dar a los pro­ble­mas de medi­ción. Mas pre­ci­sa­men­te, dada la aten­ción des­pro­por­cio­na­da que se le da a los pro­ble­mas de fia­bi­li­dad con res­pec­to a los de vali­dez, reco­men­da­ría un cam­bio en el foco de los pro­ble­mas de fia­bi­li­dad a los pro­ble­mas de vali­dez. La vali­da­ción de los datos a tra­vés de medi­das inde­pen­dien­tes y alter­na­ti­vas debe­ría ser una par­te inte­gral de cual­quier dise­ño de inves­ti­ga­ción que invo­lu­cre reco­lec­ción de datos de perió­di­cos. Es solo a tra­vés de estos estu­dios de vali­da­ción que pode­mos tener espe­ran­zas de obte­ner un mejor enten­di­mien­to de los con­tor­nos del uni­ver­so de even­tos de inte­rés y deli­near mapas que vin­cu­len la pobla­ción y la mues­tra no alea­to­ria a mano.

Citas

Toma­do de Fran­zo­si, Rober­to 1987 The Press as a Sour­ce of Socio-His­to­ri­cal Data: Issues in the Metho­do­logy of Data Collec­tion from News­pa­pers. His­to­ri­cal Methods: A Jour­nal of Quan­ti­ta­ti­ve and Inter­dis­ci­pli­nary His­tory, 20 (1), 1 de enero: 5–16. doi: 10.1080/01615440.1987.10594173. Agra­de­ce­mos la auto­ri­za­ción otor­ga­da por el autor y Tay­lor & Fran­cis Group para tra­du­cir y publi­car el pre­sen­te tex­to en nues­tra revista.

* Rober­to Fran­zo­si es Dr. en Socio­lo­gía por la Uni­ver­si­dad Johns Hop­kins (1981). Actual­men­te se desem­pe­ña como pro­fe­sor de Socio­lo­gía y Lin­güís­ti­ca en la Uni­ver­si­dad Emory, en Esta­dos Uni­dos de Nor­te Amé­ri­ca. Sus intere­ses de inves­ti­ga­ción han esta­do vin­cu­la­dos al estu­dio de la pro­tes­ta social y la vio­len­cia y sus rela­cio­nes con el len­gua­je y la narra­ti­va. Entre sus publi­ca­cio­nes se des­ta­can las siguien­tes: The Puzz­le of Stri­kes: Class and Sta­te Stra­te­gies in Post­war Italy (Cam­brid­ge Uni­ver­sity Press 1994); From Words to Num­ber: Narra­ti­ve, Data, and Social Scien­ce (Cam­brid­ge Uni­ver­sity Press 2005); “Con­tent Analy­sis” (Sage 2008); and “Quan­ti­ta­ti­ve Narra­ti­ve Analy­sis” (Sage 2009). Correo elec­tró­ni­co: rfranzo@emory.edu

** Pro­fe­sor de His­to­ria por la UNMdP (Uni­ver­si­dad Nacio­nal de Mar del Pla­ta), inte­gran­te del GES­Mar (Gru­po de Estu­dios Marí­ti­mos Socia­les) y del SISMOS (Semi­na­rio de Inves­ti­ga­ción Sobre el Movi­mien­to de la Socie­dad), Argentina.

*** Doc­tor en Cien­cias Socia­les por la UBA (Uni­ver­si­dad de Bue­nos Aires). Inves­ti­ga­dor Adjun­to del CONICET (Con­se­jo Nacio­nal de Inves­ti­ga­cio­nes Cien­tí­fi­cas y Téc­ni­cas), IIGG (Ins­ti­tu­to de Inves­ti­ga­cio­nes Gino Ger­ma­ni), Argentina.

**** Pro­fe­so­ra de Inglés por la Uni­ver­si­dad Nacio­nal de Mar del Pla­ta. Maes­tran­da en Prác­ti­ca Docen­te. Inte­gran­te del Gru­po de Inves­ti­ga­ción en Edu­ca­ción y Estu­dios Cul­tu­ra­les de la Uni­ver­si­dad Nacio­nal de Mar del Pla­ta, Argentina.

[1] Para una dis­cu­sión de los pro­ble­mas de los datos de huel­gas ofi­cia­les, ver Sha­lev [1978].

[2] Para la noción de reper­to­rio ver Tilly [1981].

[3] Ver, por ejem­plo, Ben­son [1978].

[4] Sobre estos temas, para la apli­ca­ción espe­cí­fi­ca en con­flic­tos intra-socie­ta­les, ver el exce­len­te artícu­lo de Jacob­son [1973].

[5] Los perió­di­cos han sido uti­li­za­dos en múl­ti­ples estu­dios com­pa­ra­ti­vos inter­na­cio­na­les sobre even­tos con­flic­ti­vos. Ver Rum­mel [1963, 1965], Rus­set [1964], Tan­ter [1966], Feie­ra­bend y Feie­ra­bend [1966], Bwy [1968], Gurr [1968], Pai­ge [1975]. Sobre estu­dios nacio­na­les de múl­ti­ples even­tos de con­flic­tos ver Eisin­ger [1973], Danz­ger [1975], Krie­si, Levy, Gan­gui­llet y Zwicky [1981]. Sobre estu­dios nacio­na­les de even­tos con­flic­ti­vos indi­vi­dua­les tales como los dis­tur­bios racia­les en Esta­dos Uni­dos, ver Lie­ber­son y Sil­ver­man [1965], Bloom­baum [1968], Dow­nes [1968], Dow­nes [1970], Wan­de­rer [1969], Spi­ler­man [1970], McA­dam [1982]. Para huel­gas en Fran­cia, ver Shor­ter y Tilly [1974]. Para lin­cha­mien­tos en Esta­dos Uni­dos, ver los recien­tes tra­ba­jos de Spilerman.

[6] Ver tam­bién Eisin­ger [1973].

[7] Tuch­man [1973] eti­que­ta al pri­mer tipo de noti­cias como “sua­ves” y al segun­do tipo como “duras”; ver tam­bién Danz­ger [1975].

[8] Ver, por ejem­plo, McA­dam [1982: 237].

[9] Ver tam­bién Eco [1971]; Dar­dano [1973]; Mor­ley [1976].

[10] Danz­ger argu­men­ta que esta pro­ba­bi­li­dad es mayor en el caso ante­rior, mien­tras que Sny­der y Kelly argu­men­tan exac­ta­men­te lo opues­to. Ver Danz­ger [1975: 570, 581]; Sny­der y Kelly [1977: 119–120].

[11] Ver tam­bién McA­dam [1982: 235].

[12] Para el pro­ble­ma de erro­res de medi­ción con refe­ren­cia espe­cí­fi­ca al aná­li­sis de con­te­ni­do, ver Budd, Thorp y Donohew [1966: 66–71]; Hols­ti [1969: 127–149]; Krip­pen­dorff [1980: 129–168].

[13] Sobre la opor­tu­ni­dad de dise­ñar el esque­ma de codi­fi­ca­ción de tal mane­ra que per­mi­ta una actua­li­za­ción sen­ci­lla, espe­cial­men­te para pro­yec­tos de aná­li­sis de con­te­ni­do que con­ten­gan un gran cuer­po de mate­rial que no sea fácil o que no esté com­ple­ta­men­te pre codi­fi­ca­ble, ver Budd, Thorp y Donohew [1966: 54].

[14] Tech­ni­cal Report 100.5, 9.30.1980:2; para una deta­lla­da des­crip­ción del pro­ce­so de com­pa­ra­ción ver Tec­ni­cal Reports 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4, y 100.5.

[15] Para más deta­lles, ver Fran­zo­si [1986]. Sobre la base de estos con­cep­tos, he desa­rro­lla­do una gra­má­ti­ca para reco­lec­tar datos des­de el perió­di­co sobre con­flic­tos indus­tria­les. Tam­bién desa­rro­llé un pro­gra­ma de compu­tado­ra (PC-ACE, Pro­gram for Com­pu­ter-Aided Coding of Events) que corre en compu­tado­ras y sigue de cer­ca la gramática.

[16]Sobre este pun­to ver tam­bién Danz­ger [1975].

[17] Sobre noti­cias de perió­di­cos sobre tama­ños de mul­ti­tu­des, ver Jacobs [1967]; ver tam­bién Danz­ger [1975: 574].

[18] Sobre el pro­ble­ma acer­ca del mues­treo por acep­ta­ción, ver Ame­ri­can Sta­tis­ti­cal Asso­cia­tion [1950].

[19] Para más medi­cio­nes de fia­bi­li­dad, ver Krip­pen­dorf [1980: 129–54].

[20] Para mues­treo en aná­li­sis de con­te­ni­do, ver Budd, Thorp y Donohew [1966: 4–9]; Krip­pen­dorf [1980: 65–70].

[21] Uno tal vez se pre­gun­te si el recur­so a tales con­cep­tos agre­ga­dos como dispu­ta o cam­pa­ñas colec­ti­vas des­ca­li­fi­can a los perió­di­cos como fuen­tes de datos his­tó­ri­cos. La duda es legí­ti­ma: des­pués de todo, ¿no es ver­dad que los perió­di­cos solo rea­li­zan cró­ni­cas de even­tos como huel­gas, mani­fes­ta­cio­nes, etc.? Las dos cosas no son mutua­men­te exclu­yen­tes, aun­que tal vez lo parez­ca a pri­me­ra vis­ta. El hecho de que una dispu­ta sea una uni­dad de aná­li­sis más sig­ni­fi­ca­ti­va que una huel­ga, sim­ple­men­te sig­ni­fi­ca que la infor­ma­ción reco­lec­ta­da en el nivel de even­tos dis­cre­tos deba ser aña­did a nive­les más altos de agre­ga­ción; ver tam­bién la sec­ción Agre­gan­do datos: Uni­da­des de análisis.

[22] Sobre estos pun­tos ver Budd, Thorp y Donohew [1966: 31–38]; Krip­pen­dorf [1980: 57–64].

[23] Sobre uni­da­des refe­ren­cia­les en aná­li­sis de con­te­ni­do, ver Budd, Thorp y Donohew [1966: 61–62].

[24] Para estos pun­tos, ver tam­bién Tilly [1969: 28–31].

[25] “Bási­ca­men­te (un sis­te­ma de base de datos) es nada más que un sis­te­ma de regis­tro compu­tari­za­do, esto es, un sis­te­ma cuyo ente­ro pro­pó­si­to es regis­trar y man­te­ner infor­ma­ción”. Cita­do de Date [1981]. Nor­mal­men­te, un sis­te­ma de base de datos con­sis­te en varios archi­vos dife­ren­tes que con­tie­nen infor­ma­ción sig­ni­fi­ca­ti­va orga­ni­za­da bajo la ges­tión del poten­te soft­wa­re Data­Ba­se Mana­ge­ment Sys­tems (DBMS). Hay tres mane­ras prin­ci­pa­les por las cua­les DBMS orga­ni­za los datos en la base de datos: rela­cio­nal, jerár­qui­co, en redes. El DBMS rela­cio­nal, por ejem­plo, no solo per­mi­te a los usua­rios crear bases de datos des­de cero, nos per­mi­te tam­bién rea­li­zar inser­cio­nes, borra­dos y modi­fi­ca­cio­nes de entra­das. Lo más impor­tan­te, nos per­mi­te rea­li­zar con­sul­tas, esto es, bús­que­das a tra­vés de la base de datos para rela­cio­nes espe­cí­fi­cas con el pro­pó­si­to de extraer­las. Ade­más, podría­mos rea­li­zar con­sul­tas de todos los even­tos en don­de inter­vino la poli­cía o en qué esta­do, en sus varios nive­les, inter­vino como árbi­tro en dispu­tas entre capital/trabajo. Tam­bién, podría­mos rea­li­zar con­sul­tas de todas las dispu­tas que ocu­rrie­ron en deter­mi­na­da fir­ma, terri­to­rio o perio­do. En efec­to, el usua­rio no debe­ría preo­cu­par­se, en cómo DBMS esta­ble­ce los indi­ca­do­res (los víncu­los entre ítems de infor­ma­ción) y guar­da la infor­ma­ción; DBMS hace eso por ella o por él, hacien­do que el guar­da­do y el mane­jo de estruc­tu­ras de datos com­ple­jos sea muy sim­ple. Los víncu­los y rela­cio­nes expli­ci­tas entre sím­bo­los incrus­ta­dos en una gra­má­ti­ca, como se dis­cu­tió arri­ba, crea datos de los even­tos reco­lec­ta­dos uti­li­zan­do una gra­má­ti­ca ade­cua­da para las apli­ca­cio­nes de DBMS.

[26] Sobre los dife­ren­tes nive­les en los cua­les los aná­li­sis de even­tos de pro­tes­ta han sido rea­li­za­dos ver Tilly [1969] y Sny­der y Kelly [1977: 105].

Bibliografía

Ame­ri­can Sta­tis­ti­cal Association
1950 Accep­tan­ce Sam­pling. Ame­ri­can Sta­tis­ti­cal Asso­cia­tion, Washing­ton, DC.

Ben­son, Susan Porter
1978 The cler­king sis­terhood, ratio­na­li­za­tion and the work cul­tu­re of sales­wo­men Ame­ri­can depart­ment sto­res, 1890–1960. Radi­cal Ame­ri­ca, 12:41–55.

Beha­rrell, Peter y Greg Philo
1977 Tra­de Unions and the media. Mac­Mi­llan, London.

Berk, Richard
1983 An intro­duc­ction to sim­ple selec­tion bias in socio­lo­gi­cal data. Ame­ri­can Socio­lo­gi­cal Review, 48:386–98.

Bloom­baum, Milton
1968 The con­di­tions underl­ying race riots as por­tra­yed by mul­ti­di­men­sio­nal sca­lo­gram analy­sis: A reanaly­sis of Lie­ber­son and Silverman’s data. Ame­ri­can Socio­lo­gi­cal Review, 33:76–91.

Bowers, David
1967 A report on acti­vity by publishers in direc­ting news­room deci­sions. Jour­na­lism Qua­terly, 1:43–52.

Breed, Warren
1955 Social con­trol in the news­room: A fun­ctio­nal analy­sis. Social For­ces, 33:326–335.

Budd, Richard, Robert Thorp y Lewis Donohew
1966 Con­tent analy­sis of com­mu­ni­ca­tions. Mac­Mi­llan, Nue­va York.

Burch, Phi­lip
1972 The mana­ge­rial revo­lu­tion reas­ses­sed. Health and Co, Lexing­ton (Mass).

Bwy, Dou­glas
1968 Poli­ti­cal ins­ta­bi­lity in Latin Ame­ri­ca: The cross-cul­tu­ral test of a casual model. Latin Ame­ri­ca Research Review, III: 17–67.

Capec­chi, Vit­to­rio y Marino Livolsi
1971 La stam­pa quo­ti­dia­na in Ita­lia. Bom­pia­ni, Milano. 

Cen­ter for Demography
100.5, 9.30.1980:2; 50R, 73, 78, 100.IR, 100.2, 100.3, 100.4 Tech­ni­cal Report, The Uni­ver­sity of Wisconsin.

Char­les­worth, Andrew
1979 Social pro­test in a rural society: The spa­tial dif­fu­sion of the Cap­tain Swing dis­tur­ban­ces of 1830–1831. His­to­ri­cal Geo­graphy Research Series. Uni­ver­sity of East Anglia. Geo Abs­tracts Ltd, Norwich.

Chomsky, Noam
1971 Chomsky: Selec­ted readings, J. P. B. Allen and Paul Van Buren (edit.). Oxford Uni­ver­sity Press, Londres.

Danz­ger, M. Herbert
1975 Vali­da­ting con­flict data. Ame­ri­can Socio­lo­gi­cal Review, 40: 570–84.

Dar­dano, Maurizio
1973 Il lin­guag­gio dei gior­na­li ita­lia­ni. Later­za, Bari.

Date Chris
1981 An intro­duc­tion to data­ba­se sys­tems. Adis­son-Wes­ley, Reading, Mass.

De Luna, Gio­van­ni, Nan­da Tor­ce­llan y Pao­lo Murialdi
1980 La stam­pa ita­lia­na dalla resis­ten­za agli anni ses­san­ta. Later­za, Bari: 304–308.

Dow­nes, Bryan
1968 Social and poli­ti­cal cha­rac­te­ris­tics of riot cities: A com­pa­ra­ti­ve study. Social Scien­ce Qua­terly, 49:504–520.
1970 A cri­ti­cal reexa­mi­na­tion of the social and poli­ti­cal cha­rac­te­ris­tics of riot cities. Social Scien­ce Qua­terly, 51:349–360.

Dow­ning, John
1980 The media machi­ne. Plu­to Press, Londres.

Eco, Umber­to
1971 Gui­da all’interpretazione del lin­guag­gio gior­na­lis­ti­co, en La stam­pa quo­ti­dia­na in Ita­lia, Vit­to­rio Capec­chi y Marino Livol­si (edit.). Bom­pia­ni, Milano. 

Eisin­ger, Peter
1973 The con­di­tions of pro­test beha­vior in Ame­ri­can cities. Ame­ri­can Poli­ti­cal Scien­ce Review, 67:11–28.

Feie­ra­bend, Ivo y Rosa­lind Feierabend
1966 Aggres­si­ve beha­viors within poli­ties, 1948–1962: A cross-natio­nal study. Jour­nal of Con­flict Reso­lu­tion, 10:249–271.

Fran­zo­si, Roberto
1986 From words to num­bers: A gene­ra­li­zed and com­pu­ter-based coding pro­ce­du­re for collec­ting event-data from newspapers.

Galam­bos, Louis
1975 Public ima­ge about big busi­ness, 1880–1940: A quan­ti­ta­ti­ve study in social chan­ge. The Johns Hop­kins Uni­ver­sity Press, Baltimore.

Gans, Her­bert
1980 Deci­ding what’s news. Vin­ta­ge Books, Nue­va York.

Gitlin, Todd
1980 The who­le world is wat­ching. Uni­ver­sity of Cali­for­nia Press, Berkeley.

Glas­gow Uni­ver­sity Media Group
1976 Bad News. Routle­ge and Kegan Paul, London.

Gurr, Ted Robert
1968 A casual model of civil stri­fe: A com­pa­ra­ti­ve analy­sis using new indi­ces. Ame­ri­can Poli­ti­cal Scien­ce Review, 62:1104–1124.

Hall, Stuart
1977 Cul­tu­re, the media, and ideo­lo­gi­cal effect, en Mass com­mu­ni­ca­tion and society, J. Curran, M. Gure­vitch and J. Woo­lla­cott (edit.). Sage, Beverly Hills.

Hart­mann, Paul
1975/76 Indus­trial rela­tions in the news media. Indus­trial Rela­tions Jour­nal, 6:4–18.
1979 News and public per­cep­tions of indus­trial rela­tions. Media, cul­tu­re and society, I: 255–270.

Heck­man, James
1979 Sam­ple selec­tion bias as a spe­ci­fi­ca­tion error. Eco­no­me­tri­ca, 47:153–161.

Hobs­bawm, Eric y Geor­ge Rude
1968 Cap­tain Swing. W. W Nor­ton & Co., New York.

Hofs­tet­ter, C. Richard
1976 Bias in the news. Ohio Sta­te Uni­ver­sity Press, Colum­bus (Ohio).

Hols­ti, Ole
1969 Con­tent analy­sis for the social scien­ces and huma­ni­ties. Addi­son-Wes­ley, Reading (Mass).

Jacobs, Her­bert
1967 To count a crowd. Colum­bia Jour­na­lism Review, 1:37–40.

Jacob­son, Alvin
1973 Some theo­re­ti­cal and metho­do­lo­gi­cal con­si­de­ra­tions for mea­su­ring intra­so­cie­tal con­flict. Socio­lo­gi­cal Methods and Research, 1:439–461.

Krie­si, Hans­pe­ter, R. Levy, G. Gan­gui­llet, y H. Zwicky
1981 Poli­tis­che Akti­vie­rang in der Sch­weiz, 1945–1978. Ver­lag Rueg­ger, Switzerland.

Krip­pen­dorff, Klaus
1980 Con­tent analy­sis, an intro­duc­tion to its metho­do­logy. Sage, Beverly Hills.

Las­well, Harold, Daniel Ler­ner y Ithiel de Sola
1952 The com­pa­ra­ti­ve study of sym­bols. Stan­ford Uni­ver­sity Press, Stanford.

Lie­ber­son, Stan­ley y Arnold Silverman
1965 The pre­ci­pi­tants and underl­ying con­di­tions of race riots. Ame­ri­can Socio­lo­gi­cal Review, 30:887–898.

Mar­well, Gerald y Pame­la Oliver
1984 Collec­ti­ve action theory and social move­ments research, en Research in social move­ments, con­flicts, and chan­ge (Vol. 7), Louis Kries­berg (edit.). JAI Press INC., Londres.

McA­dam, Doug
1982 Poli­ti­cal pro­cess and the deve­lop­ment of black insur­gency 1930–1970. The Uni­ver­sity of Chica­go Press, Chicago.

Molo­toch, Har­vey y Marilyn Lester
1974 News as pur­po­si­ve beha­vior: On the stra­te­gic use of rou­ti­ne events, acci­dents, and scan­dals. Ame­ri­can Socio­lo­gi­cal Review, 39:101–112.

Mor­ley, David
1976 Indus­trial con­flict and the mass media. Socio­lo­gi­cal Review, 24.

Mur­dock, Graham y Peter Golding
1977 Capi­ta­lism com­mu­ni­ca­tions and class rela­tions, en Mass com­mu­ni­ca­tion and society, James Curran, Michael Gure­vitch and Janet Woo­lla­cott (edit.). Sage, Beverly Hills.

Nedzyns­ki, Stefan
1973 Inequa­lity in Access to com­mu­ni­ca­tion faci­li­ties for wor­king class orga­ni­za­tionsn, en Com­mu­ni­ca­tions, tech­no­logy, and social policy, Geor­ge Gerb­ner, Larry Gross, and William Melody (edit.). Wiley, Nue­va York: 413–423.

Pai­ge, Jeffery
1975 Agra­rian revo­lu­tion. The Free Press, New York.

Piz­zorno, Alessandro
1973 I sin­da­ca­ti nel sis­te­ma polí­ti­co ita­liano; aspet­ti sto­ri­ci, en Il Sis­te­ma polí­ti­co Ita­liano, Pao­lo Far­ne­ti (edit.). Il Mulino, Bolonga.

Rum­mel, Rudolph
1963 Dimen­sions of con­flict beha­vior within and bet­ween nations. Gene­ral Sys­tems Year­book, VIII: 1–50.
1965 A field theory of social action with appli­ca­tions to con­flict within nations. Gene­ral Sys­tems Year­book, X: 183–211.

Rus­set, Bruce
1964 Inequa­lity and ins­ta­bi­lity: The rela­tion of land tenu­re to poli­tics. World Poli­tics, XVI: 442–454.

Sha­lev, Michael
1978 Lies, Dam­med Lies, and Stri­ke Sta­tis­tics, en The resur­gen­ce of class con­flict in Wes­tern Euro­pe sin­ce 1968, Colin Crouch and Ales­san­dro Piz­zorno (edit.). Mac­Mi­llan, Londres.

Shor­ter, Edward y Char­les Tilly
1974 Stri­kes in Fran­ce. Cam­brid­ge Uni­ver­sity Press, Cambridge.

Sny­der, David y William Kelly
1977 Con­flict inten­sity, media sen­si­ti­vity, and the vali­dity of news­pa­per data. Ame­ri­can Socio­lo­gi­cal Review, 42:105–123.

Spi­ler­man, Seymour
1970 The cau­ses of racial dis­tur­ban­ces: A com­pa­ri­son of alter­na­ti­ve expla­na­tions. Ame­ri­can Socio­lo­gi­cal Review, 35:627–649.

Tan­ter, Raymond
1966 Dimen­sions of con­flict beha­vior within and bet­ween nations 1958–1960. The Jour­nal of Con­flict Reso­lu­tion, X: 41–64.

Tilly, Char­les
1969 Methods for the study of collec­ti­ve vio­len­ce, en Pro­blems in research on com­mu­nity vio­len­ce, Ralph Conant and Molly Apple Levin (edit.). Prae­ger, Nue­va York.

1981 As Socio­logy meets his­tory. Aca­de­mic Press, Nue­va York.

Tuch­man, Gaye
1973 Making News by Doing Work: Rou­ti­ni­zing the Unex­pec­ted. Ame­ri­can Jour­nal of Socio­logy, Vol. 79 (1): 110–131.

Wan­de­rer, Jules
1969 An index of riot seve­rity and some corre­la­tes. Ame­ri­can Jour­nal of socio­logy, 74:500–509.

Zeller, Richard y Edward Carmines
1980 Mea­su­re­ment in the social scien­ces, the link bet­ween theory and data. Cam­brid­ge Uni­ver­sity Press, Cambridge.

~•~

Cómo citar ¬

Roberto Franzosi, «La prensa como fuente de datos socio-históricos: Cuestiones sobre la metodología de recolección de datos a partir de periódicos», Revista de Estudios Marítimos y Sociales [En línea], publicado el [insert_php] echo get_the_time('j \d\e\ F \d\e\ Y');[/insert_php], consultado el . URL: https://wp.me/P7xjsR-Pv
~•~
Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento — No Comercial — Compartir Igual 4.0 Internacional.