11.12.10

¿Hacia un análisis computarizado de la literatura?

Una nueva beca de Google para investigadores cruza enormes bases de datos y herramientas de búsqueda. ¿Nuevas posibilidades de análisis o deshumanización de la lectura? Una polémica objetivada en las obsesiones victorianas

LO VIEJO Y LO NUEVO: Libros del siglo XVIII que se serán escaneados por una computadora.foto.fuente:Revista Ñ

Los victorianos amaban la nueva ciencia de estadísticas, por lo tanto parece coherente que estos obsesivos coleccionistas y estudiosos de datos crudos ahora sean objeto de un estudio inusual en análisis estadístico. Los títulos de todos los libros británicos publicados en inglés en el Siglo XIX —1.681.161, para ser exactos— están siendo electrónicamente revisados para identificar palabras y frases clave que podrán revelar nuevas perspectivas sobre la mente victoriana.

Esta investigación, que se ha convertido en una posibilidad recientemente gracias a una gama de nuevas herramientas y bases de datos digitales, representa una de las varias formas en la cual la tecnología esta transformando cómo se estudia la literatura, la filosofía y otros campos dentro de las humanidades que hasta ahora no han adoptado el análisis cuantitativo a gran escala.

Dan Cohen y Fred Gibbs, ambos historiadores de la ciencia en la universidad de George Mason, son los creadores del proyecto. Hasta ahora han analizado cómo más de dos docenas de palabras —entre ellas "dios", "amor", "trabajo, "ciencia" y "industrial"— aparecen en títulos de libros británicos desde la Revolución francesa en 1789 hasta el comienzo de la Primera Guerra Mundial en 1914. Para Cohen, las líneas dentadas que bailan a través de sus gráficos se pueden utilizar para probar una de las creencias y percepciones que tenemos sobre los victorianos, como su fe en la ciencia y el progreso: "Por fin podemos realmente testear estas y otras afirmaciones que han estado en el centro de los estudios victorianos por décadas."

El Profesor Cohen dijo que él y Gibbs esperaban que su trabajo funcionara como un modelo para otros investigadores. Para ellos, utilizar las nuevas herramientas digitales podría cambiar antiguas suposiciones e interpretaciones en varios campos de las humanidades.

Algunos de sus colegas están intrigados por las posibilidades.

"Mi reacción personal fue de absoluta excitación," dijo Alice Jenkins, profesora de literatura y cultura victoriana en la universidad de Glasgow, quien vio a Cohen presentar sus resultados iniciales en una reciente conferencia sobre esa corriente.

Pero a su vez, hay ansiedad sobre cómo el potencial de las herramientas electrónicas podría reducir la literatura y la historia a una serie de números, eliminando temas importantes que no pueden ser fácilmente cuantificados.

"Yo estaba excitado y aterrorizado," dijo Matthew Bevis, profesor en la universidad de York en Inglaterra, quien estuvo en la misma conferencia. "Esto no es solamente una herramienta; esto—en realidad— ayuda a postular el tipo de preguntas que alguien dentro de la literatura se podría proponer", dijo. Y agregó: "El programa tendría que tener una advertencia: Usar con cuidado."

Semejantes preocupaciones no impidieron que Bevis, y otros académicos en la audiencia, le pidieran a Cohen que ejecutara búsquedas de ciertos términos o palabras que eran pertinentes a sus actuales investigaciones. Meredith Martin, una profesora adjunta de literatura inglesa en la universidad de Princeton que estudia formas poéticas estaba interesada en las palabras "métrica" y "verso."

"Le mandé un correo electrónico mientras daba la ponencia," dijo Martin. Se imaginaba que iba estar inundado de pedidos y quería ser "la primera en la fila."

El estudio de Cohen y Gibbs "Re-Enmarcando a los victorianos" es uno de doce proyectos universitarios que ganaron una nueva beca llamada el digital humanities award y que fue creada por Google. La beca consiste en dinero pero también ofrece acceso a las computadoras y bases de datos súper-potentes de la empresa.

Algunos investigadores sienten temor al pensar en el control que una empresa como Google podría llegar a ejercer sobre información digital. El plan de Google para crear una enorme biblioteca y librería online ha provocado protestas sobre un potencial monopolio sobre libros digitales y los precios posiblemente elevados que se aplicarían a acceder a esos textos.

Pero Jon Orwant, el manager de ingeniería para Google Books, Revistas y Patentes dijo que el plan de la empresa era habilitar estos textos y herramientas gratis para investigadores y bibliotecas. "Eso es algo que haremos absolutamente. Y no, no costará nada," dijo.

Un criterio al elegir proyectos para financiar, agregó Orwant, fue si iban crear nuevos corpus de datos y de códigos de computación que podrían ser útiles para futuros investigadores.

Las búsquedas de títulos de libros hechas por Gibbs y Cohen representan solamente una primera pasada sobre toda la información que tienen disponible. El segundo paso será hacer una búsqueda profunda de los textos en sí. Los profesores tendrán la posibilidad de enfocar detalles, títulos específicos y todos los elementos de los textos.

Su punto de partida fue un trabajo anterior que se enfocaba en la palabra escrita como punto de entrada a esta época histórica: el libro de Walter E. Houghton, Victorian Frame of Mind (El punto de vista victoriano), publicado en 1957. Este libro clave ha tenido una profunda influencia en generaciones de investigadores por más que sus conclusiones han sido refutadas. Houghton intentó captar lo que el llamaba "un sentido general" de cómo pensaban los victorianos de la clase media y media alta. Esto lo hizo a través de una detallada lectura de decenas de textos escritos en la era y metódicamente contando cuántas veces aparecían ciertas palabras. El uso aumentado de "esperanza", "luz" y "luz del sol" (sunlight), por ejemplo, fue interpretado como una demostración del optimismo de los victorianos.

La lista de libros que leyó Houghton era monumental. Sin embargo, su metodología provocó dudas sobre la validez de extrapolar las actitudes de millones de personas a base de solamente unos cientos de libros.

Las posibilidades completamente abarcadora que ofrece la investigación digital es una respuesta definitiva a tales quejas. "Toda la historia es anecdótica," dijo Cohen. "Podrías leer tres libros y decir que los victorianos estaban obsesionados con el mal, o podrías leer 30 o 300 libros; pero no leíste 10.000 libros."

Ahora, explicó Cohen, las vastas bibliotecas digitales presentan "por la primera vez la posibilidad de hacer un sondeo comprensivo de la escritura victoriana — no solamente los libros conocidos, como de Mills y Carlyle, pero también miles y miles de autores menos conocidos o, directamente, olvidados."

Los gráficos preliminares que presentó en la conferencia confirman lo que ya sabíamos, dijo Cohen. Un declive en las referencias a "dios", "cristiano" y "universal" es consistente con el punto de vista convencional de que el Siglo XIX fue una era en la cual aumentó el secularismo y el escepticismo.

Sin embargo, búsquedas enormes también pueden desafiar ciertas teorías persistentes de la lectura cercana (close reading). Por ejemplo, la idea que los victorianos estaban obsesionados con la naturaleza y los orígenes del mal. Resulta que libros con la palabra "maldad" ("evil") en el título se encontraban en el fondo del gráfico, representando menos del 0.1 por ciento de todo los títulos publicados en la era victoriana.

Cohen reconoce rápidamente que el significado de estos números no esta para nada claro. Puede ser que los autores no les gustaba usar la palabra "maldad" en el título; o tal vez hubieron otros sinónimos que se usaban; tal vez el contexto apunta hacia otra interpretación completamente diferente.

Martin conoce de primera mano cómo las búsquedas electrónicas pueden, a la vez, desenterrar textos ocultos, pero también llevar a "calles sin salida." Ella ha pasado la última década compilando listas de libros, diarios y artículos de revistas sobre los aspectos técnicos de la poesía.

Recuerda haber encontrado una abrupta explosión del uso de las palabras "sintaxis" y "métrica" ("prosody") en 1832, lo que sugería un debate intenso sobre las estructuras poéticas. Pero resultó que dos caballos de carrera se llamaban Doctor Syntax y Doctor Prosody.

"Se encuentran 200 títulos con "sintaxis" y se te ocurre que debe haber un gran debate sobre la gramática en ese año. Resulta que era el caballo que estaba ganando más carreras."

Los investigadores también deberían tener en mente que el pasado consiste en mucho más que lo escrito, dijo el Bevis en una entrevista. Menos referencias a un tema no significa, necesariamente, que ese tema haya desaparecido de la cultura. Al contrario, podría haberse convertido en algo tan común que ya no forma parte del debate escrito. Bevis citó a Emily Dickinson: "¿Es olvido o absorción cuando las cosas pasan en nuestras mentes?" ("Is it oblivion or absorption when things pass from our mind?"

Más preocupante aun, dice Bevis, es el temor que las medidas estadísticas podrían tomar predominancia sobre la interpretación de significados.

No hay que preocuparse, dicen los que abrazan los nuevos métodos. No hace falta enfrentar la interpretación con la computación. En todo caso, dice Jenkins, investigaciones cuantitativas de gran escala probablemente traerán a la luz "la importancia y valor de lecturas precisas (close reading); el compromiso detallado, imaginativo y detallado con las palabras, párrafos y líneas de verso.

"La lectura humana (close reading)," agregó, "será aun más importante en un mundo donde podemos, potencialmente, leer cada palabra de la escritura victoriana que se haya publicado."

No hay comentarios: