El perfil profesional del periodista de datos en Perú: Casos Ojo Público, CONVOCA, El Comercio Data y La República Data

 

The professional profile of the data journalist in Peru: Case studies of Ojo Público, CONVOCA, El Comercio Data and La República Data

 

 

 


  Recibido: 07/09/2022

  Aceptado: 30/11/2022
  Publicado
: 28/12/2022

 

  Rocío Lizbetty Romero Benites

  rocio.romero1@unmsm.edu.pe

  https://orcid.org/0000-0003-2935-1974

  Universidad Nacional Mayor de San Marcos, Perú

 

  Doi: https://doi.org/10.24265/cian.2022.n16.06

 

  Cómo citar

 Romero Benites, R. (2022). El perfil profesional del periodista de datos en Perú: Casos Ojo Público, Convoca, El Comercio Data y La República Data. Correspondencias & Análisis, (16), 129-152. Recuperado a partir de http://ojs.correspondenciasyanalisis.com/index.php/Journalcya/article/view/420


 

Resumen

 

Esta investigación describe el perfil profesional de los periodistas que laboran en las salas de redacción pioneras en el análisis de datos en Perú: Ojo Público y CONVOCA, como medios nativos digitales; El Comercio Data y La República Data, como parte de los medios tradicionales. Adoptando un enfoque mixto se entrevista a los jefes, coordinadores o directores, y se aplican cuestionarios a los periodistas de dichos medios. Los resultados muestran que los periodistas siguen la metodología del periodismo de datos consistente en siete fases de trabajo: recopilar, limpiar, contextualizar, combinar, analizar, verificar y comunicar los datos; además, emplean herramientas tecnológicas en cada una de ellas con un nivel de habilidad que, principalmente, no es de experto. Se destaca, adicionalmente, que la mayoría de sus conocimientos lo adquirieron de manera autodidacta, evidenciando así una falta de especialización del periodismo de datos en la formación superior peruana.


Palabras clave: periodista de datos, periodismo de datos, herramientas tecnológicas, medios de comunicación, datos masivos, perfil profesional.


Abstract

 

This research describes the professional profile of journalists working in newsrooms pioneering data analysis in Peru: Ojo Público and CONVOCA as digital native media, and El Comercio Data and La República Data, as part of traditional media. To achieve this objective, and through a mixed approach, the chiefs, coordinators or directors are interviewed, and questionnaires are applied to the journalists of these media. The results show that journalists follow the methodology of data journalism, consisting of seven work phases: collecting, cleaning, contextualizing, combining, analyzing, verifying and communicating data; in addition, they use technological tools in each of them with a level of skill that, mainly, is not that of an expert. It should also be noted that most of their knowledge was acquired in a self-taught manner, thus showing a lack of specialization in data journalism in Peruvian higher education.

 

Keywords: data journalist, data journalism, technological tools, mass media, big data, professional profile.

 

 

 

Introducción

 

El periodismo de datos es una disciplina (Arias y Carvajal, 2022; Bueno, 2014; López, 2019) que surge como consecuencia del desarrollo de las tecnologías de la información y la comunicación, y del uso de datos masivos. Existen diversas vías para acceder a grandes volúmenes de información, como las filtraciones, búsquedas avanzadas en Internet o el scraping, una técnica que permite descargar información de la web de manera sistematizada; sin embargo, son las leyes de acceso a la información pública las que permiten su consolidación (Córdoba y García, 2021; Cortés et al., 2018; Flores y Salinas, 2013; Magallón, 2013). En ese sentido, resulta importante que los periodistas no solo sepan cómo realizar peticiones de acceso a la información pública en los países en los que se cuente con una normativa que permita ello, como es el caso peruano, sino que también estén en la capacidad de presentar recursos de apelación, en la a administrativa, o hábeas data en la a judicial, ante la negativa de las instituciones de la administración pública de brindar información.

 

Las salas de redacción que desarrollan el periodismo de datos se caracterizan por tener un equipo de trabajo multidisciplinario (De Limas, 2022; Ferreras, 2013; Spagnuolo, 2019) que, además de periodistas, incluye a programadores, ingenieros, diseñadores, entre otros perfiles profesionales que varían de acuerdo a las necesidades de los medios de comunicación. Siguen una metodología de trabajo que empieza con la obtención de datos masivos, y tras varios procesos, culmina con la publicación de ellos por medio de distintos productos periodísticos, como textos, aplicaciones de noticias, visualizaciones interactivas, entre otros.

 

Esta disciplina periodística permite encontrar «relaciones entre esos datos que a menudo son imperceptibles a simple vista y que solo pueden ser comprendidas mediante su análisis con herramientas» (Michiels, 2017, p. 12); la finalidad es publicar historias de impacto. También, promueve la difusión de información pública con la que interactúa el usuario si esta se encuentra en archivos descargables o en aplicaciones de noticias. En este escenario de evolución del periodismo de datos, se han publicado diversos estudios que describen el perfil profesional del periodista especializado en el análisis de datos y cómo ha sido su formación universitaria; sin embargo, estos estudios están enfocados en países como España o Estados Unidos, dejando de lado el ámbito peruano, pese a que actualmente existe un ecosistema variado de medios y unidades dentro de las organizaciones periodísticas que abiertamente practican el periodismo de datos, como son Ojo Público, CONVOCA, El Comercio Data y La República Data.

 

En este contexto, ¿cuál es el perfil profesional de los periodistas que laboran en salas de redacción especializadas en el análisis de datos en Perú? Para responder esta interrogante, primero, es necesario comprender lo siguiente: (1) ¿cómo están estructuradas sus redacciones y qué flujo de trabajo siguen?, (2) ¿qué herramientas tecnológicas, métodos o programas emplean en sus rutinas laborales y qué niveles de conocimiento tienen? Además, es preciso contrastar si los periodistas adquirieron los conocimientos que aplican en su trabajo durante su formación superior o de otra manera. El perfil profesional también incluye aspectos sociodemográficos de cada individuo.

 

 

Marco referencial

 

El periodismo de datos: antecedentes y metodología

 

El periodismo de precisión y el periodismo asistido por computadoras anteceden al periodismo de datos. La primera disciplina, de acuerdo con Meyer (2002), se caracteriza por aplicar métodos de investigación social y psicosocial que no habían sido empleados en la profesión periodística, con la finalidad de buscar estadísticas oficiales, bases de datos públicas o privadas y otras fuentes que alimenten las investigaciones. En tanto, al periodismo asistido por computadoras se le considera como la evolución del periodismo de precisión en donde se utilizan equipos tecnológicos y herramientas, como las hojas de cálculo para procesar la data. A diferencia de estas dos disciplinas mencionadas, en el periodismo de datos se requiere el uso masivo de información (Crucianelli, 2013; Loosen, 2018; López et al., 2016), el trabajo con equipos multidisciplinarios (Ferreras, 2016; Oliveira y Angeluci, 2019) y la creación de visualizaciones estáticas o interactivas (Engebretsen et al., 2018; Ivars, 2019). El empleo de lenguajes de programación y herramientas estadísticas (Flores, 2018; Saavedra et al., 2020) también es parte de esta disciplina periodística que se encuentra en constante evolución.

 

El trabajo metodológico del periodismo de datos incluye siete fases de trabajo: compilación, limpieza, contextualización, combinación, análisis, verificación y comunicación de los datos (Bradshaw, 2011; Flores y Salinas, 2013) y en cada una de ellas se requiere aplicar ciertos conocimientos, como el «uso de herramientas tecnológicas y recursos disponibles en la red, de lenguajes de codificación y programación de algoritmos, de técnicas de procesamiento de datos masivos (macrodatos) y de conocimientos avanzados de la ciencia computacional (informática)» (Flores y López, 2020, p. 81).

 

La etapa de compilación de información, por ejemplo, se puede lograr por medio de filtraciones y descargas de datos de los portales web públicos y privados, pero el camino s utilizado son las solicitudes de acceso a la información pública. En el caso peruano está vigente desde el 2003 la Ley de Transparencia y Acceso a la Información Pública, Ley Nº 27806, que permite a la ciudadanía acceder a información construida o en poder de las instituciones de la administración pública. Al manejar esta ley, resulta importante que los periodistas sepan cómo apelar una respuesta negativa de información o, incluso, armar un hábeas data si el caso se disputa en la a legal, debido a que aún las entidades públicas cometen errores en el marco de entrega de información: lo hacen fuera del plazo legal de diez días hábiles, a menos de que indiquen previamente una prórroga, la brindan de manera parcial o incluso no responden a la solicitud (Ministerio de Justicia y Derechos Humanos, 2022).

 

La limpieza de información consiste en la eliminación de los errores humanos y en estructurar una base de datos de la mejor manera posible para que esta sea entendida y utilizada por las demás personas. En esta fase de trabajo, usualmente se utilizan programas como Google Sheets, Data Wrangler, Open Refine (Renó, 2018), Excel, Google Sheets, Tabula o Trifacta y aquellos profesionales con mayor conocimiento tecnológico emplean lenguajes de programación como C++ o R. Luego continúan la contextualización y combinación de las bases de datos. El primer caso se refiere a comprender todos los aspectos relacionados a la información que se posee; es decir, por qué se construyó, quién lo hizo, entender cada uno de los términos técnicos, entre otros aspectos (Fallas, 2014); mientras que el segundo caso consiste en relacionar entre sí las bases de datos que se poseen con la finalidad de encontrar mejores historias periodísticas.

 

Después de estas actividades sigue el análisis de los datos, que se puede realizar también con Open Refine, Excel y Google Sheets, lenguajes de programación como PHP, R, Python o SQL, y programas estadísticos como SPSS, entre otros. Principalmente son los tecnólogos, aquellos profesionales con conocimientos en tecnología, quienes poseen estas últimas habilidades. La verificación, en cambio, se refiere a validar los datos mediante entrevistas a las personas involucradas y a su revisión para detectar debilidades (Hidalgo y Torres, 2016); mientras que la comunicación es la manera como se transmite la información. Sobre este último aspecto existe una variedad de productos periodísticos como los artículos basados en datos, visualizaciones interactivas, conjunto de datos abiertos o aplicaciones de noticias (Crucianelli, 2013), pero la selección de ellos dependerá del material que se disponga y los objetivos de comunicar que establezcan las salas de redacción. En la visualización de datos se suelen emplear programas en sus versiones gratuitas o de paga; así se tiene a Infogram, Datawrapper, Flourish, Tableau o Power BI, y también lenguajes de programación como Python o JavaScript.

 

 

El ecosistema peruano del periodismo de datos

 

El periodismo de datos en Perú tiene sus antecedentes en una investigación que realizó en 1997 la periodista Liz Mineo para el diario El Comercio (Hidalgo y Torres, 2016). Un funcionario del Instituto Nacional de Defensa Civil le brindó 80 páginas de información con nombres de las obras y empresas contratadas para prevenir el impacto del fenómeno de El Niño. La periodista tipeó la información a una base de datos, la analizó y detectó múltiples irregularidades en los pagos totales por S/ 100 millones. Si ese funcionario no le hubiera entregado la información, probablemente la reportera no hubiera realizado la investigación, ya que entonces no existía una ley que obligara a las instituciones públicas a brindar datos que hayan sido creados por ellas o estén en su posesión.

 

Una normativa como aquella recién se concretó con la publicación de la Ley de Transparencia y Acceso a la Información Pública (Ministerio de Justicia y Derechos Humanos, 2021). Después de 2003 empezaron a publicarse algunas investigaciones que tenían un componente alto de análisis de datos. Hidalgo y Torres (2016) comentan que, en 2008, los periodistas de IDL-Reporteros, Gustavo Gorriti y Romina Mella, descubrieron que en las comisarías de Lima los reportes de delitos contenían la misma información en distintas jurisdicciones; dos años después, en 2010, la periodista Milagros Salazar, también de IDL-Reporteros, reveló errores en el sistema de auditoría que permitieron que no se paguen cerca de USD 100 millones en impuestos dentro de la industria pesquera de anchoveta.

 

Si bien se pueden enumerar trabajos puntuales en los que se aplicó la metodología del periodismo de datos o parte de ella, es recién en 2014 que se puede hablar de una disciplina en sí con la fundación de los medios nativos digitales Ojo Público y CONVOCA. Ambos, a través de sus portales web, han indicado que ejercen el periodismo de datos y que sus equipos están conformados por profesionales de múltiples disciplinas. Ojo Público se constituyó luego de la desintegración de la Unidad de Investigación de El Comercio, donde laboraban los periodistas Óscar Castilla, Nelly Luna y Fabiola Torres. A ellos se sumó el reportero David Hidalgo, quien anteriormente había trabajado en aquel diario (Quevedo, 2019).

 

Los cuatro periodistas establecieron alianzas con tecnólogos para lanzar el medio en 2014 con su primera investigación llamada Cuentas Juradas, una radiografía al patrimonio de los candidatos a las alcaldías de Lima Metropolitana, y que estaba inspirada en el proyecto Declaraciones Juradas Abiertas de La Nación Data de Argentina. Por su parte, CONVOCA fue fundada en registros públicos el 2015, pero también empezó sus actividades el 2014 bajo la dirección de la periodista Milagros Salazar. La primera publicación de este último medio fue Swiss Leaks, en alianza con el Consorcio Internacional de Periodistas de Investigación, que reveló evasión fiscal tras obtener datos de «las cuentas de s de 100 mil clientes de la sede suiza del banco HSBC» (CONVOCA, 2015).

 

En sus inicios, tanto Ojo Público como CONVOCA realizaron convocatorias a estudiantes de periodismo para que colaboraran en el procesamiento de información de proyectos de largo aliento y organizaron hackatones para conocer profesionales del mundo tecnológico. Ambos medios han sido reconocidos internacionalmente por sus investigaciones, ya sea de manera independiente o en alianza con otras organizaciones. Asimismo, han obtenido el máximo galardón del periodismo de datos: los Data Journalism Awards en varias ediciones. Conforme han pasado los años, medios como IDL-Reporteros también han publicado historias basadas en el análisis de datos, que han formado parte de grandes investigaciones como los Pandora Papers o los Panama Papers.

 

A este ecosistema de periodismo de datos en los medios nativos digitales se han sumado los medios tradicionales El Comercio y La República con sus unidades de periodismo de datos. La unidad de El Comercio Data fue incorporada en enero de 2020 con la finalidad de «producir contenidos originales y veraces para las diversas secciones del diario», bajo la dirección del periodista Martín Hidalgo (La importancia de la Unidad de Periodismo de Datos en El Comercio, 2021). No obstante, la propuesta de crear una unidad fue planteada el 2017, pero no fue hasta tres años después que se concretó la idea. Una de las características de este equipo es la construcción de bases de datos propias sobre temáticas que no han sido abordadas, principalmente de corte político. La República Data, en tanto, fue lanzada en febrero de 2021 para cubrir, estadísticamente y con historias, la evolución de la COVID-19 en todo el país, así como otros temas de interés social (La República lanza su portal y unidad LR Data, 2021). Cuenta con un equipo periodístico joven liderado por Milagros Requena.

 

Con relación a los medios tradicionales, es importante recordar que en RPP Noticias existió una unidad de periodismo de datos, llamada RPP Data, que fue fundada en octubre de 2016; no obstante, «la falta de rentabilidad hizo que el proyecto fuera desactivado a finales de 2018» (Barrenechea, 2021, p. 15). Desde octubre de 2021 se viene empleando nuevamente la marca RPP Data, pero no como lo que era hace años, sino como un espacio conformado por dos periodistas que se encargan de elaborar informes especiales; es decir, a profundidad, pero no necesariamente con datos masivos, que son transmitidos en la multiplataforma del medio: radio, televisión e Internet. Este pequeño equipo está liderado por su editor Diego Pajares, quien también tiene la coordinación de otra sección (comunicación personal, 26 de agosto, 2022).

 

Con el desarrollo del periodismo de datos ha emergido un nuevo perfil profesional que se encuentra en constante evolución (López et al., 2016): el periodista de datos o también llamado periodista especializado en el análisis de datos. Sin embargo, son pocos los trabajos académicos que han indagado en este perfil, principalmente en países hispanohablantes (Arias y Carvajal, 2022). Estos nuevos profesionales tienen que contar con las competencias tecnológicas necesarias para encontrar noticias en un contexto de datos masivos (Esteban, 2012; Flores y López, 2020), así como otros conocimientos requeridos en cada una de las fases de trabajo del periodismo de datos, y sin dejar de lado las técnicas propias del periodismo de investigación.

 

En el contexto peruano la información detallada en este tópico es escasa. Frente a este panorama el presente estudio brinda una aproximación al perfil profesional del periodista especializado en el análisis de datos. Se toma para el análisis los equipos de trabajo de Ojo Público, CONVOCA, El Comercio Data y La República Data; los dos primeros por ser los pioneros en el periodismo de datos peruano dentro del ecosistema digital; mientras que los dos últimos, por ser unidades dentro de los medios tradicionales. Además, El Comercio y La República se encuentran en el top de las dieciséis marcas s leídas en el país, tanto en sus versiones impresas como digitales (Newman et al., 2022). Por último, no se consideró incluir a RPP Data debido a que, actualmente, no es considerada una unidad de periodismo de datos dentro de un medio tradicional.

 

 

Metodología

 

Para resolver las preguntas de investigación del presente estudio resultó conveniente la aplicación de una metodología mixta (cualitativa y cuantitativa), mediante las técnicas de la entrevista y la encuesta, respectivamente. El estudio, además de descriptivo, es de carácter exploratorio debido a que profundiza un tema poco desarrollado en Perú. Con las entrevistas, a los representantes de las cuatro salas de redacción especializadas en el análisis de datos, se establece cómo se encuentran estructurados los equipos periodísticos y quiénes los integran. La información recabada de Martín Hidalgo, jefe de El Comercio Data (el 27 de julio de 2022); Milagros Requena, coordinadora de La República Data (el 1 de agosto de 2022); David Hidalgo, director periodístico de Ojo Público (el 11 de agosto de 2022) y Milagros Salazar, directora de CONVOCA (el 18 de agosto de 2022) permite definir que son 37 los periodistas que laboran de manera permanente en los cuatro medios que forman parte de esta investigación.

 

En primer lugar, la entrevista tiene una estructura compuesta por seis ítems o consultas para que los jefes de cada equipo definan al periodismo de datos, señalen qué aspectos profesionales o capacidades consideran al momento de sumar un nuevo periodista a sus equipos, cómo es el flujo de trabajo que siguen, qué herramientas tecnológicas son las s empleadas en sus rutinas laborales y cuáles con los principales retos para el desarrollo de sus actividades periodísticas. El procedimiento consistió en llamadas telefónicas que fueron grabadas para luego transcribir las respuestas. A los cuatro participantes se les indicó que la información recopilada solamente sería usada como parte de un informe académico en el contexto de la maestría en Comunicaciones de la Universidad Nacional Mayor de San Marcos.

 

En segundo lugar, para ahondar en el perfil de los profesionales especializados en el análisis de datos, se aplicó una encuesta a los periodistas de los cuatro medios participantes de este estudio. Esta técnica, de acuerdo a Sánchez (2019, p. 104), «utiliza el instrumento de medición llamado cuestionario que está conformado por preguntas abiertas o cerradas que deben ser completadas por el encuestado».

 

El cuestionario que se aplicó en este estudio fue el mismo para todos. Tiene dos secciones: la primera parte consta de ocho preguntas vinculadas a los aspectos sociodemográficos para «conocer los rasgos s destacados» de los profesionales (Barja, 2016, p. 151) respecto a formación académica y datos personales como correo electrónico y nombres completos (en caso se requiera contactarlos a futuro), género, rango de edad, carrera y universidad o instituto donde estudiaron, medios en el que laboran y cargos que desempeñan; la segunda parte incluye siete interrogantes con la finalidad de describir en qué momento del proceso metodológico del periodismo de datos intervienen los profesionales, qué métodos, herramientas tecnológicas y programas emplean, los niveles de habilidad que manejan y de qué manera adquirieron esos conocimientos; ya sea en la formación superior, en cursos de especialización o de manera autodidacta. Para ello, se tomó como referencia las siete fases del periodismo de datos teorizadas por Bradshaw (2011) y Flores y Salinas (2013): compilación, limpieza, contextualización, combinación, análisis, verificación y comunicación de datos; así como las descripciones que hacen de cada una de ellas y en las que se requiere aplicar ciertos conocimientos que ya se desarrollaron inicialmente. Para establecer los niveles de habilidad se empleó el modelo Dreyfus que detalla cinco capacidades: novato, principiante avanzado, competente, eficiente y experto (Escobar y Jara, 2019).

 

Componen la población todos los profesionales de las salas de redacción de Ojo Público, CONVOCA, El Comercio Data y La República Data; mientras que, componen la muestra, todos aquellos que laboran en la cobertura diaria y de manera permanente, que en total son 37 periodistas, a quienes se les aplicó el cuestionario, entre el 27 de julio y el 27 de agosto de 2022, a través de Google Forms; previamente, se les contactó por cinco canales de comunicación: correo electrónico, Facebook, Twitter, Instagram o WhatsApp. A todas las personas que no contestaron el cuestionario hasta el 18 de agosto se les hizo una reiteración antes de cerrarlo. Finalmente, respondió el 84% de la muestra (31 periodistas).

 

 

Resultados

 

Con relación a las unidades de periodismo de datos de los medios tradicionales, El Comercio Data está conformado por seis periodistas. Además, hay un equipo integrado por un programador y dos científicos de datos que colaboran con ellos en adición a sus funciones dentro del diario. Ellos, principalmente, ayudan a scrapear y limpiar bases de datos si estas contienen grandes volúmenes de información que luego serán analizadas por los periodistas. Estos últimos profesionales, además, se encargan de elaborar sus propias visualizaciones para las notas que se publican de manera online; sin embargo, cuando la publicación se realiza en el diario impreso, intervienen los diseñadores para crear las infografías, quienes también trabajan para toda la redacción de El Comercio.

 

Esta figura se replica parcialmente en La República Data, debido a que los diseñadores también trabajan para toda la redacción de La República y realizan las infografías que se presentan en la versión impresa. Ocasionalmente, también colaboran con la unidad de datos cuando se publica un especial web y se requiere un diseño particular, el que será implementado por las dos programadoras que, a diferencia de El Comercio Data, trabajan a tiempo completo en La República Data. Ellas forman parte del flujo de trabajo para elaborar las visualizaciones interactivas que requieren las tres periodistas que actualmente trabajan allí. Una de las programadoras también cumple las funciones de reportera debido a su experiencia profesional como redactora en otros medios.

 

A diferencia de este escenario, en los medios nativos digitales Ojo Público y CONVOCA no existe, como apoyo o parte del equipo diario de trabajo, un grupo de programadores que colabore con las notas periodísticas que se elaboran a corto plazo. Todas las funciones que se requieren, como la obtención, limpieza, análisis o visualización de datos, son asumidas por los periodistas. Los tecnólogos son contratados para los proyectos de mediano y largo plazo de acuerdo al perfil que se necesite, como Frontend, que trabaja en la apariencia de un sitio web; Backend, que maneja las bases de datos; o Full stack, que tiene ambos conocimientos. De acuerdo a los entrevistados de ambos medios, esto también sucede porque sus reporteros están en la capacidad de asumir el flujo metodológico del periodismo de datos que para otras redacciones puede requirir de ayuda s técnica, sobre todo en fases como la limpieza y el análisis de datos.

 

De los 31 periodistas que respondieron el cuestionario, la mayoría labora en Ojo Público (39%) y CONVOCA (26%), según se aprecia en la Figura 1, y son de género femenino (71%). Predominan aquellos que siguieron estudios en universidades o institutos privados (65%), principalmente en la Pontificia Universidad Católica del Perú (26%) y las universidades Jaime Bausate y Meza, Peruana de Ciencias Aplicadas y San Martín de Porres (10% en cada una); mientras que en el ámbito público (35%), la mayoría se instruyó en la Universidad Nacional Mayor de San Marcos (19%) y en la Universidad Nacional de San Agustín de Arequipa (6%). Con relación a la formación profesional, el 77% estudió periodismo, comunicaciones, ciencias de la comunicación o carreras afines; y el resto, otras carreras profesionales como derecho, literatura, ciencia política o economía.



 

Respecto a las edades de los periodistas que forman parte de las salas de redacción especializadas en el anális de datos, el 55% tiene entre 26 y 33 años de edad, según se muestra en la Figura 2, y de ellos el 12% tiene un cargo de mayor responsabilidad, como el de jefe o editor dentro del equipo. El segundo rango de edad que predomina es el de 18 a 25 años con 32%, un grupo en donde solo el 10% ejecuta un cargo de liderazgo en un medio tradicional. Los dos grupos restantes están conformados por periodistas de 34 a 41 años y de 42 a 49 años, con 6% en cada caso. Este último conjunto lo integran los editores y directores de los medios nativos digitales.


 

 

Los entrevistados aseguran que para incorporar a un periodista en sus equipos de trabajo evaluaron el grado de experiencia en alguna de las líneas de investigación que trabajan las redacciones de los medios que son parte de este estudio, además de su habilidad en el manejo de herramientas tecnológicas para el procesamiento y análisis de datos; sin embargo, no lo consideran como un requisito, es decir, no necesariamente el periodista debe ser experto en estas herramientas y puede ir adquiriendo mayor experiencia durante su labor periodística. Todos los entrevistados señalan que la principal herramienta que utilizan para la limpieza y análisis de datos es Excel; pero hay otras que cada reportero maneja según el nivel de conocimiento que tenga y la fase metodológica del periodismo de datos que esté desarrollando.

 

Resulta importante acotar que, si bien en Ojo Público y CONVOCA no existe una unidad de periodismo de datos como sí ocurre en El Comercio Data y La República Data, también emplean la metodología del periodismo de datos de manera transversal para sus investigaciones. Todos los entrevistados concluyen que esta disciplina periodística consiste en el trabajo con bases de datos, como una fuente importante de información, pero solo el 25% menciona que estos datos deben ser masivos. El flujo de trabajo es el mismo para todos, pero con variaciones en los tiempos: después de la propuesta de tema, el periodista elabora su nota, solo o con ayuda de los programadores en la limpieza o análisis de datos, y esta pasa por un proceso de edición a cargo de los editores, jefes o coordinadores, dependiendo el caso, y luego se publica en los portales web. En los medios tradicionales, el texto es revisado nuevamente por los correctores de estilo antes de ser publicado, junto a las infografías que elaboran los diseñadores tomando como base la información proporcionada por el reportero.

 

Respecto a la participación de los periodistas en el proceso metodologógico del periodismo de datos, entre el 6% y 19% no participa en alguna de las fases, como se aprecia en la Figura 3; mientras que solo el 3% no realiza ninguna, debido a que su función solo es exclusiva a la edición de textos en un medio nativo digital. A diferencia de ese caso, en los dos medios tradicionales, los jefes y coordinadores que cumplen la función de editores de textos, también se involucran en todo el proceso metodológico debido a que son autores de varias de las notas que se han publicado.

 

Por otro lado, más de la mitad de los encuestados se formó en la mayoría de herramientas tecnológicas y programas que emplea en cada fase de trabajo de manera autodidacta, sobre todo en las etapas de contextualización (61%), combinación (65%) y visualización de datos (61%). En tanto, el porcentaje referido al aprendizaje mediante cursos de especialización es s alto en la limpieza (23%) y verificación de datos (23%). Los conocimientos adquiridos en la formación superior universitaria o técnica se centran en la fase de recopilación de datos con un 32% y luego en el análisis de datos con un 19%.


 



Entre los métodos empleados para recopilar información, el 32% presenta solicitudes de acceso a la información pública con un nivel de habilidad eficiente y el 29%, con un nivel de experto tal como se observa en la Figura 4. Al desagregar los datos por medios, se observa que el 35% de los periodistas que labora en Ojo Público y CONVOCA maneja un nivel de habilidad capaz y experto para presentar estas solicitudes; mientras que en El Comercio Data y La República Data los porcentajes se reducen a 27% y 18%, respectivamente. Ante la negativa de las entidades de la administración pública de entregar información por medio de la Ley de Transparencia y Acceso a la Información Pública, solo el 6% está en la capacidad de presentar recursos de apelación y ninguno un hábeas data con un nivel de habilidad experto, según se aprecia en la Figura 5. También se observa que, a partir del nivel de habilidad competente, disminuyen las habilidades de los periodistas para insistir en la obtención de datos conforme pasan del trámite administrativo (recurso de apelación) al judicial (hábeas data).


 

 

Los otros métodos usados para obtener datos son búsquedas en portales web donde la mayoría de periodistas tienen un nivel de habilidad experto (42%), de acuerdo a la Figura 4; construcciones propias de base de datos con un nivel eficiente (42%), filtraciones de información con habilidades competentes (35%) y, por último, el scraping donde principalmente las habilidades son de novato y competente con un 26% en cada caso. En el 75% de las salas de redacción analizadas para este estudio, según las entrevistas efectuadas, otra fuente de información son las aplicaciones interactivas que han publicado anteriormente cada medio o unidad de periodismo de datos como Funes (Ojo Público), Deep Data (CONVOCA) y el Observatorio Congresal (El Comercio Data).


 

 

En la siguiente fase de trabajo, que es la limpieza de datos, el 97% de los periodistas emplea Excel; el 87%, Google Sheets; el 77%, Tabula; y el 74% utiliza Open Refine y Trifacta, como se aprecia en la Figura 6. Ninguno emplea otra herramienta tecnológica. Predominan el nivel de habilidad novato en el uso de Tabula, Open Refine y Trifacta con 32%, 35% y 52%, respectivamente; mientras que en el caso de Excel se aprecia s un nivel de manejo eficiente (35%) y en Google Sheets, principiante avanzado y competente (29% en cada caso). Los periodistas encuestados especificaron usar otras alternativas, como el lenguaje de programación Python con un nivel básico (3%) y experto (3%); y la aplicación de RStudio con un nivel también básico (3%) y experto (3%). Al efectuar el análisis por salas de redacción, solo el 5% de los reporteros de los medios nativos digitales no emplea Excel y el 20%, Google Sheet. En los medios tradicionales, solo el 9% no usa Open Refine, Tabula ni Trifacta.



 

Respecto a la fase de trabajo de contextualización de datos, luego de que los periodistas acceden a las bases de datos, el 19% no revisa ningún dato vinculado a ellas que permite comprender mejor la información. En este sentido, el 32% revisa los significados de los términos técnicos; el 35%, la fecha de recolección de los datos y los motivos por los que se hizo; el 61%, quién fue el responsable de recolectar la información; y el 74% verifica qué metodología se empleó para construir la base de datos a la que accedió. En la fase de combinación de datos, de acuerdo a las entrevistas realizadas a los responsables de cada sala de redacción, los periodistas relacionan las bases de datos a las que acceden para encontrar historias u otros datos reveladores.

 

    Al momento de analizar los datos, la mayoría de periodistas usa Excel (90%) y Google Sheets (87%), principalmente con un nivel de habilidad competente y eficiente tal como se indica en la Figura 7. Sin embargo, la cantidad de periodistas que emplea aplicativos web o lenguajes de programación para el análisis de la información disminuye. El 68% usa Open Refine, pero la mayoría (35%) lo hace con un nivel de habilidad de novato. Un 65% emplea RStudio, aunque en este caso el nivel novato se incrementa a 48%. En tanto, s de la mitad de periodistas emplea SQL Server (68%), Python (68%) y SPSS (61%), con un nivel de habilidad de novato en 58%, 55% y 39%, respectivamente. Ninguno de los encuestados informó emplear otras herramientas para esta fase de trabajo.


Al analizar las respuestas por salas de redacción, se aprecia que en los medios tradicionales los niveles de habilidad de novato son mayores en el uso de SQL Server (73%), Python (73%) y SPSS (55%), comparado con los nativos digitales donde es de 50%, 45% y 30%, respectivamente.


 

 

La verificación de datos también es parte del trabajo, pero se realiza durante todo el proceso periodístico, con mucho s énfasis en aquella información que va a ser difundida mediante los diferentes productos periodísticos que se elaboren. La verificación de datos, de acuerdo a los entrevistados, también incluye los descargos que se tienen que efectuar a los personajes mencionados en los reportajes que tienen un enfoque de denuncia y que se observa mayormente en los medios nativos digitales.

 

La séptima fase del proceso metodológico del periodismo de datos es la comunicación de la información: El 94% de los encuestados participa en la creación de visualizaciones interactivas, empleando diferentes herramientas, aplicativos o lenguajes de programación, como se observa en la Figura 8. Las herramientas más empleadas son Datawrapper (84%) e Infogram (81%) con un nivel de habilidad eficiente de 35% y 29%, respectivamente. Continúan Tableau Public (61%), HTML (61%), Python (58%), Power BI (55%) y Google Fusion Tables (52%); sin embargo, en todas estas predomina el nivel de habilidad de novato, sobre todo en el caso de Python (42%), Power BI (32%) y Google Fusion Tables (32%).


  

 

Además, el 26% de los periodistas encuestados usa otras alternativas para visualizar datos: el 10% emplea Flourish con un nivel de novato y otro 10% con un nivel de experto, un 3% usa Flourish y Timeline, con un nivel de experto en ambos casos; mientras que otro 3% crea visualizaciones con ayudas de librerías virtuales que requieren saber el lenguaje de programación JavaScript, que en este caso se maneja con un nivel de novato.

 

Finalmente, con relación a los retos que actualmente tienen estas salas de redacción para sus labores diarias, los entrevistados de los medios nativos digitales señalaron que se requiere potenciar el perfil profesional de los periodistas especializados para la creación de contenido en diferentes formatos que tengan mayor impacto y con un alto componente investigativo. En las unidades de periodismo de datos de los medios tradicionales se destacó la falta de conocimiento para manejar con niveles de habilidad s altos las herramientas tecnológicas que se requieren en cada fase de trabajo y también, como retos, apostar por proyectos periodísticos que se puedan elaborar a largo plazo y que sirvan como insumos de bases datos para ellos.

 

Discusión

 

Las salas de redacción siguen las siete fases metodológicas del periodismo de datos para la elaboración de productos periodísticos: recopilación, limpieza, contextualización, combinación, análisis, verificación y comunicación de los datos, de acuerdo a lo establecido por Bradshaw (2011) y Flores y Salinas (2013). Incorporan en su trabajo a profesionales de diversos rubros, como periodistas y programadores, con un enfoque multidisciplinario (De Limas, 2022; Ferreras, 2013; Spagnuolo, 2019).

 

En este proceso, los medios nativos digitales solamente participan en proyectos que demandan meses en ser ejecutados y en los que se manejan mayores cantidades de datos. Lo que no sucede en las unidades de periodismo de datos de los medios tradicionales, que sí cuentan con programadores y científicos de datos para su cobertura diaria.

 

Si bien, con el pasar de los años, se han ido creando equipos periodísticos especializados en el análisis de datos en Perú, lo que supone que deben existir profesionales que estén capacitados para la ejecución de las actividades que demanda el periodismo de datos, se observa que los periodistas que actualmente trabajan en esta disciplina han adquirido la mayoría de sus conocimientos de manera autodidacta. Ello evidencia la necesidad de actualizar los contenidos académicos que se imparten en las universidades o institutos tecnológicos que ofrecen carreras profesionales de periodismo, comunicación o carreras afines, con la finalidad de impartir conocimientos acordes a la exigencia del mercado laboral.

 

Es indispensable que la enseñanza del periodismo de datos no solo se centre en el uso de herramientas tecnológicas o lenguajes de programación, sino también en la correcta aplicación de la Ley de Transparencia y Acceso a la Información pública, que resulta una a importante para acceder a datos masivos y que permite la consolidación de esta disciplina periodística (Córdoba y García, 2021; Cortés et al., 2018; Flores y Salinas, 2013; Magallón, 2013). La normativa no solo está enfocada en cómo elaborar solicitudes de acceso a la información pública y a qué instituciones pedirlas sino, también, en que procedimientos seguir ante la falta de respuestas o entregas incompletas de información por parte de las entidades públicas. A pesar de que estos recursos son un plus para acceder a información, y que en varios medios de comunicación han permitido grandes destapes periodísticos, casi la tercera parte de los periodistas encuestados no los emplea.


Conclusiones

 

Los periodistas de datos adquirieron los conocimientos de la mayoría de métodos, herramientas tecnológicas y programas que emplean en cada fase de trabajo de manera autodidacta. Esto evidencia la falta de especialización en periodismo de datos en la formación superior a nivel nacional, sobre todo con aquellos conocimientos que les permitan a estos profesionales limpiar, contextualizar y combinar los datos, considerando además que el 6%, 10% y 19%, respectivamente, de los periodistas no participan en esas fases de trabajo.

 

Con relación a los métodos que emplean los periodistas para acceder a bases de datos, la mayoría lo hace por medio de peticiones de acceso a la información pública. Y, si bien estos profesionales tienen, principalmente, las habilidades de competente, eficiente y experto en la elaboración de estas solicitudes, la cantidad de periodistas que sabe cómo realizar recursos de apelación y hábeas data disminuye al igual que sus niveles de habilidad. El 6% realiza recursos de apelación con un nivel de habilidad de experto, pero ninguno tiene ese nivel para presentar un hábeas data. En este último trámite se observa que destacan aquellos con un nivel de habilidad de novato y aquellos que no participan de ello con 29% en cada caso.

 

Las herramientas tecnológicas s usadas por los periodistas, tanto en los medios nativos digitales como tradicionales, para la limpieza y el análisis de datos son Excel y Google Sheets con niveles de habilidad competente y eficiente en su mayoría. En menor medida emplean Open Refine, pero con un nivel de habilidad de novato. En la fase de análisis de datos también se observa que los periodistas emplean lenguajes de programación, como Python, o herramientas que requieren de ellos, como RStudio y SQL Server, pero con un nivel de habilidad de novato que es mucho mayor en las unidades de periodismo de datos de los medios tradicionales.

 

Acerca de las herramientas que emplean los periodistas para la creación de visualizaciones interactivas, predominan Datawrapper e Infogram con el nivel de habilidad eficiente. También usan Google Fusion Tables, HTML, Power BI, Python y Tableau Public, pero de manera esporádica, principalmente en las unidades de periodismo de datos de los medios tracionales. Los periodistas manejan algunos lenguajes de programación con el nivel de habilidad de novato para la visualización de datos, de ahí que sea importante que estos equipos estén constituidos por profesionales multidisciplinarios que potencien el trabajo en esas fases.

 

No existe una gran diferencia en los niveles de habilidades para usar las herramientas tecnológicas en las diferentes fases del periodismo de datos, entre los medios tradicionales y nativos digitales. Sin embargo, sí hay un aspecto en común: conforme se necesitan mayores conocimientos para aplicar herramientas o programas más complejos, que requieren de otros tipos de conocimientos, son menos los periodistas que están capacitados para usarlos y, si lo hacen, es con un nivel de habilidad de novato.

 

Se recomienda, desde la academia, realizar s investigaciones sobre el ecosistema del periodismo de datos en Perú con el objetivo de conocer cómo evolucionan estos perfiles profesionales y, de acuerdo a las exigencias laborales, saber qué conocimientos deben ser actualizados en la formación superior.

 

Conflicto de intereses

La autora no presenta conflicto de intereses en la investigación.

 

Responsabilidad ética y/o legal

Las personas encuestadas y entrevistadas se les informo que los datos recopilados serían usados en la elaboración de la presente investigación.

 

Contribución de autoría

La autora realizo la elaboración, aplicación, interpretación y discusión de la investigación.

 

Financiamiento

La investigación se realizó con recursos propios de la autora.

 

Agradecimiento

Un agradecimiento al doctor Jesús Flores Vivar y al magíster Carlos Gonzales García por la motivación en el desarrollo de esta investigación y por los conocimientos brindados durante las clases de la Maestría de Comunicaciones de la Universidad Nacional Mayor de San Marcos.



Referencias

 

Arias, F. y Carvajal, M. (2022). Periodistas de datos. Análisis del perfil sociodemográfico del profesional en España y Latinoamérica. Estudios sobre el Mensaje Periodístico, 28(1), 13-24. https://doi.org/10.5209/esmp.76395

 

Barja, L. (2016). El perfil del nuevo periodista digital peruano en los procesos de convergencia de plataformas. Casos El Comercio, RPP Noticias y Epensa [Tesis de licenciatura, Universidad Nacional Mayor de San Marcos]. https://hdl.handle.net/20.500.12672/4830

 

Barrenechea, M. (2021). La evolución e innovación del lenguaje digital RPP.pe. Avances hacia su multimedialidad, interactividad e hipertextualidad [Tesis de licenciatura, Universidad Nacional Mayor de San Marcos]. https://hdl.handle.net/20.500.12672/17336

 

Bradshaw, P. (2011, 8 de julio). The inverted pyramid of data journalism. Online Journalism.  https://onlinejournalismblog.com/2011/07/08/theinvertedpyramidofdatajournalisminspanish/

 

Bueno, A. (2014). Periodismo de Datos. Antecedentes, ámbitos de desarrollo y aplicación en medios generalistas: el caso de El Confidencial y El Periódico [Trabajo de fin de grado, Universidad de Valladolid]. http://uvadoc.uva.es/handle/10324/5752

 

CONVOCA. (2015, 18 de agosto). Especial de la premiada serie investigativa «SwissLeaks». https://convoca.pe/agendapropia/especialdelapremiadaserieinvestigativa-swissleaks

 

Córdoba, A. y García, M. (2021). Evaluación de la transparencia en el periodismo de datos de referencia. Estudio de las historias publicadas entre 2018 y 2019. Icono 14, 19(2), 364-387. https://doi.org/10.7195/ri14.v19i2.1648

 

Cortés, H., Luengo, M. y Elías, C. (2018). Periodismo de datos y transparencia al margen de los grandes medios: un estudio comparativo de Civio y Propública. Icono 14, 16(2), 66-87. https://doi.org/10.7195/ri14.v16i2.1177

 

Crucianelli, S. (2013). ¿Qué es el periodismo de datos? Cuadernos de periodistas, 26, 106-124. http://www.cuadernosdeperiodistas.com/pdf/Cuadernos_de_Periodistas_26.pdf

 

De Limas, M. (2022). ProPublicas Data Journalism: How Multidisciplinary Teams and Hybrid Profiles Create Impactful Data Stories. Media and Communication, 10(1), 5-15.  https://doi.org/10.17645/mac.v10i1.4433

 

Engebretsen, M., Kennedy, H. y Weber, W. (2018). Data visualization in Scandinavian newsrooms: emerging trends in journalistic visualization practices. Nordicom Review, 39(2), 1-16. https://doi.org/10.21256/zhaw-3505

 

Escobar, B. y Jara, P. (2019). Filosofía de Patricia Benner, aplicación en la formación de enfermería: propuestas de estrategias de aprendizaje. Educación, 28(54), 182-202. https://doi.org/10.18800/educacion.201901.009

 

Esteban, Ch. (2012). Las nuevas profesiones del periodismo. Cuadernos Evoca, 7, 17-23. http://www.evocaimagen.com/cuadernos/cuadernos7.pdf

 

Fallas, H. (2014). Entrevista con una base de datos. En F. Perry y M. Paz, Manual de Periodismo de Datos Iberoamericano. http://manual.periodismodedatos.org/hasselfallas.php

 

Ferreras, E. (2013). Aproximación teórica al perfil profesional del periodista de datos. Icono 14, 11(2), 115-140. https://doi.org/10.7195/ri14.v11i2.573

 

Ferreras, E. (2016). El periodismo de datos en España. Estudios sobre el mensaje periodístico. 22(1), 255-272. https://doi.org/10.5209/rev_ESMP.2016.v22.n1.52594

 

Flores, J. (2018). Algoritmos, aplicaciones y big data, nuevos paradigmas en el proceso de comunicación y de enseñanza-aprendizaje del periodismo de datos. Revista de Comunicación, 17(2), 268–291. https://revistadecomunicacion.com/article/view/964

 

Flores, J. y López, P. (2020). Radiografía del periodismo de datos en las facultades de Comunicación españolas: Innovando los estudios de grado en Periodismo. Anàlisi: Quaderns de Comunicació i Cultura, 62, 77-92. https://doi.org/10.5565/rev/analisi.3273

 

Flores, J. y Salinas, C. (2013). El periodismo de datos como especialización de las organizaciones de noticias en Internet. Correspondencias & Análisis, 3, 15-34. http://www.correspondenciasyanalisis.com/pdf/v3/cnt/1_periodismo_datos.pdf

 

Hidalgo, D. y Torres, F. (2016). La navaja suiza del reportero. Consejo de la Prensa Peruana.

 

Ivars, B. (2019). La infografía periodística en España: definición y tipología de uso. Estudios sobre el Mensaje Periodístico, 25(1), 283-302. https://doi.org/10.5209/ESMP.63729

 

La importancia de la Unidad de Periodismo de Datos en El Comercio. (2021, 18 de agosto). El Comercio. https://elcomercio.pe/desdelaredaccion/laimportanciadelaunidaddeperiodismodedatosenelcomercionoticia/

 

La República lanza su portal y unidad LR Data. (2021, 19 de agosto). La República https://larepublica.pe/sociedad/2021/08/19/la-republica-lanza-su-portal-y-unidad-lr-data/

 

Loosen, W. (2018). Four forms of datafied journalism. Journalisms response to the datafication of society. Communicative Figurations, 18. https://www.kofi.unibremen.de/fileadmin/user_upload/Arbeitspapiere/CoFi_EWP_No18_Loosen.pdf

 

López, P. (2019). La enseñanza-aprendizaje del periodismo de datos en las facultades españolas: estudios y propuestas de viabilidad [Tesis doctoral, Universidad Complutense de Madrid]. https://eprints.ucm.es/id/eprint/50688/ 

 

López, X., Toural, C. y Rodríguez, A. (2016). Software, estadística y gestión de bases de datos en el perfil del periodista de datos. Profesional de la información, 25(2), 286-294. https://doi.org/10.3145/epi.2016.mar.16

 

Magallón, R. (2013, 30 de setiembre). ¿Por qué es importante una buena ley de transparencia para el periodismo y para los periodistas? Instituto para la Innovación Periodística. http://www.academia.edu/5251182/_Por_qu%C3%A9_es_importante_una_buena_ley_de_transparencia_para_el_periodismo_y_para_los_periodistas_

 

Meyer, P. (2002). Precision journalism. A reporters introduction to social science methods (4th ed.). Rowman & Littlefield Publishers, INC.

 

Michiels, E. (2017). El periodismo de datos como herramienta para generar noticias e investigaciones [Tesis de licenciatura, Universidad Abierta Interamericana]. http://imgbiblio.vaneduc.edu.ar/fulltext/files/TC123792.pd

 

Ministerio de Justicia y Derechos Humanos. (2021). Compendio de transparencia, acceso a la información pública y protección de datos personales: normativa y criterios interpretativos relevantes. https://www.gob.pe/institucion/minjus/informespublicaciones/2518666compendiodetransparenciaaccesoalainformacionpublicayprotecciondedatospersonalesnormativaycriteriosinterpretativos-relevantes

 

Ministerio de Justicia y Derechos Humanos. (2022). Informe anual sobre solicitudes de acceso a la información pública 2021. https://www.gob.pe/institucion/minjus/informespublicaciones/2987539informeanual2021sobrepedidosdeaccesoalainformacionalasentidadespublicas

 

Newman, N., Fletcher, R., Robertson, C. T., Eddy, K. y Nielsen, R. (2022). Digital News Report 2022. Reuters Institute. https://reutersinstitute.politics.ox.ac.uk/sites/default/files/202206/DigitalNewsReport2022.pdf

 

Oliveira, A. y Angeluci, A. (2019). Competences and Skills in Data Journalism: Perceptions on the Profile of Brazilian Professionals. Brazilian Journalism Research, 15(2), 381-399. https://doi.org/10.25200/BJR.v15n2.2019.1141

 

Quevedo, G. (2019). Las entidades filantrópicas que subsidian investigaciones periodísticas y la incidencia de sus ejes temáticos en la agenda setting de los medios digitales alternativos: caso Ojo Público [Tesis de licenciatura, Pontificia Universidad Católica del Perú]. http://hdl.handle.net/20.500.12404/14509

 

Renó, L. (2018). Manual de periodismo de datos (1. edición). Ria Editorial. http://www.riaeditorial.com/index.php/manual-de-jornalismo-de-dados/

 

Saavedra, M., Herrero, M. y Castillo, E. (2020). La formación en periodismo en España: radiografía de la oferta académica universitaria. Anàlisi: Quaderns de Comunicació i Cultura, 62, 93-109. https://doi.org/10.5565/rev/analisi.3283

 

Sánchez, F. (2019). Tesis. Desarrollo metodológico de la investigación. Ediciones Normas Jurídicas.

 

Spagnuolo, S. (2019, 4 de diciembre). Cómo organizar un equipo de periodismo de datos. Red Internacional de Periodistas. https://ijnet.org/es/story/c%C3%B3moorganizarun- equipo-de-periodismo-de-datos