El
perfil profesional del periodista de datos en Perú: Casos Ojo Público, CONVOCA, El Comercio Data y La República Data
The
professional profile of the data journalist in Peru: Case studies of Ojo
Público, CONVOCA,
El Comercio Data and La República Data
Recibido: 07/09/2022
Aceptado: 30/11/2022
Publicado: 28/12/2022
Rocío
Lizbetty Romero Benites
https://orcid.org/0000-0003-2935-1974
Universidad
Nacional Mayor de San Marcos, Perú
Doi: https://doi.org/10.24265/cian.2022.n16.06
Romero Benites, R. (2022). El perfil profesional del
periodista de datos en Perú: Casos Ojo Público, Convoca, El Comercio Data y La
República Data.
Correspondencias & Análisis,
(16), 129-152. Recuperado a partir de http://ojs.correspondenciasyanalisis.com/index.php/Journalcya/article/view/420
Esta investigación
describe el perfil profesional de los periodistas que laboran en las salas de
redacción pioneras en el análisis de datos en Perú: Ojo Público y CONVOCA,
como medios nativos digitales; El
Comercio Data y La República Data,
como parte de los medios tradicionales. Adoptando un enfoque mixto se
entrevista a los jefes, coordinadores o directores, y se aplican cuestionarios
a los periodistas de dichos medios. Los resultados muestran que los periodistas
siguen la metodología del periodismo de datos consistente en siete fases de
trabajo: recopilar, limpiar, contextualizar, combinar, analizar, verificar y
comunicar los datos; además, emplean herramientas tecnológicas en cada una de
ellas con un nivel de habilidad que, principalmente, no es de experto. Se
destaca, adicionalmente, que la mayoría de sus conocimientos lo adquirieron de
manera autodidacta, evidenciando así una falta de especialización del periodismo
de datos en la formación superior peruana.
Palabras clave:
periodista de datos, periodismo de datos, herramientas tecnológicas, medios de
comunicación, datos masivos, perfil profesional.
This research describes the
professional profile of journalists working in newsrooms pioneering data
analysis in Peru: Ojo Público and CONVOCA as digital native media, and El Comercio Data and La República Data, as part of
traditional media. To achieve this objective, and through a mixed approach, the
chiefs, coordinators or directors are interviewed, and
questionnaires are applied to the journalists of these media. The results show
that journalists follow the methodology of data journalism, consisting of seven
work phases: collecting, cleaning, contextualizing, combining, analyzing, verifying and communicating data; in addition, they use
technological tools in each of them with a level of skill that, mainly, is not
that of an expert. It should also be noted that most of their knowledge was
acquired in a self-taught manner, thus showing a lack of specialization in data
journalism in Peruvian higher education.
Keywords:
data journalist, data journalism,
technological tools, mass media, big data, professional profile.
El periodismo de
datos es una disciplina (Arias y Carvajal, 2022; Bueno, 2014; López, 2019) que
surge como consecuencia del desarrollo de las tecnologías de la información y
la comunicación, y del uso de datos masivos. Existen diversas vías para acceder
a grandes volúmenes de información, como las filtraciones, búsquedas avanzadas
en Internet o el scraping, una técnica que permite
descargar información de la web de manera sistematizada; sin embargo, son las
leyes de acceso a la información pública las que permiten su consolidación
(Córdoba y García, 2021; Cortés et al., 2018; Flores y Salinas, 2013; Magallón,
2013). En ese sentido, resulta importante que los periodistas no solo sepan
cómo realizar peticiones de acceso a la información pública en los países en
los que se cuente con una normativa que permita ello, como es el caso peruano,
sino que también estén en la capacidad de presentar recursos de apelación, en
la vía administrativa, o hábeas data en la vía judicial, ante la negativa de
las instituciones de la administración pública de brindar información.
Las salas de
redacción que desarrollan el periodismo de datos se caracterizan por tener un
equipo de trabajo multidisciplinario (De Limas, 2022; Ferreras, 2013; Spagnuolo, 2019) que, además de periodistas, incluye a
programadores, ingenieros, diseñadores, entre otros perfiles profesionales que
varían de acuerdo a las necesidades de los medios de
comunicación. Siguen una metodología de trabajo que empieza con la obtención de
datos masivos, y tras varios procesos, culmina con la publicación de ellos por
medio de distintos productos periodísticos, como textos, aplicaciones de
noticias, visualizaciones interactivas, entre otros.
Esta disciplina
periodística permite encontrar «relaciones entre esos datos que a menudo son
imperceptibles a simple vista y que solo pueden ser comprendidas mediante su
análisis con herramientas» (Michiels, 2017, p. 12);
la finalidad es publicar historias de impacto. También, promueve la difusión de
información pública con la que interactúa el usuario si esta se encuentra en
archivos descargables o en aplicaciones de noticias. En este escenario de
evolución del periodismo de datos, se han publicado diversos estudios que
describen el perfil profesional del periodista especializado en el análisis de
datos y cómo ha sido su formación universitaria; sin embargo, estos estudios
están enfocados en países como España o Estados Unidos, dejando de lado el
ámbito peruano, pese a que actualmente existe un ecosistema variado de medios y
unidades dentro de las organizaciones periodísticas que abiertamente practican
el periodismo de datos, como son Ojo
Público, CONVOCA, El Comercio Data y La República Data.
En este contexto,
¿cuál es el perfil profesional de los periodistas que laboran en salas de
redacción especializadas en el análisis de datos en Perú? Para responder esta
interrogante, primero, es necesario comprender lo siguiente: (1) ¿cómo están
estructuradas sus redacciones y qué flujo de trabajo siguen?, (2) ¿qué
herramientas tecnológicas, métodos o programas emplean en sus rutinas laborales
y qué niveles de conocimiento tienen? Además, es preciso contrastar si los
periodistas adquirieron los conocimientos que aplican en su trabajo durante su
formación superior o de otra manera. El perfil profesional también incluye
aspectos sociodemográficos de cada individuo.
El periodismo de
precisión y el periodismo asistido por computadoras anteceden al periodismo de
datos. La primera disciplina, de acuerdo con Meyer (2002), se caracteriza por
aplicar métodos de investigación social y psicosocial que no habían sido
empleados en la profesión periodística, con la finalidad de buscar estadísticas
oficiales, bases de datos públicas o privadas y otras fuentes que alimenten las
investigaciones. En tanto, al periodismo asistido por computadoras se le
considera como la evolución del periodismo de precisión en donde se utilizan
equipos tecnológicos y herramientas, como las hojas de cálculo para procesar la
data. A diferencia de estas dos disciplinas mencionadas, en el periodismo de
datos se requiere el uso masivo de información (Crucianelli,
2013; Loosen, 2018; López et al., 2016), el trabajo
con equipos multidisciplinarios (Ferreras, 2016; Oliveira y Angeluci,
2019) y la creación de visualizaciones estáticas o interactivas (Engebretsen et al., 2018; Ivars,
2019). El empleo de lenguajes de programación y herramientas estadísticas
(Flores, 2018; Saavedra et al., 2020) también es parte de esta disciplina
periodística que se encuentra en constante evolución.
El trabajo
metodológico del periodismo de datos incluye siete fases de trabajo:
compilación, limpieza, contextualización, combinación, análisis, verificación y
comunicación de los datos (Bradshaw, 2011; Flores y Salinas, 2013) y en cada
una de ellas se requiere aplicar ciertos conocimientos, como el «uso de
herramientas tecnológicas y recursos disponibles en la red, de lenguajes de
codificación y programación de algoritmos, de técnicas de procesamiento de
datos masivos (macrodatos) y de conocimientos avanzados de la ciencia
computacional (informática)» (Flores y López, 2020, p. 81).
La etapa de
compilación de información, por ejemplo, se puede lograr por medio de
filtraciones y descargas de datos de los portales web públicos y privados, pero
el camino más utilizado son las solicitudes de acceso a la información pública.
En el caso peruano está vigente desde el 2003 la Ley de Transparencia y Acceso
a la Información Pública, Ley Nº 27806, que permite a
la ciudadanía acceder a información construida o en poder de las instituciones
de la administración pública. Al manejar esta ley, resulta importante que los
periodistas sepan cómo apelar una respuesta negativa de información o, incluso,
armar un hábeas data si el caso se disputa en la vía legal, debido a que aún
las entidades públicas cometen errores en el marco de entrega de información:
lo hacen fuera del plazo legal de diez días hábiles, a menos de que indiquen
previamente una prórroga, la brindan de manera parcial o incluso no responden a
la solicitud (Ministerio de Justicia y Derechos Humanos, 2022).
La limpieza de
información consiste en la eliminación de los errores humanos y en estructurar
una base de datos de la mejor manera posible para que esta sea entendida y
utilizada por las demás personas. En esta fase de trabajo, usualmente se
utilizan programas como Google Sheets, Data Wrangler,
Open Refine (Renó, 2018), Excel, Google Sheets, Tabula o Trifacta y
aquellos profesionales con mayor conocimiento tecnológico emplean lenguajes de
programación como C++ o R. Luego continúan la contextualización y combinación
de las bases de datos. El primer caso se refiere a comprender todos los
aspectos relacionados a la información que se posee; es decir, por qué se
construyó, quién lo hizo, entender cada uno de los términos técnicos, entre
otros aspectos (Fallas, 2014); mientras que el segundo caso consiste en
relacionar entre sí las bases de datos que se poseen con la finalidad de
encontrar mejores historias periodísticas.
Después de estas
actividades sigue el análisis de los datos, que se puede realizar también con
Open Refine, Excel y Google Sheets, lenguajes de
programación como PHP, R, Python o SQL, y programas estadísticos como SPSS,
entre otros. Principalmente son los tecnólogos, aquellos profesionales con
conocimientos e n tecnología, quienes poseen estas últimas habilidades. La
verificación, en cambio, se refiere a validar los datos mediante entrevistas a
las personas involucradas y a su revisión para detectar debilidades (Hidalgo y
Torres, 2016); mientras que la comunicación es la manera como se transmite la
información. Sobre este último aspecto existe una variedad de productos
periodísticos como los artículos basados en datos, visualizaciones
interactivas, conjunto de datos abiertos o aplicaciones de noticias (Crucianelli, 2013), pero la selección de ellos dependerá
del material que se disponga y los objetivos de comunicar que establezcan las
salas de redacción. En la visualización de datos se suelen emplear programas en
sus versiones gratuitas o de paga; así se tiene a Infogram,
Datawrapper, Flourish, Tableau o Power BI, y también
lenguajes de programación como Python o
JavaScript.
El periodismo de
datos en Perú tiene sus antecedentes en una investigación que realizó en 1997
la periodista Liz Mineo para el diario El
Comercio (Hidalgo y Torres, 2016). Un funcionario del Instituto Nacional de
Defensa Civil le brindó 80 páginas de información con nombres de las obras y empresas
contratadas para prevenir el impacto del fenómeno de El Niño. La periodista
tipeó la información a una base de datos, la analizó y detectó múltiples
irregularidades en los pagos totales por S/ 100 millones. Si ese funcionario no
le hubiera entregado la información, probablemente la reportera no hubiera
realizado la investigación, ya que entonces no existía una ley que obligara a
las instituciones públicas a brindar datos que hayan sido creados por ellas o
estén en su posesión.
Una normativa como
aquella recién se concretó con la publicación de la Ley de Transparencia y
Acceso a la Información Pública (Ministerio de Justicia y Derechos Humanos,
2021). Después de 2003 empezaron a publicarse algunas investigaciones que
tenían un componente alto de análisis de datos. Hidalgo y Torres (2016)
comentan que, en 2008, los periodistas de IDL-Reporteros,
Gustavo Gorriti y Romina Mella, descubrieron que en las comisarías de Lima los
reportes de delitos contenían la misma información en distintas jurisdicciones;
dos años después, en 2010, la periodista Milagros Salazar, también de IDL-Reporteros, reveló errores en el
sistema de auditoría que permitieron que no se paguen cerca de USD 100 millones
en impuestos dentro de la industria pesquera de anchoveta.
Si bien se pueden
enumerar trabajos puntuales en los que se aplicó la metodología del periodismo
de datos o parte de ella, es recién en 2014 que se puede hablar de una
disciplina en sí con la fundación de los medios nativos digitales Ojo Público y CONVOCA. Ambos, a través de sus portales web, han indicado que
ejercen el periodismo de datos y que sus equipos están conformados por
profesionales de múltiples disciplinas. Ojo
Público se constituyó luego de la desintegración de la Unidad de
Investigación de El Comercio, donde
laboraban los periodistas Óscar Castilla, Nelly Luna y Fabiola Torres. A ellos
se sumó el reportero David Hidalgo, quien anteriormente había trabajado en
aquel diario (Quevedo, 2019).
Los cuatro
periodistas establecieron alianzas con tecnólogos para lanzar el medio en 2014
con su primera investigación llamada Cuentas Juradas, una radiografía al
patrimonio de los candidatos a las alcaldías de Lima Metropolitana, y que
estaba inspirada en el proyecto Declaraciones Juradas Abiertas de La Nación Data de Argentina. Por su
parte, CONVOCA fue fundada en
registros públicos el 2015, pero también empezó sus actividades el 2014 bajo la
dirección de la periodista Milagros Salazar. La primera publicación de este
último medio fue Swiss Leaks, en alianza con el Consorcio
Internacional de Periodistas de Investigación, que reveló evasión fiscal tras
obtener datos de «las cuentas de más de 100 mil clientes de la sede suiza del
banco HSBC» (CONVOCA, 2015).
En sus inicios,
tanto Ojo Público como CONVOCA realizaron convocatorias a
estudiantes de periodismo para que colaboraran en el procesamiento de
información de proyectos de largo aliento y organizaron hackatones para conocer profesionales del mundo tecnológico. Ambos medios han
sido reconocidos internacionalmente por sus investigaciones, ya sea de manera
independiente o en alianza con otras organizaciones. Asimismo, han obtenido el
máximo galardón del periodismo de datos: los Data Journalism
Awards en varias ediciones. Conforme han pasado los
años, medios como IDL-Reporteros también
han publicado historias basadas en el análisis de datos, que han formado parte
de grandes investigaciones como los Pandora
Papers
o los Panama Papers.
A este ecosistema
de periodismo de datos en los medios nativos digitales se han sumado los medios
tradicionales El Comercio y La República con sus unidades de
periodismo de datos. La unidad de El
Comercio Data fue incorporada en enero de 2020 con la finalidad de
«producir contenidos originales y veraces para las diversas secciones del diario»,
bajo la dirección del periodista Martín Hidalgo (La importancia de la Unidad de
Periodismo de Datos en El Comercio, 2021). No obstante, la propuesta de crear
una unidad fue planteada el 2017, pero no fue hasta tres años después que se
concretó la idea. Una de las características de este equipo es la construcción
de bases de datos propias sobre temáticas que no han sido abordadas,
principalmente de corte político. La
República Data, en tanto, fue lanzada en febrero de 2021 para cubrir,
estadísticamente y con historias, la evolución de la COVID-19 en todo el país,
así como otros temas de interés social (La República lanza su portal y unidad
LR Data, 2021). Cuenta con un equipo periodístico joven liderado por Milagros
Requena.
Con relación a los
medios tradicionales, es importante recordar que en RPP Noticias existió una unidad de periodismo de datos, llamada RPP Data, que fue fundada en octubre de
2016; no obstante, «la falta de rentabilidad hizo que el proyecto fuera
desactivado a finales de 2018» (Barrenechea, 2021, p. 15). Desde octubre de
2021 se viene empleando nuevamente la marca RPP
Data, pero no como lo que era hace años, sino como un espacio conformado
por dos periodistas que se encargan de elaborar informes especiales; es decir,
a profundidad, pero no necesariamente con datos masivos, que son transmitidos
en la multiplataforma del medio: radio, televisión e Internet. Este pequeño
equipo está liderado por su editor Diego Pajares, quien también tiene la
coordinación de otra sección (comunicación personal, 26 de agosto, 2022).
Con el desarrollo
del periodismo de datos ha emergido un nuevo perfil profesional que se
encuentra en constante evolución (López et al., 2016): el periodista de datos o
también llamado periodista especializado en el análisis de datos. Sin embargo,
son pocos los trabajos académicos que han indagado en este perfil,
principalmente en países hispanohablantes (Arias y Carvajal, 2022). Estos
nuevos profesionales tienen que contar con las competencias tecnológicas
necesarias para encontrar noticias en un contexto de datos masivos (Esteban,
2012; Flores y López, 2020), así como otros conocimientos requeridos en cada
una de las fases de trabajo del periodismo de datos, y sin dejar de lado las
técnicas propias del periodismo de investigación.
En el contexto
peruano la información detallada en este tópico es escasa. Frente a este
panorama el presente estudio brinda una aproximación al perfil profesional del
periodista especializado en el análisis de datos. Se toma para el análisis los
equipos de trabajo de Ojo Público, CONVOCA, El Comercio Data y La
República Data; los dos primeros por ser los pioneros en el periodismo de
datos peruano dentro del ecosistema digital; mientras que los dos últimos, por
ser unidades dentro de los medios tradicionales. Además, El Comercio y La República se
encuentran en el top de las dieciséis marcas más leídas en el país, tanto en
sus versiones impresas como digitales (Newman et al., 2022). Por último, no se
consideró incluir a RPP Data debido a
que, actualmente, no es considerada una unidad de periodismo de datos dentro de
un medio tradicional.
Para resolver las
preguntas de investigación del presente estudio resultó conveniente la
aplicación de una metodología mixta (cualitativa y cuantitativa), mediante las
técnicas de la entrevista y la encuesta, respectivamente. El estudio, además de
descriptivo, es de carácter exploratorio debido a que profundiza un tema poco
desarrollado en Perú. Con las entrevistas, a los representantes de las cuatro salas
de redacción especializadas en el análisis de datos, se establece cómo se
encuentran estructurados los equipos periodísticos y quiénes los integran. La
información recabada de Martín Hidalgo, jefe de El Comercio Data (el 27 de julio de 2022); Milagros Requena,
coordinadora de La República Data (el
1 de agosto de 2022); David Hidalgo, director periodístico de Ojo Público (el 11 de agosto de 2022) y
Milagros Salazar, directora de CONVOCA (el
18 de agosto de 2022) permite definir que son 37 los periodistas que laboran de
manera permanente en los cuatro medios que forman parte de esta investigación.
En primer lugar,
la entrevista tiene una estructura compuesta por seis ítems o consultas para
que los jefes de cada equipo definan al periodismo de datos, señalen qué
aspectos profesionales o capacidades consideran al momento de sumar un nuevo
periodista a sus equipos, cómo es el flujo de trabajo que siguen, qué
herramientas tecnológicas son las más empleadas en sus rutinas laborales y
cuáles con los principales retos para el desarrollo de sus actividades
periodísticas. El procedimiento consistió en llamadas telefónicas que fueron
grabadas para luego transcribir las respuestas. A los cuatro participantes se
les indicó que la información recopilada solamente sería usada como parte de un
informe académico en el contexto de la maestría en Comunicaciones de la
Universidad Nacional Mayor de San Marcos.
En
segundo lugar, para ahondar en el perfil de los profesionales especializados en
el análisis de datos, se aplicó una encuesta a los periodistas de los cuatro
medios participantes de este estudio. Esta técnica, de
acuerdo a Sánchez (2019, p. 104), «utiliza el instrumento de medición
llamado cuestionario que está conformado por preguntas abiertas o cerradas que
deben ser completadas por el encuestado».
El cuestionario
que se aplicó en este estudio fue el mismo para todos. Tiene dos secciones: la
primera parte consta de ocho preguntas vinculadas a los aspectos
sociodemográficos para «conocer los rasgos más destacados» de los profesionales
(Barja, 2016, p. 151) respecto a formación académica y datos personales como
correo electrónico y nombres completos (en caso se requiera contactarlos a
futuro), género, rango de edad, carrera y universidad o instituto donde
estudiaron, medios en el que laboran y cargos que desempeñan; la segunda parte
incluye siete interrogantes con la finalidad de describir en qué momento del
proceso metodológico del periodismo de datos intervienen los profesionales, qué
métodos, herramientas tecnológicas y programas emplean, los niveles de
habilidad que manejan y de qué manera adquirieron esos conocimientos; ya sea en
la formación superior, en cursos de especialización o de manera autodidacta.
Para ello, se tomó como referencia las siete fases del periodismo de datos
teorizadas por Bradshaw (2011) y Flores y Salinas (2013): compilación,
limpieza, contextualización, combinación, análisis, verificación y comunicación
de datos; así como las descripciones que hacen de cada una de ellas y en las
que se requiere aplicar ciertos conocimientos que ya se desarrollaron
inicialmente. Para establecer los niveles de habilidad se empleó el modelo
Dreyfus que detalla cinco capacidades: novato, principiante avanzado,
competente, eficiente y experto (Escobar y Jara, 2019).
Componen la
población todos los profesionales de las salas de redacción de Ojo Público, CONVOCA, El Comercio Data y
La República Data; mientras que,
componen la muestra, todos aquellos que laboran en la cobertura diaria y de
manera permanente, que en total son 37 periodistas, a quienes se les aplicó el
cuestionario, entre el 27 de julio y el 27 de agosto de 2022, a través de
Google Forms; previamente, se les contactó por cinco
canales de comunicación: correo electrónico, Facebook, Twitter, Instagram o WhatsApp.
A todas las personas que no contestaron el cuestionario hasta el 18 de agosto
se les hizo una reiteración antes de cerrarlo. Finalmente, respondió el 84% de
la muestra (31 periodistas).
Con relación a las
unidades de periodismo de datos de los medios tradicionales, El Comercio Data está conformado por
seis periodistas. Además, hay un equipo integrado por un programador y dos
científicos de datos que colaboran con ellos en adición a sus funciones dentro
del diario. Ellos, principalmente, ayudan a scrapear y limpiar bases de datos si estas contienen grandes volúmenes de
información que luego serán analizadas por los periodistas. Estos últimos
profesionales, además, se encargan de elaborar sus propias visualizaciones para
las notas que se publican de manera online; sin embargo, cuando la publicación
se realiza en el diario impreso, intervienen los diseñadores para crear las
infografías, quienes también trabajan para toda la redacción de El Comercio.
Esta figura se
replica parcialmente en La República Data,
debido a que los diseñadores también trabajan para toda la redacción de La República y realizan las infografías
que se presentan en la versión impresa. Ocasionalmente, también colaboran con
la unidad de datos cuando se publica un especial web y se requiere un diseño
particular, el que será implementado por las dos programadoras que, a
diferencia de El Comercio Data,
trabajan a tiempo completo en La
República Data. Ellas forman parte del flujo de trabajo para elaborar las
visualizaciones interactivas que requieren las tres periodistas que actualmente
trabajan allí. Una de las programadoras también cumple las funciones de
reportera debido a su experiencia profesional como redactora en otros medios.
A diferencia de
este escenario, en los medios nativos digitales Ojo Público y CONVOCA no
existe, como apoyo o parte del equipo diario de trabajo, un grupo de
programadores que colabore con las notas periodísticas que se elaboran a corto
plazo. Todas las funciones que se requieren, como la obtención, limpieza,
análisis o visualización de datos, son asumidas por los periodistas. Los
tecnólogos son contratados para los proyectos de mediano y largo plazo de acuerdo al perfil que se necesite, como Frontend, que trabaja en la apariencia de un sitio web; Backend, que maneja las bases de datos; o Full stack, que tiene ambos conocimientos. De
acuerdo a los entrevistados de ambos medios, esto también sucede porque
sus reporteros están en la capacidad de asumir el flujo metodológico del
periodismo de datos que para otras redacciones puede requirir
de ayuda más técnica, sobre todo en fases como la limpieza y el análisis de
datos.
De
los 31 periodistas que respondieron el cuestionario, la mayoría labora en Ojo Público (39%) y CONVOCA (26%), según se aprecia en la Figura 1, y son de género
femenino (71%). Predominan aquellos que siguieron estudios en universidades o
institutos privados (65%), principalmente en la Pontificia Universidad Católica
del Perú (26%) y las universidades Jaime Bausate y Meza, Peruana de Ciencias
Aplicadas y San Martín de Porres (10% en cada una); mientras que en el ámbito
público (35%), la mayoría se instruyó en la Universidad Nacional Mayor de San
Marcos (19%) y en la Universidad Nacional de San Agustín de Arequipa (6%). Con
relación a la formación profesional, el 77% estudió periodismo, comunicaciones,
ciencias de la comunicación o carreras afines; y el resto, otras carreras
profesionales como derecho, literatura, ciencia política o economía.
Respecto a las
edades de los periodistas que forman parte de las salas de redacción
especializadas en el anális de datos, el 55% tiene
entre 26 y 33 años de edad, según se muestra en la
Figura 2, y de ellos el 12% tiene un cargo de mayor responsabilidad, como el de
jefe o editor dentro del equipo. El segundo rango de edad que predomina es el
de 18 a 25 años con 32%, un grupo en donde solo el 10% ejecuta un cargo de
liderazgo en un medio tradicional. Los dos grupos restantes están conformados
por periodistas de 34 a 41 años y de 42 a 49 años, con 6% en cada caso. Este
último conjunto lo integran los editores y directores de los medios nativos
digitales.
Los entrevistados
aseguran que para incorporar a un periodista en sus equipos de trabajo
evaluaron el grado de experiencia en alguna de las líneas de investigación que
trabajan las redacciones de los medios que son parte de este estudio, además de
su habilidad en el manejo de herramientas tecnológicas para el procesamiento y
análisis de datos; sin embargo, no lo consideran como un requisito, es decir,
no necesariamente el periodista debe ser experto en estas herramientas y puede
ir adquiriendo mayor experiencia durante su labor periodística. Todos los
entrevistados señalan que la principal herramienta que utilizan para la
limpieza y análisis de datos es Excel; pero hay otras que cada reportero maneja
según el nivel de conocimiento que tenga y la fase metodológica del periodismo
de datos que esté desarrollando.
Resulta importante
acotar que, si bien en Ojo Público y CONVOCA no existe una unidad de
periodismo de datos como sí ocurre en El
Comercio Data y La República Data,
también emplean la metodología del periodismo de datos de manera transversal
para sus investigaciones. Todos los entrevistados concluyen que esta disciplina
periodística consiste en el trabajo con bases de datos, como una fuente
importante de información, pero solo el 25% menciona que estos datos deben ser
masivos. El flujo de trabajo es el mismo para todos, pero con variaciones en
los tiempos: después de la propuesta de tema, el periodista elabora su nota,
solo o con ayuda de los programadores en la limpieza o análisis de datos, y
esta pasa por un proceso de edición a cargo de los editores, jefes o
coordinadores, dependiendo el caso, y luego se publica en los portales web. En
los medios tradicionales, el texto es revisado nuevamente por los correctores
de estilo antes de ser publicado, junto a las infografías que elaboran los
diseñadores tomando como base la información proporcionada por el reportero.
Respecto a la
participación de los periodistas en el proceso metodologógico
del periodismo de datos, entre el 6% y 19% no participa en alguna de las fases,
como se aprecia en la Figura 3; mientras que solo el 3% no realiza ninguna,
debido a que su función solo es exclusiva a la edición de textos en un medio
nativo digital. A diferencia de ese caso, en los dos medios tradicionales, los
jefes y coordinadores que cumplen la función de editores de textos, también se
involucran en todo el proceso metodológico debido a que son autores de varias
de las notas que se han publicado.
Por otro lado, más
de la mitad de los encuestados se formó en la mayoría de las herramientas
tecnológicas y programas que emplea en cada fase de trabajo de manera
autodidacta, sobre todo en las etapas de contextualización (61%), combinación
(65%) y visualización de datos (61%). En tanto, el porcentaje referido al
aprendizaje mediante cursos de especialización es más alto en la limpieza (23%)
y verificación de datos (23%). Los conocimientos adquiridos en la formación
superior universitaria o técnica se centran en la fase de recopilación de datos
con un 32% y luego en el análisis de datos con un 19%.
Entre los métodos
empleados para recopilar información, el 32% presenta solicitudes de acceso a
la información pública con un nivel de habilidad eficiente y el 29%, con un
nivel de experto tal como se observa en la Figura 4. Al desagregar los datos
por medios, se observa que el 35% de los periodistas que labora en Ojo Público y CONVOCA maneja un nivel de habilidad capaz y experto para presentar
estas solicitudes; mientras que en El
Comercio Data y La República Data los
porcentajes se reducen a 27% y 18%, respectivamente. Ante la negativa de las
entidades de la administración pública de entregar información por medio de la
Ley de Transparencia y Acceso a la Información Pública, solo el 6% está en la
capacidad de presentar recursos de apelación y ninguno un hábeas data con un
nivel de habilidad experto, según se aprecia en la Figura 5. También se observa
que, a partir del nivel de habilidad competente, disminuyen las habilidades de
los periodistas para insistir en la obtención de datos conforme pasan del
trámite administrativo (recurso de apelación) al judicial (hábeas data).
Los otros métodos
usados para obtener datos son búsquedas en portales web donde la mayoría de los
periodistas tienen un nivel de habilidad experto (42%), de
acuerdo a la Figura 4; construcciones propias de base de datos con un
nivel eficiente (42%), filtraciones de información con habilidades competentes
(35%) y, por último, el scraping donde principalmente
las habilidades son de novato y competente con un 26% en cada caso. En el 75%
de las salas de redacción analizadas para este estudio, según las entrevistas
efectuadas, otra fuente de información son las aplicaciones interactivas que
han publicado anteriormente cada medio o unidad de periodismo de datos como
Funes (Ojo Público), Deep Data (CONVOCA) y el Observatorio Congresal (El Comercio Data).
En la siguiente
fase de trabajo, que es la limpieza de datos, el 97% de los periodistas emplea
Excel; el 87%, Google Sheets; el 77%, Tabula; y el
74% utiliza Open Refine y Trifacta, como se aprecia
en la Figura 6. Ninguno emplea otra herramienta tecnológica. Predominan el
nivel de habilidad novato en el uso de Tabula, Open Refine y Trifacta con 32%, 35% y 52%, respectivamente; mientras que
en el caso de Excel se aprecia más un nivel de manejo eficiente (35%) y en
Google Sheets, principiante avanzado y competente
(29% en cada caso). Los periodistas encuestados especificaron usar otras
alternativas, como el lenguaje de programación Python con un nivel básico (3%)
y experto (3%); y la aplicación de RStudio con un
nivel también básico (3%) y experto (3%). Al efectuar el análisis por salas de
redacción, solo el 5% de los reporteros de los medios nativos digitales no
emplea Excel y el 20%, Google Sheet. En los medios
tradicionales, solo el 9% no usa Open Refine, Tabula ni Trifacta.
Respecto a la fase
de trabajo de contextualización de datos, luego de que los periodistas acceden
a las bases de datos, el 19% no revisa ningún dato vinculado a ellas que permite
comprender mejor la información. En este sentido, el 32% revisa los
significados de los términos técnicos; el 35%, la fecha de recolección de los
datos y los motivos por los que se hizo; el 61%, quién fue el responsable de
recolectar la información; y el 74% verifica qué metodología se empleó para
construir la base de datos a la que accedió. En la fase de combinación de
datos, de acuerdo a las entrevistas realizadas a los
responsables de cada sala de redacción, los periodistas relacionan las bases de
datos a las que acceden para encontrar historias u otros datos reveladores.
Al momento de analizar los
datos, la mayoría de los periodistas usa Excel (90%) y Google Sheets (87%), principalmente con un nivel de habilidad
competente y eficiente tal como se indica en la Figura 7. Sin embargo, la
cantidad de periodistas que emplea aplicativos web o lenguajes de programación
para el análisis de la información disminuye. El 68% usa Open Refine, pero la
mayoría (35%) lo hace con un nivel de habilidad de novato.
Un 65% emplea RStudio, aunque en este caso el
nivel novato se incrementa a 48%. En tanto, más de la mitad de periodistas
emplea SQL Server (68%), Python (68%) y SPSS (61%), con un nivel de habilidad
de novato en 58%, 55% y 39%, respectivamente. Ninguno de los encuestados
informó emplear otras herramientas para esta fase de trabajo.
Al analizar las
respuestas por salas de redacción, se aprecia que en los medios tradicionales
los niveles de habilidad de novato son mayores en el uso de SQL Server (73%),
Python (73%) y SPSS (55%), comparado con los nativos digitales donde es de 50%,
45% y 30%, respectivamente.
La verificación de
datos también es parte del trabajo, pero se realiza durante todo el proceso
periodístico, con mucho más énfasis en aquella información que va a ser
difundida mediante los diferentes productos periodísticos que se elaboren. L a
verificación de datos, de acuerdo a los entrevistados,
también incluye los descargos que se tienen que efectuar a los personajes mencionados
en los reportajes que tienen un enfoque de denuncia y que se observa mayormente
en los medios nativos digitales.
La séptima fase
del proceso metodológico del periodismo de datos es la comunicación de la
información: El 94% de los encuestados participa en la creación de
visualizaciones interactivas, empleando diferentes herramientas, aplicativos o
lenguajes de programación, como se observa en la Figura 8. Las herramientas más
empleadas son Datawrapper (84%) e Infogram
(81%) con un nivel de habilidad eficiente de 35% y 29%, respectivamente.
Continúan Tableau Public
(61%), HTML (61%), Python (58%), Power BI (55%) y
Google Fusion Tables (52%); sin embargo, en todas
estas predomina el nivel de habilidad de novato, sobre todo en el caso de
Python (42%), Power BI (32%) y Google Fusion Tables (32%).
Además, el 26% de
los periodistas encuestados usa otras alternativas para visualizar datos: el
10% emplea Flourish con un nivel de novato y otro 10%
con un nivel de experto, un 3% usa Flourish y
Timeline, con un nivel de experto en ambos casos; mientras que otro 3% crea
visualizaciones con ayudas de librerías virtuales que requieren saber el
lenguaje de programación JavaScript, que en este caso se maneja con un nivel de
novato.
Finalmente, con
relación a los retos que actualmente tienen estas salas de redacción para sus
labores diarias, los entrevistados de los medios nativos digitales señalaron
que se requiere potenciar el perfil profesional de los periodistas
especializados para la creación de contenido en diferentes formatos que tengan
mayor impacto y con un alto componente investigativo. En las unidades de
periodismo de datos de los medios tradicionales se destacó la falta de
conocimiento para manejar con niveles de habilidad más altos las herramientas
tecnológicas que se requieren en cada fase de trabajo y también, como retos,
apostar por proyectos periodísticos que se puedan elaborar a largo plazo y que
sirvan como insumos de bases datos para ellos.
Las salas de
redacción siguen las siete fases metodológicas del periodismo de datos para la
elaboración de productos periodísticos: recopilación, limpieza,
contextualización, combinación, análisis, verificación y comunicación de los
datos, de acuerdo a lo establecido por Bradshaw (2011)
y Flores y Salinas (2013). Incorporan en su trabajo a profesionales de diversos
rubros, como periodistas y programadores, con un enfoque multidisciplinario (De
Limas, 2022; Ferreras, 2013; Spagnuolo, 2019).
En este proceso,
los medios nativos digitales solamente participan en proyectos que demandan
meses en ser ejecutados y en los que se manejan mayores cantidades de datos. Lo
que no sucede en las unidades de periodismo de datos de los medios
tradicionales, que sí cuentan con programadores y científicos de datos para su
cobertura diaria.
Si bien, con el
pasar de los años, se han ido creando equipos periodísticos especializados en
el análisis de datos en Perú, lo que supone que deben existir profesionales que
estén capacitados para la ejecución de las actividades que demanda el
periodismo de datos, se observa que los periodistas que actualmente trabajan en
esta disciplina han adquirido la mayoría de sus conocimientos de manera
autodidacta. Ello evidencia la necesidad de actualizar los contenidos
académicos que se imparten en las universidades o institutos tecnológicos que
ofrecen carreras profesionales d e periodismo,
comunicación o carreras afines, con la finalidad de impartir conocimientos
acordes a la exigencia del mercado laboral.
Es indispensable
que la enseñanza del periodismo de datos no solo se centre en el uso de
herramientas tecnológicas o lenguajes de programación, sino también en la
correcta aplicación de la Ley de Transparencia y Acceso a la Información
pública, que resulta una vía importante para acceder a datos masivos y que
permite la consolidación de esta disciplina periodística (Córdoba y García,
2021; Cortés et al., 2018; Flores y Salinas, 2013; Magallón, 2013). La
normativa no solo está enfocada en cómo elaborar solicitudes de acceso a la
información pública y a qué instituciones pedirlas sino, también, en que
procedimientos seguir ante la falta de respuestas o entregas incompletas de
información por parte de las entidades públicas. A pesar de que estos recursos
son un plus para acceder a
información, y que en varios medios de comunicación han permitido grandes
destapes periodísticos, casi la tercera parte de los periodistas encuestados no
los emplea.
Los periodistas de datos adquirieron los conocimientos de la mayoría de métodos, herramientas tecnológicas y programas que emplean
en cada fase de trabajo de manera autodidacta. Esto evidencia la falta de
especialización en periodismo de datos en la formación superior a nivel nacional,
sobre todo con aquellos conocimientos que les permitan a estos profesionales
limpiar, contextualizar y combinar los datos, considerando además que el 6%,
10% y 19%, respectivamente, de los periodistas no participan en esas fases de
trabajo.
Con relación a los
métodos que emplean los periodistas para acceder a bases de datos, la mayoría
lo hace por medio de peticiones de acceso a la información pública. Y, si bien
estos profesionales tienen, principalmente, las habilidades de competente,
eficiente y experto en la elaboración de estas solicitudes, la cantidad de
periodistas que sabe cómo realizar recursos de apelación y hábeas data
disminuye al igual que sus niveles de habilidad. El 6% realiza recursos de
apelación con un nivel de habilidad de experto, pero ninguno tiene ese nivel
para presentar un hábeas data. En este último trámite se observa que destacan
aquellos con un nivel de habilidad de novato y aquellos que no participan de
ello con 29% en cada caso.
Las herramientas
tecnológicas más usadas por los periodistas, tanto en los medios nativos
digitales como tradicionales, para la limpieza y el análisis de datos son Excel
y Google Sheets con niveles de habilidad competente y
eficiente en su mayoría. En menor medida emplean Open Refine, pero con un nivel
de habilidad de novato. En la fase de análisis de datos también se observa que
los periodistas emplean lenguajes de programación, como Python, o herramientas
que requieren de ellos, como RStudio y SQL Server,
pero con un nivel de habilidad de novato que es mucho mayor en las unidades de
periodismo de datos de los medios tradicionales.
Acerca de las
herramientas que emplean los periodistas para la creación de visualizaciones
interactivas, predominan Datawrapper e Infogram con el nivel de habilidad eficiente. También usan
Google Fusion Tables, HTML, Power
BI, Python y Tableau Public,
pero de manera esporádica, principalmente en las unidades de periodismo de
datos de los medios tracionales. Los periodistas
manejan algunos lenguajes de programación con el nivel de habilidad de novato
para la visualización de datos, de ahí que sea importante que estos equipos
estén constituidos por profesionales multidisciplinarios que potencien el
trabajo en esas fases.
No existe una gran
diferencia en los niveles de habilidades para usar las herramientas
tecnológicas en las diferentes fases del periodismo de datos, entre los medios
tradicionales y nativos digitales. Sin embargo, sí hay un aspecto en común:
conforme se necesitan mayores conocimientos para aplicar herramientas o
programas más complejos, que requieren de otros tipos de conocimientos, son
menos los periodistas que están capacitados para usarlos y, si lo hacen, es con
un nivel de habilidad de novato.
Se recomienda,
desde la academia, realizar más investigaciones sobre el ecosistema del
periodismo de datos en Perú con el objetivo de conocer cómo evolucionan estos
perfiles profesionales y, de acuerdo a las exigencias
laborales, saber qué conocimientos deben ser actualizados en la formación
superior.
Conflicto de
intereses
La
autora no presenta conflicto de intereses en la investigación.
Responsabilidad ética y/o legal
Las
personas encuestadas y entrevistadas se les informo que los datos recopilados
serían usados en la elaboración de la presente investigación.
Contribución
de autoría
La
autora realizo la elaboración, aplicación, interpretación y discusión de la
investigación.
Financiamiento
La
investigación se realizó con recursos propios de la autora.
Un agradecimiento
al doctor Jesús Flores Vivar y al magíster Carlos Gonzales García por la
motivación en el desarrollo de esta investigación y por los conocimientos
brindados durante las clases de la Maestría de Comunicaciones de la Universidad
Nacional Mayor de San Marcos.
Arias, F. y Carvajal, M. (2022). Periodistas de datos. Análisis del
perfil sociodemográfico del profesional en España y Latinoamérica. Estudios
sobre el Mensaje Periodístico, 28(1), 13-24. https://doi.org/10.5209/esmp.76395
Barja, L. (2016). El perfil del nuevo periodista digital peruano en
los procesos de convergencia de plataformas. Casos El Comercio, RPP Noticias y
Epensa [Tesis de licenciatura, Universidad Nacional Mayor de San
Marcos]. https://hdl.handle.net/20.500.12672/4830
Barrenechea, M. (2021). La evolución e innovación del lenguaje
digital RPP.pe. Avances hacia su multimedialidad, interactividad e
hipertextualidad [Tesis de licenciatura, Universidad Nacional Mayor de San
Marcos]. https://hdl.handle.net/20.500.12672/17336
Bradshaw, P. (2011, 8 de julio). The inverted pyramid of data journalism. Online Journalism. https://onlinejournalismblog.com/2011/07/08/theinvertedpyramidofdatajournalism-inspanish/
Bueno, A. (2014). Periodismo de Datos. Antecedentes, ámbitos de
desarrollo y aplicación en medios generalistas: el caso de El Confidencial y El
Periódico [Trabajo de fin de grado, Universidad de Valladolid]. http://uvadoc.uva.es/handle/10324/5752premiadaserieinvestigativa-swissleaks
Córdoba, A. y García, M. (2021). Evaluación de la transparencia en el
periodismo de datos de referencia. Estudio de las historias publicadas entre
2018 y 2019. Icono 14, 19(2), 364-387. https://doi.org/10.7195/ri14.v19i2.1648
Cortés, H., Luengo, M. y Elías, C. (2018). Periodismo de datos y
transparencia al margen de los grandes medios: un estudio comparativo de Civio
y Propública. Icono 14, 16(2), 66-87. https://doi.org/10.7195/ri14.v16i2.1177
Crucianelli, S. (2013). ¿Qué es el
periodismo de datos? Cuadernos de periodistas, 26, 106-124. http://www.cuadernosdeperiodistas.com/pdf/Cuadernos_de_Periodistas_26.pdf
De Limas, M. (2022). ProPublica’s
Data Journalism: How Multidisciplinary Teams and Hybrid Profiles Create
Impactful Data Stories. Media and Communication, 10(1),
5-15. https://doi.org/10.17645/mac.v10i1.4433
Engebretsen, M.,
Kennedy, H. y Weber, W. (2018). Data visualization in Scandinavian newsrooms:
emerging trends in journalistic visualization practices. Nordicom Review,
39(2), 1-16. https://doi.org/10.21256/zhaw-3505
Escobar, B. y Jara, P.
(2019). Filosofía de Patricia Benner, aplicación en la
formación de enfermería: propuestas de estrategias de aprendizaje. Educación,
28(54), 182-202. https://doi.org/10.18800/educacion.201901.009
Esteban, Ch. (2012). Las nuevas profesiones del periodismo. Cuadernos
Evoca, 7, 17-23. http://www.evocaimagen.com/cuadernos/cuadernos7.pdf
Fallas, H. (2014). Entrevista con una base de datos. En F. Perry
y M. Paz, Manual de Periodismo de Datos
Iberoamericano.http://manual.periodismodedatos.org/hassel-fallas.php
Ferreras, E. (2013). Aproximación teórica al perfil profesional del
periodista de datos. Icono 14, 11(2), 115-140. https://doi.org/10.7195/ri14.v11i2.573
Ferreras, E. (2016). El periodismo de datos en España. Estudio sobre el
mensaje periodístico. 22(1), 255-272. https://doi.org/10.5209/rev_ESMP.2016.v22.n1.52594
Flores, J. (2018). Algoritmos, aplicaciones y big data, nuevos
paradigmas en el proceso de comunicación y de enseñanza-aprendizaje del periodismo
de datos. Revista de Comunicación, 17(2), 268–291. https://revistadecomunicacion.com/article/view/964
Flores, J. y López, P. (2020). Radiografía del periodismo de datos en
las facultades de Comunicación españolas: Innovando los estudios de grado en
Periodismo. Anàlisi: Quaderns de Comunicació i Cultura, 62, 77-92. https://doi.org/10.5565/rev/analisi.3273
Flores, J. y Salinas, C. (2013). El periodismo de datos como
especialización de las organizaciones de noticias en Internet. Correspondencias
& Análisis, 3, 15-34. http://www.correspondenciasyanalisis.com/pdf/v3/cnt/1_periodismo_datos.pdf
Hidalgo, D. y Torres, F. (2016). La navaja suiza del reportero. Consejo
de la Prensa Peruana.
Ivars, B. (2019). La infografía periodística en España: definición y
tipología de uso. Estudios sobre el Mensaje Periodístico, 25(1),
283-302. https://doi.org/10.5209/ESMP.63729
La importancia de la Unidad de Periodismo de Datos en El Comercio.
(2021, 18 de agosto). El Comercio. https://elcomercio.pe/desdelaredaccion/laimportanciadelaunidaddeperiodismodedatosenelcomercionoticia/
La República lanza su portal y unidad LR Data (2021, 19 de agosto). La
República https://larepublica.pe/sociedad/2021/08/19/la-republica-lanza-su-portal-y-unidad-lr-data/
Loosen, W. (2018). Four
forms of datafied journalism. Journalism’s response to the datafication of
society. Communicative Figurations, 18. https://www.kofi.unibremen.de/fileadmin/user_upload/Arbeitspapiere/CoFi_EWP_No18_Loosen.pd
López, P. (2019). La enseñanza-aprendizaje del periodismo de datos en
las facultades españolas: estudios y propuestas de viabilidad [Tesis
doctoral, Universidad Complutense de Madrid]. https://eprints.ucm.es/id/eprint/50688/
López, X., Toural, C. y Rodríguez, A. (2016). Software, estadística y
gestión de bases de datos en el perfil del periodista de datos. Profesional
de la información, 25(2), 286-294. https://doi.org/10.3145/epi.2016.mar.16
Magallón, R. (2013, 30 de setiembre). ¿Por qué es importante una
buena ley de transparencia para el periodismo y para los periodistas? Instituto
para la Innovación Periodística. http://www.academia.edu/5251182/_Por_qu%C3%A9_es_importante_una_buena_ley_de_transparencia_para_el_periodismo_y_para_los_periodistas
Meyer, P. (2002). Precision
journalism. A reporter’s introduction to social science methods (4th ed.).
Rowman & Littlefield Publishers, INC.
Michiels, E. (2017). El periodismo de datos como herramienta para
generar noticias e investigaciones [Tesis de licenciatura, Universidad
Abierta Interamericana]. http://imgbiblio.vaneduc.edu.ar/fulltext/files/TC123792.pd
Ministerio de Justicia y Derechos Humanos. (2021). Compendio de
transparencia, acceso a la información pública y protección de datos
personales: normativa y criterios interpretativos relevantes. https://www.gob.pe/institucion/minjus/informespublicaciones/2518666compendiodetransparenciaaccesoalainformacionpublicayprotecciondedatospersonalesnormativaycriteriosinterpretativos-relevantes
Ministerio de Justicia y Derechos Humanos. (2022). Informe anual
sobre solicitudes de acceso a la información pública 2021. https://www.gob.pe/institucion/minjus/informespublicaciones/2987539informeanual2021sobrepedidosdeaccesoalainformacionalasentidadespublicas
Newman, N., Fletcher,
R., Robertson, C. T., Eddy, K. y Nielsen, R. (2022). Digital News Report 2022. Reuters
Institute. https://reutersinstitute.politics.ox.ac.uk/sites/default/files/202206/DigitalNewsReport_2022.pdf
Oliveira, A. y Angeluci, A. (2019). Competences and Skills in Data Journalism:
Perceptions on the Profile of Brazilian Professionals. Brazilian Journalism Research,
15(2), 381-399. https://doi.org/10.25200/BJR.v15n2.2019.1141
Quevedo, G. (2019). Las entidades filantrópicas que subsidian investigaciones periodísticas
y la incidencia de sus ejes temáticos en la agenda setting de los medios
digitales alternativos: caso Ojo Público [Tesis de
licenciatura, Pontificia Universidad Católica del Perú]. http://hdl.handle.net/20.500.12404/14509
Renó, L. (2018). Manual de periodismo de datos (1.a
edición). Ria Editorial. http://www.riaeditorial.com/index.php/manual-de-jornalismo-de-dados/
Quaderns de Comunicació i Cultura, 62, 93-109. https://doi.org/10.5565/rev/analisi.3283
Sánchez, F. (2019). Tesis. Desarrollo metodológico de la
investigación. Ediciones Normas Jurídicas.
Spagnuolo, S. (2019, 4 de diciembre). Cómo organizar un equipo de
periodismo de datos. Red Internacional de Periodistas. https://ijnet.org/es/story/c%C3%B3moorganizarunequipodeperiodismo-de-datos