Journalistic Knowledge Platforms: from Idea to Realisation
Doctoral thesis
Permanent lenke
https://hdl.handle.net/11250/3095676Utgivelsesdato
2023-10-23Metadata
Vis full innførselSamlinger
Sammendrag
Journalistiske kunnskapsplattformer (JKPer) er en type intelligente informasjonssystemer designet for å forbedre nyhetsproduksjonsprosesser ved å kombinere stordata, kunstig intelligens (KI) og kunnskapsbaser for å støtte journalister. Til tross for sitt potensial for å revolusjonere journalistikkfeltet, har adopsjonen av JKPer vært treg, med forskere og store nyhetsutløp involvert i forskning og utvikling av JKPer. Den langsomme adopsjonen kan tilskrives den tekniske kompleksiteten til JKPer, som har ført til at nyhetsorganisasjoner stoler på flere uavhengige og oppgavespesifikke produksjonssystemer. Denne situasjonen kan øke ressurs- og koordineringsbehovet og kostnadene, samtidig som den utgjør en trussel om å miste kontrollen over data og havne i leverandørlåssituasjoner. De tekniske kompleksitetene forblir en stor hindring, ettersom det ikke finnes en allerede godt utformet systemarkitektur som ville lette realiseringen og integreringen av JKPer på en sammenhengende måte over tid. Denne doktoravhandlingen bidrar til teorien og praksisen rundt kunnskapsgrafbaserte JKPer ved å studere og designe en programvarearkitektur som referanse for å lette iverksettelsen av konkrete løsninger og adopsjonen av JKPer. Den første bidraget til denne doktoravhandlingen gir en grundig og forståelig analyse av ideen bak JKPer, fra deres opprinnelse til deres nåværende tilstand. Denne analysen gir den første studien noensinne av faktorene som har bidratt til den langsomme adopsjonen, inkludert kompleksiteten i deres sosiale og tekniske aspekter, og identifiserer de største utfordringene og fremtidige retninger for JKPer. Den andre bidraget presenterer programvarearkitekturen som referanse, som gir en generisk blåkopi for design og utvikling av konkrete JKPer. Den foreslåtte referansearkitekturen definerer også to nye typer komponenter ment for å opprettholde og videreutvikle KI-modeller og kunnskapsrepresentasjoner. Den tredje presenterer et eksempel på iverksettelse av programvarearkitekturen som referanse og beskriver en prosess for å forbedre effektiviteten til informasjonsekstraksjonspipelines. Denne rammen muliggjør en fleksibel, parallell og samtidig integrering av teknikker for naturlig språkbehandling og KI-verktøy. I tillegg diskuterer denne avhandlingen konsekvensene av de nyeste KI-fremgangene for JKPer og ulike etiske aspekter ved bruk av JKPer. Totalt sett gir denne PhD-avhandlingen en omfattende og grundig analyse av JKPer, fra teorien til designet av deres tekniske aspekter. Denne forskningen tar sikte på å lette vedtaket av JKPer og fremme forskning på dette feltet. Journalistic Knowledge Platforms (JKPs) are a type of intelligent information systems designed to augment news creation processes by combining big data, artificial intelligence (AI) and knowledge bases to support journalists. Despite their potential to revolutionise the field of journalism, the adoption of JKPs has been slow, with scholars and large news outlets involved in the research and development of JKPs. The slow adoption can be attributed to the technical complexity of JKPs that led news organisation to rely on multiple independent and task-specific production system. This situation can increase the resource and coordination footprint and costs, at the same time it poses a threat to lose control over data and face vendor lock-in scenarios. The technical complexities remain a major obstacle as there is no existing well-designed system architecture that would facilitate the realisation and integration of JKPs in a coherent manner over time. This PhD Thesis contributes to the theory and practice on knowledge-graph based JKPs by studying and designing a software reference architecture to facilitate the instantiation of concrete solutions and the adoption of JKPs. The first contribution of this PhD Thesis provides a thorough and comprehensible analysis of the idea of JKPs, from their origins to their current state. This analysis provides the first-ever study of the factors that have contributed to the slow adoption, including the complexity of their social and technical aspects, and identifies the major challenges and future directions of JKPs. The second contribution presents the software reference architecture that provides a generic blueprint for designing and developing concrete JKPs. The proposed reference architecture also defines two novel types of components intended to maintain and evolve AI models and knowledge representations. The third presents an instantiation example of the software reference architecture and details a process for improving the efficiency of information extraction pipelines. This framework facilitates a flexible, parallel and concurrent integration of natural language processing techniques and AI tools. Additionally, this Thesis discusses the implications of the recent AI advances on JKPs and diverse ethical aspects of using JKPs. Overall, this PhD Thesis provides a comprehensive and in-depth analysis of JKPs, from the theory to the design of their technical aspects. This research aims to facilitate the adoption of JKPs and advance research in this field.
Består av
Paper I: M. Gallofré Ocaña and A. L. Opdahl, ‘Supporting Newsrooms with Journalistic Knowledge Graph Platforms: Current State and Future Directions,’ Technologies, vol. 10, no. 3, p. 68, May 2022. The article is available at: https://hdl.handle.net/11250/2999853Paper II: M. Gallofré Ocaña and A. L. Opdahl, ‘A Software Reference Architecture for Journalistic Knowledge Platforms,’ Knowledge-Based Systems, vol. 276, p. 110750, 2023. The article is available at: https://hdl.handle.net/11250/3095670
Paper III: M. Gallofré Ocaña and A. L. Opdahl, ‘A Blackboard Model for Parallel and Flexible Text Annotation,’. The article is not available in BORA.
Paper IV: M. Gallofré Ocaña, T. Al-Moslmi and A. L. Opdahl, ‘Data privacy in journalistic knowledge platforms,’ in Proceedings of the CIKM 2020 Workshops, 29th ACM International Conference on Information and Knowledge Management (CIKM 2020), CEUR Workshop Proceedings, 2020. The article is available at: https://hdl.handle.net/11250/2754111
Paper V: T. Al-Moslmi and M. Gallofré Ocaña, ‘Lifting news into a journalistic knowledge platform,’ in Proceedings of the CIKM 2020 Workshops, 29th ACM International Conference on Information and Knowledge Management (CIKM 2020), CEUR Workshop Proceedings, 2020. The article is available at: https://hdl.handle.net/11250/2754118
Paper VI: M. Gallofré Ocaña, T. Al-Moslmi and A. L. Opdahl, ‘Knowledge graph semantic annotation and population with real-time events data from GDELT,’ in 2022 IEEE 24th Conference on Business Informatics (CBI), vol. 02, 2022, pp. 65–72. The article is not available in BORA due to publisher restrictions. The published version is available at: https://doi.org/10.1109/CBI54897.2022.10050