Semi-Automation in Video Editing

Soe, Than Htut

dc.contributor.author	Soe, Than Htut
dc.date.accessioned	2022-10-17T09:34:54Z
dc.date.available	2022-10-17T09:34:54Z
dc.date.issued	2022-10-31
dc.date.submitted	2022-10-15T01:32:32Z
dc.identifier	container/32/ae/65/4e/32ae654e-48a6-4898-98d2-6bb4f8ca92ee
dc.identifier.isbn	9788230852156
dc.identifier.isbn	9788230866092
dc.identifier.uri	https://hdl.handle.net/11250/3026342
dc.description.abstract	Semi-automasjon i video redigering Hvordan kan vi bruke kunstig intelligens (KI) og maskin læring til å gjøre videoredigering like enkelt som å redigere tekst? I denne avhandlingen vil jeg adressere problemet med å bruke KI i videoredigering fra et Menneskelig-KI interaksjons perspektiv, med fokus på å bruke KI til å støtte brukerne. Video er et audiovisuelt medium. Redigere videoer krever synkronisering av både det visuelle og det auditive med presise operasjoner helt ned på millisekund nivå. Å gjøre dette like enkelt som å redigere tekst er kanskje ikke mulig i dag. Men hvordan skal vi da støtte brukerne med KI og hva er utfordringene med å gjøre det? Det er fem hovedspørsmål som har drevet forskningen i denne avhandlingen. Hva er dagens "state-of-the-art" i KI støttet videoredigering? Hva er behovene og forventningene av fagfolkene om KI? Hva er påvirkningen KI har på effektiviteten og nøyaktigheten når det blir brukt på teksting? Hva er endringene i brukeropplevelsen når det blir brukt KI støttet teksting? Hvordan kan flere KI metoder bli brukt for å støtte beskjærings- og panoreringsoppgaver? Den første artikkelen av denne avhandlingen ga en syntese og kritisk gjennomgang av eksisterende arbeid med KI-baserte verktøy for videoredigering. Artikkelen ga også noen svar på hvordan og hva KI kan bli brukt til for å støtte brukere ved en undersøkelse utført av 14 fagfolk. Den andre studien presenterte en prototype av KI-støttet videoredigerings verktøy bygget på et eksisterende videoproduksjons program. I tillegg kom det en evaluasjon av både ytelse og brukeropplevelse på en KI-støttet teksting fra 24 nybegynnere. Den tredje studien beskrev et idiom-basert verktøy for å konvertere bredskjermsvideoer lagd for TV til smalere størrelsesforhold for mobil og sosiale medieplattformer. Den tredje studien utforsker også nye metoder for å utøve beskjæring og panorering ved å bruke fem forskjellige KI-modeller. Det ble også presentert en evaluering fra fem brukere. I denne avhandlingen brukte vi en brukeropplevelse og oppgave basert framgangsmåte, for å adressere det semi-automatiske i videoredigering.	en_US
dc.description.abstract	How can we use artificial intelligence (AI) and machine learning (ML) to make video editing as easy as "editing text''? In this thesis, this problem of using AI to support video editing is explored from the human--AI interaction perspective, with the emphasis on using AI to support users. Video is a dual-track medium with audio and visual tracks. Editing videos requires synchronization of these two tracks and precise operations at milliseconds. Making it as easy as editing text might not be currently possible. Then how should we support the users with AI, and what are the current challenges in doing so? There are five key questions that drove the research in this thesis. What is the start of the art in using AI to support video editing? What are the needs and expectations of video professionals from AI? What are the impacts on efficiency and accuracy of subtitles when AI is used to support subtitling? What are the changes in user experience brought on by AI-assisted subtitling? How can multiple AI methods be used to support cropping and panning task? In this thesis, we employed a user experience focused and task-based approach to address the semi-automation in video editing. The first paper of this thesis provided a synthesis and critical review of the existing work on AI-based tools for videos editing and provided some answers to how should and what more AI can be used in supporting users by a survey of 14 video professional. The second paper presented a prototype of AI-assisted subtitling built on a production grade video editing software. It is the first comparative evaluation of both performance and user experience of AI-assisted subtitling with 24 novice users. The third work described an idiom-based tool for converting wide screen videos made for television to narrower aspect ratios for mobile social media platforms. It explores a new method to perform cropping and panning using five AI models, and an evaluation with 5 users and a review with a professional video editor were presented.	en_US
dc.language.iso	eng	en_US
dc.publisher	The University of Bergen	en_US
dc.relation.haspart	Paper 1. Than Htut Soe, Marija Slavkovik, AI video editing tools. What do editors want, and how far is AI from delivering them? Not available in BORA. Preprint available at: <a href="https://arxiv.org/abs/2109.07809" target="blank">https://arxiv.org/abs/2109.07809</a>	en_US
dc.relation.haspart	Paper 2. Than Htut Soe, Frode Guribye, Marija Slavkovik, Evaluating AI assisted subtitling, IMX '21: ACM International Conference on Interactive Media Experiences 21, 6, 2021. Not available in BORA. The article is available at: <a href="https://doi.org/10.1145/3452918.3458792" target="blank">https://doi.org/10.1145/3452918.3458792</a>	en_US
dc.relation.haspart	Paper 3. Than Htut Soe, Marija Slavkovik, A content-aware tool for converting videos to narrower aspect ratios, IMX '22: ACM International Conference on Interactive Media Experiences (IMX 2022) 22, 6, 2022. Not available in BORA. The article is available at: <a href="https://doi.org/10.1145/3505284.3529970" target="blank">https://doi.org/10.1145/3505284.3529970</a>	en_US
dc.rights	Attribution-NonCommercial-NoDerivs (CC BY-NC-ND). This item's rights statement or license does not apply to the included articles in the thesis.
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.title	Semi-Automation in Video Editing	en_US
dc.type	Doctoral thesis	en_US
dc.date.updated	2022-10-15T01:32:32Z
dc.rights.holder	Copyright the Author.	en_US
dc.contributor.orcid	0000-0002-0717-8245
dc.description.degree	Doktorgradsavhandling
fs.unitcode	15-17-0

Tilhørende fil(er)

Filnavn:: Thesis_Soe.pdf
Størrelse:: 1.874Mb
Format:: PDF
Beskrivelse:: Main thesis

Åpne

Denne innførselen finnes i følgende samling(er)

Department of Information Science and Media Studies [858]

Vis enkel innførsel

Attribution-NonCommercial-NoDerivs (CC BY-NC-ND). This item's rights statement or license does not apply to the included articles in the thesis.

Med mindre annet er angitt, så er denne innførselen lisensiert som Attribution-NonCommercial-NoDerivs (CC BY-NC-ND). This item's rights statement or license does not apply to the included articles in the thesis.