Balancing bilingualism down the garden path
Abstract
Many factors affect how difficult a sentence is to read. Gibson (2006; 1998) proposed that people combine (a) context-dependent syntactic expectations (top-down statistical information) and (b) context-independent lexical-category frequencies of words (bottom-up statistical information) in order to resolve ambiguities in the lexical categories of words. It is well known that Garden Path (GP) sentences cause significantly longer reading time at the point of ambiguity. Similarly, Code-Switching (CS) in a sentence causes longer reading times, as words are easier to access in a context and code switching temporarily creates a change in lexical context. These phenomena can be used to explore how lexical access and sentence processing interact. I tested this with a self-paced reading (SPR) test of GP and CS sentences compared to a baseline, with an added test of balanced bilingualism in working memory. Will the code switch affect how fast the GP sentence is read and understood? A SPR-test with sentences presented in halves (pilot study, autumn 2014) found a significant main effect of GP (p:0.05) and a weakly significant CS effect (p:0.06). The interesting finding was that when the sentence was both GP and CS there was no additive effect and the combination was faster than the sum of GP and CS (p:0.15). The lack of extra processing time with the added difficulty was surprising: the sentence is not built up incrementally guided by the lexical content. Therefore, CS might even prepare the reparse of the sentence. New data from a word-by-word moving window SPR (jan 2016) shows the same result: RT = 459.2 ms + 16.1 ms (GP) + 15.2 ms (CS) - 19.4 ms (GP + CS). The new data collected confirm the interaction of CS and GP in a more detailed and controlled experiment. The new data collection also introduces a bilingual verbal memory task that will allow us to grade the level of bilingualism of our subjects. Language comprehension and processing depends in part on working memory capacity (Just and Carpenter, 1992), and first and second languages may differ in how efficiently they represent words. I developed a test that may detect an imbalance in working memory capacity between L1 and L2. The hypothesis is that when we get close to the working memory limit there will be differential effects for L1 and L2, and L2 will be both slower to decide and less accurate at the limit. There are significant reaction time effects for Memory Set at 8 words for L2, but not L1, for all conditions, which is congruent with my hypothesis that there are working memory differences between L1 and L2. I have also noted that some, but not all, participants have different distributions of correct answers between L1 and L2. This may be used as a factor that is more precise than a simple high spanner vs. low spanner test for use in experiments that involve cross-linguistic language processing. Det er mange faktorer som påvirker hvor vanskelig en setning er å lese. Gibson (2006; 1998) foreslo at mennesker kombinerer (a) kontekstavhenging syntaktisk forventning (topp-ned statistisk informasjon) og (b) kontekstuavhengig leksikalsk kategorifrekvens av ord (bunn- opp statistisk informasjon) for å løse tvetydigheter i leksikalske kategorier av ord. To faktorer er leksikalsk tilgang og prosessering av syntaktisk tvetydighet. Det er allment kjent at villstråsetninger (engelsk garden path) gir økt lesehastighet i tvetydige punkt i setninger. Likeens gir kodeveksling økt lesehastighet fordi ord er mer tilgjengelige i kontekst, og kodeveksling fører til endring i leksikalsk kontekst. Disse fenomenene kan brukes til å utforske hvordan leksikalsk tilgjengelighet og setningsprosessering interagerer. Jeg testet dette ved en selvstyrt lesetest (engelsk self-paced reading) av villstråsetninger og kodevekslingssetninger, med en grunnlinjesetning til sammenligning, i tillegg til en test av balansert tospråklighet i arbeidsminnet. Vil kodevekslingen påvirke lesehastigheten og forståelsen av en setning? I en lesetest med setninger presentert i halvdeler (pilotundersøkelse, høsten 2014) fant jeg en signifikant effekt av villstråsetning (p:0.05) og en nær-signifikant effekt av kodeveksling (p:0.06). Et interessant funn var at når både kodeveksling og villstråsetning er kom- binert, ble det ingen sammenlagt effekt. Kombinasjonssetningene var kjappere enn summen av villstråsetninger og kodeveksling (p:0.15). Mangelen på ekstra prosessering ved dobbel vanskelighet var overraskende. Setningen er ikke bygget på en støtte av leksikalsk innhold. Derfor kan odeveksling forberede reparsing av setningen. Ny data fra en lesetest med ord for ord (januar 2016) viser samme resultat: RT = 459.2 ms + 16.1 ms (GP) + 15.2 ms (CS) - 19.4 ms (GP + CS). Data som ble innsamlet i januar bekrefter interaksjonen av kodeveksling og villstråset- ning i et mer deltaljert og kontrollert eksperiment. Ny data inkluderer og en tospråklig arbei- dsminnetest som kan utvurdere deltagernes grad av tospråklighet. Språkforståelse avhenger til dels av arbeidsminnekapasitet (Just and Carpenter, 1992), og første- og andrespråk kan avvike i hvor effektivt de representerer ord. Jeg utviklet en test som kan oppdage en ubalanse i arbeidsminnekapasitet mellom første- og andrespråk. Hypotesen er at når vi nærmer oss maks arbeidsminnekapasitet, vil det være en forskjell i effekt av første- og andrespråk. Andrespråket vil ta lenger tid og være mindre nøyaktig. Det er en signifikant effekt av minnesettlengden på 8 ord for andrespråket, men ikke for førstespråket i alle versjonene, som stemmer over ens med hypotesen min om at det er forskjell i arbeidsminne mellom språkene. Jeg har også funnet at noen, men ikke all, har forskjellig distribusjon av korrekte svar i første- og andrespråket. Denne faktoren kan være mer nøyaktig enn å skille mellom høyt og lavt minnespann i eksperiment som bruker tver- rlingvistisk språkprosessering.