13. maj 2020

Nyt liv til gammel dialektsamling: Korpus CorDiale

Månedens dialektemne

Dialektsamlingen Korpus CorDiale har efterhånden en del år på bagen, og det kan også ses på web-adgangen til samlingen. Men i modsætning til mange andre samlinger af talesprog er den fuldt offentligt tilgængelig! Og med et par fif kan man lave ganske kreative søgninger.

Center for Dialektforskning vedligeholder forskellige offentligt tilgængelige korpusser, herunder korpusset CorDiale. Det har for nylig fået ny adresse og er nu at finde på cordiale.ku.dk. Samtidig har søgesiden fået et lille nyt pift i form af muligheden for at søge via et interaktivt kort.

Det nye kort
Det nye interaktive kort på forsiden af cordiale.ku.dk.

CorDiale er et dialektkorpus på godt 1 mio. løbende ord bestående af 170 transskriberede samtaler fra 150 forskellige steder i Danmark. De er optaget i 1934-1994 med det formål at bevare prøver på de gamle dialekter. Man har bestræbt sig på at finde folk der talte så gammeldags og ublandet dialekt som muligt. Meddelerne er derfor gamle mennesker der fortæller om oplevelser fra deres liv – som dengang Rasmus Mørk skulle halshugges, eller dengang karlene og pigerne blev tvunget til at salte og spise en syg ko der burde have været gravet ned ude i møddingen.

Søgesiden har efterhånden en del år på bagen, men den kan stadig være nyttig at søge i. Den er ikke mindst offentligt tilgængelig, hvilket ikke er en selvfølge i vore dage, hvor forskere vogter endnu mere nidkært over potentielt personhenførbare data end tidligere.

Jeg vil her give et par fif til søgning i de to søgemaskiner der går lidt ud over bare at taste et ord ind og klikke "Start søgning". Desværre giver søgesiden ikke adgang til udtalen, hverken som lydskrift eller som lyd der kan afspilles. Korpusset er heller ikke forsynet med ordklasseopmærkning, hvilket også begrænser søgemulighederne. Ikke desto mindre er der stadig masser af muligheder for at lave interessante søgninger.

Nyt interaktivt dialektkort

CorDiale er på den nye adresse – cordiale.ku.dk – blevet forsynet med et interaktivt Danmarkskort der gør det lidt lettere at søge i bestemte egne af landet. Det minder lidt om dialektkortet på dialekt.dk – man klikker på et sted og får noget dialekt. Som nævnt er det dog ikke lyden af dialekten man får, men transskriptioner i almindelig tekst. Til gengæld er der flere steder at vælge mellem. De røde prikker repræsenterer sogne, og derudover kan man klikke på landsdele ved at klikke i de grønne områder uden om prikkerne.

Klikker man eksempelvis på den røde prik ved Ikast sogn, kommer man til søgesiden med Ikast sogn valgt som den lokation der søges i, angivet ved at sognets topografiske nummer står anført neden under søgefeltet: "TOP: 2492" i Ikast sogns tilfælde. Som en påmindelse om hvad man klikkede på, er søgefeltet også automatisk udfyldt med sognets navn. Som oftest vil det dog nok være noget andet end sognets navn man er interesseret i at søge efter i samtalerne, og så kan man indtaste dét.

Søgning inden for Ikast sogn
Søgefeltet som det optræder i bunden af siden. Bemærk at "TOP: 2492" angiver at man søger i tekster optaget inden for Ikast sogn, og bemærk at søgefeltet kan udfyldes med hvilke som helst ord man ønsker at søge efter.

Eksempelvis kunne man ønske at søge på ordet "tække". Efter at have trykket på 'Start søgning' får man fire resultater i en tekst fra Ikast sogn.

Søgning på "tække"
Resultater af søgning på "tække" i Ikast sogn, vist i søgeresultat-feltet på siden. Klikker man på optagelsens identifikationskode "2492.1 (1976)", får man adgang til hele teksten.

Avanceret søgning: Regulære udtryk

Der er mulighed for at lave mere avancerede søgninger ved at bruge såkaldte regulære udtryk. Eksempelvis kan man undersøge hvilke fester der omtales i forskellige egne af landet med følgende søgeudtryk:

_¤#fest(er|en|erne)?_

Forklaring:

_ angiver et synligt blanktegn, dvs. en ordgrænse
¤ angiver et vilkårligt bogstav
# angiver én eller flere forekomster af det foregående (her altså af et vikårligt bogstav)
fest angiver at man søger efter ordet fest
(er|en|erne) angiver at man søger efter formerne fester, festen og festerne
? angiver at de tre ovennævnte former ikke udelukker formen fest
_ angiver igen et synligt blanktegn, dvs. en ordgrænse 

Søger man i Sønderjylland, får man resultater med høstfest og familiefest. Søger man på Sjælland, får man eksempler på sankthansfest, fastelavnsfest, skyttefest og det mere overordnede folkefest. Resultaterne er dog få, så der kan næppe uddrages generelle konklusioner om festvanerne hhv. i Sønderjylland og på Sjælland på den baggrund.

Mere sigende bliver det hvis man bruger følgende søgeudtryk:

_mark¤#_

… som giver ord der begynder med mark-. Søger man i Nørrejylland vs. på Sjælland, viser der sig den forskel at de fleste resultater i Nørrejylland indeholder marked, mens kun halvt så mange indeholder marken, hvorimod resultaterne fra Sjælland indeholder over 10 gange så mange forekomster af marken som af marked. Her er der formentlig tale om en reel forskel på hvor relevante marker hhv. markeder er i de to landsdele.

Dialektudtryk

Ønsker man sig eksempler på dialektudtryk uden på forhånd at vide hvad man søger efter, er det også muligt hvis man er kreativ med sin søgning.

Først må man udelukke interviewernes tale fra søgningen. Det gør man ved på søgesiden at klikke på knappen "Persondata", fjerne fluebenet ved "Interviewere" og klikke på "OK".

Fravalg af interviewerens tale
Efter at have klikket på "Persondata" på forsiden kan man fravælge at søge i interviewerens tale – ligesom man fx kan indsnævre sin søgning efter meddelernes køn og alder.

Nu kan man fx søge på:

_sådan_e[nt]_¤#_

Dette søgeudtryk vil finde udtrykket "sådan en/et xxx", en konstruktion som ofte vil referere til ting som samtalepartneren (her altså intervieweren) ikke nødvendigvis forventes at kende. Søger man på Lolland-Falster, kan man på den måde finde ord som blusselampe, motorkvase, sænkesværd, spidstønde, åleheks. Alt sammen tilfældigvis maritime udtryk, hvis nogen skulle være i tvivl! I Sønderjylland kan man finde ord som sprutmyre og glaskærne; osv.

Med lidt snilde er det altså stadig muligt at gøre interessante fund i korpusset, selv med de ikke længere helt moderne søgemuligheder.

Philip Diderichsen