A script for manually coding features. The coder inputs boundaries which are written to the TextGrid

## This script is used in coding for assimilations, but could be modified to any other task that invoves
## a human evaluation of a sound extract.
##
## The script searches for words ending in a certain string of letters in adjectives and verbs
## (i.e. words that are not of other Parts of Speech). If the string is found, the corresponding
## sound is played for the coder and the the TextGrid is shown.
## The coder's task is to set boundaries in the TextGrid. When the coder has set the boundaries,
## they is written to the TextGrid with a code.
##
## The script is written October 2011 by jthoegersen@hum.ku.dk and is GNU/GPL
##

string$ = "ede"

filename$ = selected$ ("TextGrid")

#Open long sound file... L:\Korpus\lydfiler\'filename$'.wav

select TextGrid 'filename$'

tiers = Get number of tiers

lastTier$ = Get tier name... tiers

if lastTier$ = "'string$'-endelse"
    beginPause ("Fejl!")
    comment ("Tieret findes allerede. Slet tieret?")
    delete = endPause ("Ja", 0)

    if delete = 1
        Remove tier... tiers
    endif

endif

Insert interval tier... tiers+1 'string$'-endelse

tiers = Get number of tiers

intervals = Get number of intervals... 1

for interval to intervals

    select TextGrid 'filename$'
    label$ = Get label of interval... 1 interval

    if endsWith (label$, string$)

        pos_label$ = Get label of interval... 5 interval

        if index_regex("'pos_label$'", "(EGEN|N|NUM|ADV)") = 0

            start = Get starting point... 1 interval
            end = Get end point... 1 interval

            Insert boundary... tiers end

            plus LongSound 'filename$'

            View & Edit

            editor TextGrid 'filename$'
                Select... start end+0.05
                Zoom to selection
                Play... start end+0.05
            endeditor
            pause Marker 'string$'-endelsen

            minus LongSound 'filename$'

            stringIntervals = Get number of intervals... tiers
            Set interval text... tiers stringIntervals-1 'string$'

            plus LongSound 'filename$'

            editor TextGrid 'filename$'
                Close
            endeditor

        endif
    endif
endfor

select LongSound 'filename$'
Remove
select TextGrid 'filename$'
Save as text file... L:\Korpus\assimilationer\filename$'_'string$'-endelse.TextGrid

A script for manual coding of features. The coder’s input is written to the TextGrid

## The script searches for words ending in a certain string of letters in adjectives and verbs
## (i.e. words that are not of other Parts of Speech). If the string is found, the corresponding
## sound is extracted and played for the coder. When the coder has decided on the proper code, he or she
## enters it, and it is written to the TextGrid. The coder can listen to the extract any number of times,
## and cancel the task if in doubt.
## There is no "undo".
##
## The script is written October 2011 by jthoegersen@hum.ku.dk and is GNU/GPL
##

string$ = "ede"

filename$ = selected$ ("TextGrid")

Open long sound file... L:\Korpus\lydfiler\'filename$'.wav

select TextGrid 'filename$'
tiers = Get number of tiers

lastTier$ = Get tier name... tiers

if lastTier$ = "'string$'-assimilation"
    beginPause ("Fejl!")
    comment ("Tieret findes allerede. Slet tieret?")
    delete = endPause ("Ja", 0)

    if delete = 1
        Remove tier... tiers
    endif

endif

Insert interval tier... tiers+1 'string$'-assimilation

tiers = Get number of tiers

intervals = Get number of intervals... 1

for interval to intervals

    select TextGrid 'filename$'
    label$ = Get label of interval... 1 interval

    if endsWith (label$, string$)

        pos_label$ = Get label of interval... 5 interval

        if index_regex("'pos_label$'", "(EGEN|N|NUM|ADV)") = 0

            start = Get starting point... 1 interval
            end = Get end point... 1 interval
            endCut = 'end'+0.05
            startCut = 'start'-0.025

            Insert boundary... tiers start
            Insert boundary... tiers end

            select LongSound 'filename$'

            Extract part... startCut endCut no

            playagain = 1

            while playagain = 1
                Play
                beginPause ("Spil igen?")
                playagain = endPause ("Spil igen", "Fortsæt", 1)
            endwhile

            Remove

            beginPause ("Assimileret?")
            comment ("Er endelsen assimileret?")
            endelse = endPause("Ja", "Nej", "Cancel", 0)

            if endelse <> 3

                select TextGrid 'filename$'

                tttInterval = Get interval at time... tiers start

                if endelse = 1
                    Set interval text... tiers tttInterval \dh
                elsif endelse = 2
                    Set interval text... tiers tttInterval \dh\sw
                endif

            elsif endelse = 3

                select TextGrid 'filename$'

                Remove boundary at time... tiers start
                Remove boundary at time... tiers end

                interval = interval - 1

            endif

        endif
    endif
endfor

select LongSound 'filename$'
Remove
select TextGrid 'filename$'
Save as text file... L:\Korpus\assimilationer\filename$'_'string$'.TextGrid

Bulk procedures – TextGrid only

## Snippet for selecting all TextGrids in a directory
form Bulk action
    comment TextGrid directory
    text TextGrid_directory C:\tmp\4\
endform

Create Strings as file list... list 'textGrid_directory$'*.TextGrid

select Strings list
files = Get number of strings

for file to files
    select Strings list
    filename$ = Get string... 'file'

    Read from file... 'textGrid_directory$''filename$'
##
##
    Remove
endfor
select Strings list
Remove

Bulk procedures – TextGrid AND Sound files

## Snippet for selecting TextGrid and wav file pairs in a directory

form Bulk action
    comment TextGrid directory
    text TextGrid_directory C:\tmp\
    comment Sound in directory
    text SoundIn_directory C:\tmp\
endform

Create Strings as file list... list 'textGrid_directory$'*.TextGrid
Change... ".TextGrid" "" 0 Literals
select Strings list
files = Get number of strings

for file to files
    select Strings list
    filename$ = Get string... 'file'

    Open long sound file... 'soundIn_directory$''filename$'.wav
    Read from file... 'textGrid_directory$''filename$'.TextGrid
##
##
    select TextGrid 'filename$'
    Remove
    select LongSound 'filename$'
    Remove
endfor

select Strings list
Remove
select Strings list
Remove

Pretonic vowels

## This snippet finds words with vowels before main stress
intervals = Get number of intervals... 6
for interval to intervals
    label$ = Get label of interval... 6 interval
    stressed = index (label$, "2")
    vowel = index_regex (label$, "(i|e|E|z|a|A|y|q|Q|x|u|o|c|C|X|0)")
    if vowel < stressed
        printline 'label$'
    endif
endfor

“Digital Humanities”?

Det virker for mig som om der er to typer “digital humanities”. Jeg tror man kan skelne mellem dem ved at tale om henholdsvis “the humanities of the digital” og “using computers in the humanities”. Til den sidste gruppe hører fx korpuslingvistik og nogle former for (litterær) stillistik. Man kan måske diskutere om samfundsforskning der baserer sig på statistik også skal regnes med til denne gruppe. Til den første gruppe kan regnes humanister, fx kunst- og litteraturforskere, som beskæftiger sig med digitale artefakter (hypertekster, digital kunst osv.) enten fordi disse kunstformer giver kunstere nogle nye udtryksformer, eller fordi de digitale artefakter giver *forskeren* nogle nye udfordringer – fx spørgsmål om autenticitet og ophav til en tekst der findes i uendelig mange permutationer, er skrevet af mange forfattere, eller måske automatisk genereret.

For mig at se er de to typer digital humanities væsensforskellige. De er måske ikke uforenelige, men det er i hvert fald uheldigt ikke at holde sig klart hvilken en man taler om når man bruger begrebet. For den ene skole er det selve objektets “digitalitet” der er i fokus og menneskers håndtering af disse nye muligheder og udfordringer – det er altså i den mest basale forstand en form for medieanalyse. For den anden skole er objektets digitalisering (altså det at objektet er transformeret til tal som en computer kan manipulere) som er interessant. Ikke fordi det ændrer objektet eller objektets primære brugere (læseren, beskueren…) men fordi det giver forskeren nogle nye muligheder for objektive beskrivelser af data og analyser af korrelationer mellem forskellige parametre ved data. Den anden skoles spørgsmål er ikke “hvordan er objektet anderledes fordi det er digitalt?”, men “hvordan kan jeg bruge en algoritme til at fortælle mig noget om objektet?”. Hvis den første skole er en form for medieanalyse, er den anden skole i bund og grund en form for empiricister under sloganet “hvis det ikke kan måles, er det der ikke; hvis det kan måles, må der være noget”.

Her er mine kilder, hertil min verden går

[Tidligere postet på www.larm-archive.org]

Jeg arbejder med sproget i Danmarks Radio, mere specifikt med sprogforandring i Danmarks Radio, mere specifikt med sprogforandring i Radioavisen, og foreløbig med sprogforandring i radioavisen fra 1936-1986. Det betyder at jeg har hørt en stor del af de gamle radioaviser der er bevaret for. Og jeg har ikke bare hørt dem, jeg har nærlyttet dem og hørt på hver en lille frasering i oplæserens udtale, men det er ikke det jeg vil skrive om her. For når man lytter efter sproglige forandringer, finder man nogle gange også indikationer på langt større og mere omsiggribende forandringer. I dette tilfælde tror jeg at valget af kilder siger noget om dansk udenrigspolitik og om danskernes horisont. Min simple påstand er denne: Vi omtaler vores verden som globaliseret, og vi priser hvordan alle via internettet har adgang til al information i verden – men aldrig i radioavisens historie har udbuddet af kilder været snævrere og aldrig har det formidlede verdensbillede været mere ensrettet.

I 1936, den ældste bevarede radioavis, rapporteres der fra borgerkrigen i Spanien og kilderne er Reuters og en spansk avis.

I 1946 prøvesprængtes der atombomber over Bikini, og kilden til historien var San Francisco radio.

I 1956 var der storpolitiske kriser i Mellemøsten og i Ungarn. Krisen i Mellemøsten førte til debatter i FN at Frankrig og England indledte et angreb mod Egypten. I radioavisen citeres både engelsk-franske kilder, amerikanske kilder som er overvejende forstående men kritiske, og russiske kilder som er kritiske over for angrebet. Opstanden i Ungarn rapporteres bl.a. af ”det franske telegrambureau”, Budapest Radio, Moskva Radio og ”kilder i Wien”.

I 1968 døde Jurij Gagarin ved et flystyrt i Sovjetunionen, og kilden var naturligvis russisk, Pravda. Samme år blev Martin Luther King skudt i USA, og amerikanske kilder bliver naturligvis citeret, men pga. Kings stillingtagen til Vietnamkrigen blev russiske kilder også citeret om Sovjets syn på krigen og Nordvietnams politik.

I 1977 blev et tysk passagerfly kapret og fløjet til Mogadishu hvor tyske specialstyrker stormede flyet. Tyske kilder bliver naturligvis citeret, men også den somaliske indenrigsminister. Indien fik en ny minister for kasteløse. Kilden til denne nyhed er det franske nyhedsbureau. Samme år besøgte USA’s udenrigsminister Sovjetunionen for at indlede nedrustningsforhandlinger. Han benyttede besøget til at kritisere Sovjets behandling af systemkritikere. Det fører til kritik fra sovjetiske kilder som synes han ødelægger mulighederne for samarbejde. Både Pravda og Isvestija citeres.

Når jeg hører disse eksempler kommer jeg uvægerligt til at tænke på hvornår jeg sidst hørte en ikke-vestlig kilde neutralt citeret i radioavisen. Det synes for mig som om citaterne i dag kommer fra en håndfuld britiske og amerikanske kilder, evt. med et par franske og en israelsk avis i mere marginale positioner. Når en ikke-vestlig kilde citeres, er det mere reglen end undtagelsen at der er lægges afstand til deres vidnesbyrd med beskrivelser som ”den regeringstro avis…”. Citerer man en sjælden gang en ikke-vestlig avis som sandhedsvidne, opbygges deres troværdighed med ”den uafhængige avis…”.

Kan det passe at Skandinavien og Danmark før og under den kolde krig så sig selv som et tredje sted mellem vestblokken og østblokken? Ja, vi var i forbund med USA, men vi skulle også forstå østblokkens synspunkter og anerkende deres ret til at have egne meninger? Er det omvendt sådan at dansk udenrigspolitik og danskernes udsyn i dag er som en art amerikansk provins? Vi gengiver ukritisk hvad britiske og amerikanske kilder siger, og ser som udgangspunkt med skepsis på evt. modstridende synspunkter og som noget der helst skal forties?

Den verserende opstand i Libyen er et godt eksempel. Jeg har naturligvis ikke hørt alle indslag om opstanden, men i de indslag jeg har hørt, har jeg hørt mange vestlige kilder, men ingen fx russiske. Parallellen til Englands og Frankrigs indtog i Egypten og radioavisens dækning af USA’s og Sovjets kritik ligger ellers ligefor. Var der ikke også en FN-debat omkring Libyen og kritik af FN-resolutionen? Og ser russerne ikke stadig kritisk på de vestlige styrkers iværksættelse af resolutionen? Og skal denne kritik ikke også høres som et værdigt synspunkt? Min fornemmelse er at kritikken ville have været refereret i en mindre globaliseret, monopoliseret radioavis anno 1956.

Og hvis jeg har ret? Hvorfor er kilderne så mindre mangfoldige i dag hvor vi opfatter os som globaliserede og verden som én stor landsby? Er det fordi radioavisen går ud fra, at den kun er ét blandt mange medier som den danske nyhedsforbruger benytter sig af? Går de ud fra at lytteren selv finder de modsatrettede stemmer som giver historien nuancer? Det vil jeg hellere tro, end at det er fordi de opfatter den moderne, globaliserede, højere uddannede dansker som dummere og dermed ude af stand til selv at tage stilling til forskellige synspunkter…