Skrifttype, skrifttegn, og læselighed

Jeg skrev med en pige fra Korea på en dating side og blev opmærksom på deres interessante skriftsystem: Hangul. Den meget korte version er at det er et alfabetisk system men hvor tegnene kan kombineres ind i større tegn som på den måde udtrykker en hel stavelse. Mere interessant, så er skrifttegnene dannet ud fra lingvistisk viden, således at lyde som deler features også ligner hinanden. Det gør det til et af de eneste featural skriftsystemer. Hun viste mig også denne introduktion. Læseren bør læse den igennem.

korean

Det som irriterede mig ved systemet var, at der var svært at huske nogle af tegnene fra hinanden fordi at de lignede hinanden en del. Feature-systemets styrke blev dets svaghed. Nogle af tegnene er bare roterede udgaver af hinanden. Her er en oversigt:

korean2

Som det kan ses, så er mange af dem roterede eller spejlede versioner af hinanden. <ㄱ> og <ㄴ> er roteret. <ㅡ> og <ㅣ> lige så. Det gælder også alle dem med ekstra streger: <ㅗ> og <ㅜ>. Det gør dem temmelig svære at huske fra hinanden, hviket betød at jeg måtte kikke frem og tilbage mange gange i guiden ovenfor for at læse ordene.

Men ikke nok med det, så er det tilsyneladende tilfældet at når tegn ligner hinanden, så bruger man længere tid på at genkende dem, og derfor sænker det altså læsehastigheden. Derfor bør man have så forskelligartede tegn som muligt (bortset måske fra ustemte/stemte varianter fx [p] og [b]). Det er en lign. ræsonnering man finder ‘i naturen’ når den valgte hvilke fonemer som der var i sproget:

The Spanish vowels are fairly evenly distributed near the perimeter of the vowel space. The three vowels i, a, u are near the corners of this space, and thus as far apart from each other as possible. The other two vowels, e and o, are spaced at intermediate distances. Because the three vowels i, a, u are as auditorily distinct as possible, they are very effective ways of distinguish­ing words, and many languages make use of them. If we think of languages from an evolutionary point of view, it is hardly surprising that by far the majority have evolved so that they have vowels similar to the three Spanish vowels i, a, u, which provide such efficient means of communication. If there are two further vowels, as in Spanish, they are likely to be placed so that the resulting set of five vowels is distributed in the possible vowel space in the most efficient way. This will involve arranging the vowels as shown in figure 4.3 for Spanish. These vowels are as auditorily distinct as any five vowels can be.

When we consider the development of vowel systems we must note that the vowel systems of the world’s languages also show evidence of another con­ straint discussed in chapter 1, the pressure to form patterns. Given that the auditory space for possible vowels is somewhat triangular, the selection of the three most distant vowels i, a, u is obviously beneficial. It would be possible for languages to add just one vowel to these basic three, and, indeed, some languages do have only four vowels. But it turns out that far more languages have five or seven vowels than have four or six. With five or seven vowels it is possible to have a nicely symmetrical triangular vowel space. [fra Peter Ladefoged, Vowels and Consonants, side 35)

Det mindede mig også om, at jeg havde læst om problemet tidligere i kandidatafhandlingen Writing system development and reform: A process:

 sylla

Although this system is simple and economical, it is difficult to learn. Near-uniformity in dimension, mirror-image symbols, and the abundant use of diacritics complicate learning this type of writing system. Normally, variety in the shape of symbols is desirable because this facilitates visual discrimination and thus reading fluency. Many teachers can attest to problems with b and d in Latin script, and this is not limited to dyslexic students. How much more of a challenge it would be to master a system based on symmetrical shapes and differences in orientation? Wiebelt (2004) comments that deficiency of distinctiveness affects readability of text and illustrates how, in the evolution of typography, distinctive features were augmented in Latin characters to decrease confusability and increase readability. Learners of the Algonquian syllabaries need teachers and materials which take the inherent challenges into account. (side 72 i PDF’en).

Den reference der henvises til er:

Af utrolige årsager er artiklen kun blevet citeret 1 gang if. google scholar, og det er i den afhandling jeg også citerer fra! Det er en skam for det er en spændende aritkel.

Det viser sig, at det latinske alfabet også har problemer med bogstaver som ligner hinanden, men at det kommer en del an på skrifttypen som man har valgt. Hun er en oversigt fra paperet:

rune

Som det kan ses, så er der nogle skrifttyper hvor problemet med roterede bogstaver er større end andre. Helt galt går det til i Ariel, som også lider af at der er to forskellige tegn som er helt ens <I,l>, altså <I> og lille <l>. I visse tilfælde kan det give problemer, særligt i navne som er midt i en sætning. Tænk på det engelske navn <Ian>. Hvis det står midt i en sætning, så kan man ikke umiddelbart se om der skal stå <Ian> eller <lan>. Eksempel: Did you give it to Ian? Man kan naturligvis udlede betydningen ud fra kontekst, men det må kræve en smule ekstra regnekraft og derfor tage lidt længere tid, og derfor nedsætte læsehastigheden en smule. Man kan godt se forskel på Times, som dette indlæg er skrevet i, men forskellen er ret lille.

Det går også galt med bogstaverne <d> og <b>, som jo bare er spejlvendt. Samme gælder <p> og <q>. Faktisk er alle disse bogstaver et og samme tegn, bare roteret og spejlet, næsten i hvert fald. På Times har man gjort en smule for at undgå det, nemlig ved at bruge seriffer som vender mod venstre. Hvis man således spejlvendt et <d> på Ariel så ville man ikke helt få et <b> fordi at seriffen vender forkert. Men igen en lille detalje som teoretisk burde nedsætte læsehastigheden fordi at det tager længere tid at genkende tegnet.

Derudover er der tegnene <m> og <n> som ligner hinanden. Der er også <u> og <v> som særligt i håndskrift har det med at ligne hinanden. Det hænger også sammen med at de har fælles ophav. Det er i øvrigt også derfor at <w> har det ulogiske navn på engelsk dobbelt-U, det er jo et dobbelt V, som det hedder på dansk. Et levn fra fortiden. <m> og <w> er også tæt på at være roterede, et roteret <w> ser sådan ud <ʍ>. Man kan rotere bogstaver og skrive dem normalt vha. dette redskab. Prøv også at sammenligne de omvente versioner af <p,q,b,d>.

Fremtiden?

Det må være relativt nemt at teste forskellige skrifttyper ifht. deres læsbarhed. Så kan man eksperimentere med at gøre de problematiske bogstavgrupper mere forskellige. Det er jo oplagt fx at lave <q> om til noget andet. <Q> og <P> er jo nemme nok at kende fra hinanden.

Man kunne også teste helt nye skriftsystemer mod hinanden for at gå en meget bedre ide om præcis hvad der gør udfaldet. Det må næsten allerede være blevet gjort.

Når man så har fundet ud af hvad der virker, så kan man udvikle nogle nye latinske skrifttyper som optimerer læsehastigheden.

Danskernes utrolige sproghysteri

Lene E. hånes for ‘Somalien’- ups på Facebook (tv2)

Det skulle have været en “dejlig nyhed”, men Lene Espersens jubel over, at de to danskere Eddy Lopez og Søren Lyngbjørn var blevet givet fri, endte med et pinligt optrin for politikeren selv.

– Dejlig nyhed efter nævnsmøde i eftermiddag at der er lykkedes at få frigivet gidslerne i Somalien, skrev den tidligere udenrigsminister kort før midnat på Facebook.

– Somalien? Hedder det ikke Somalistan?

Henrik Pedersen:
– Somalien?? Du burde da få dine skolepenge tilbage Lene. Der burde være rigeligt i kassen….

Jakob Fredson:
– Hahaha somalien.

Jonas Nikolaj Jensen:

og udover det,lene espersen.hvor ligger somalien egenligt henne ?? for så vidt jeg ved,så hedder det somalia…blot endnu eet bevis på,at du vist ikke har sat dig helt så godt ind i sagerne som du gerne vil give udtryk for med din statusopdatering…men så tror jeg da faen at i intet har gjort for at få søfolkene frigivet…i har ledt det forkerte sted…var der nogen der nævnte uduelige politikere ???

Alt sammen fordi at hun brugte en dansk endelse på et ord fremfor en udansk. Det er jo nærliggende at tænke på den nylige ændring af retskrivningsordbogen mht. ord med latinske endelser, især <ium>, som nu kan skrives <ie>. <ia> er ret sjælden på dansk, kun 66 ord i min søgning i DAT. En søgning på <ien> giver 67 hits. Lader til at være ca. 50/50 i stavemåden på lande. Men <ien> må siges at være mest dansk da denne kan kommes frem til ved at bøje i bestemt form, fælleskøn med ord som slutter på <i>.

<ia>

allotria ambrosia araucaria begonia boccia bolivia cafeteria christiania colombia dahlia dia formalia forsytia fredericia fresia fuchsia gambia gardenia generalia gloria hortensia imponderabilia in absentia india infoteria intelligentsia kamelia klamydia knoldbegonia kopialia latakia liberia listeria lobelia loggia mafia magnesia magnolia mahonia malaria malaysia media namibia nigeria nutria paranoia paria passacaglia personalia petunia pizzeria promemoria razzia realia saint lucia sangria sepia somalia tanzania tradescantia varia venezia via virginia zambia zinnia

<ien>

abessinien abkhasien albanien anatolien andalusien arabien aragonien armenien asien assyrien australien bagindien baskien belgien bosnien brasilien bulgarien californien caribien castilien catalonien centralasien eksjugoslavien etiopien etrurien eurasien forindien fønikien gallien georgien indien indonesien italien jugoslavien krigsstien kroatien lilleasien makedonien mauretanien melanesien mesopotamien mikronesien nubien oceanien ostindien persien polynesien rumænien sardinien saudi-arabien serbien sibirien sicilien skandinavien skytien slien slovenien spanien storbritannien sydøstasien syrien transsilvanien transsylvanien tunesien vestindien wien østasien

Ak og ve, det kan være farligt at være sprogfornyer eller bare afvige blot en smule fra retskrivningsordbog-dansk hvis man er politiker (eller nogen anden person). Tænk hvis man kom til at skrive “af” i stedet for “ad”, eller satte et komma ukorrekt. Det er sådan nogle ting som giver mig lyst til at bare afskaffe officielle retskrivningsordbøger helt.

Det minder mig i øvrigt om et radiointerview hvor man hører noget lign. fra en forsker som bevidst siger “norsker” i stedet for “nordmand”. “norsker” er på alle måder et bedre alternativ, da det ikke er kønsbundet, og passer med den mere normale <er> suffiks som danner navneord. Nuvel virker <mand> også til at danne navneord. De danner begge navneord af typen: {politimand, brandmand, landmand, politiker, forsker, arbejder}. Altså ord som dækker over person som har et vist erhverv. Der er med garanti et -nym ord for dette, men jeg kan ikke lige komme på det. Jeg mener at det var Henrik Galberg Jacobsen, men jeg er ikke helt sikker. Det var i hvert fald i Sproglaboratoriet.

Hensynsløshed

Smileyer sniger sig ind i danskstilen (dr)

Anderledes skeptisk er Ole Hyltoft, der er forfatter og næstformand i DR’s bestyrelse. For selvom han har det fint med, at der bliver optaget nye ord i sproget, kalder han det et problem, når det fører til sjusk.

– Vi skal bevare en vis konservatisme i sproget af hensyn til kommunikationen mellem generationer. Der er nogle normer, der er kommet i skred. Jeg bliver irriteret, når jeg modtager en mail med 25 stavefejl, fordi nogle mener, at man ikke skal gøre sig umage, når man henvender sig til andre. Det er hensynsløst og svarer til, at man kommer til fest i træningstøj, siger Ole Hyltoft.

Man fristes til at spørge hvor Ole Hyltofts hensyn er til de mange som døjer med at kunne lære at skrive standard dansk fordi at stavemåderne er så åndssvage? Hvorfor skulle man tage hensyn til om OH bliver sur over at man laver stavefejl? Han kunne jo tydeligvis godt læse hvad der stod. Eller mener han bare, at det er godt at det er langsommeligt at kommunikere? For det er prisen for at bruge tid på at rette stavefejl.

PS. Folk kommer rent faktisk til fester i træningstøj. 😉

Det etymologiske princip og franske ord med OU for [u]

Jeg stødte på et stykke gammel dansk. Det drejer sig om Lex Regia, eller Kongeloven. Den er fra 1665. Heri kan man læse:

Lex Regia, det er den souveraine Konge-Lov; sat og given af den Stormægtigste Højbaarne Fyrste og Herre, Herr Friderich den Tredie, af Guds Naade Konge til Danmark og Norge, de Venders og Gothers, Hertug udi Slesvig, Holsteen, Stormarn og Dithmarsken, Greve udi Oldenborg og Delmenhorst; Og af Hans Majestæt underskreven den 14 Novemb. 1665. Som den Stormægtigste Højbaarne Fyrste og Herre, Herr Friderich den Fierde, af Guds Naade, Konge til Danmark og Norge, de Venders og Gothers, Hertug udi Slesvig, Holsteen, Stormarn og Dithmarsken, Greve udi Oldenborg og Delmenhorst, Allernaadigst haver befalet ved offentlig Tryk at vorde publiceret den 4 Sept. Aar 1709.

Det er spændende at se på hvilke ændringer der har været siden da. Jeg bemærker først de store bogstaver i <Konge-Lov> (som på tysk i dag), og at det egentlig burde være uden bindestreg. Men der er også ordet <souveraine> altså <suveræne> på moderne dansk. Det er tydeligvis et ord man har kopieret fra fransk, og som siden har fået en dansk stavemåde.

Her kan man så spørge: Bør man gå tilbage til den franske stavemåde pga. etymologien? Jeg tror ikke at der er mange personer som ville svare “ja” på det spørgsmål. Det leder naturligvis til næste spørgsmål: Hvordan man man så bruge etymologi som en begrundelse for at beholde nuværende stavemåder for andre ord fra fransk? Kan det etymologiske princip kun fungere som en begrundelse for at bevare nuværende stavemåder? I så fald lyder det mere som efterrationelisering end en egentlig begrundelse. Cf. status quo bias og reversal test.

Er der andre ord som ikke har fået ændret sin stavemåde, men som er analoge med eksemplet ovenover? Altså, der skal være tale om en <ou> stavemåde for [u], og <ai> for en [ä], [a], [æ]-agtig lyd.

Lad os se på noget data mht. <ou> for [u] (eller med lang vokal). Man kan se på fx Center for Læseforskning’s Bogstavlyd, en søgning på <ou> giver disse resultater:

[u] [uː] [ʌ] [uˀ] [o]
63 14 11 4 2
67% 15% 12% 4% 2%

Deres symboler er vist i IPA. Men de viser at 67+15+4=86% af ordene udtales med en u-vokal (kort, lang, med stød), og burde staves med <u>. Deres ordliste er:

Ordform Ordklasse Udtale Bogstav:[lyðˀ]
ajour adj. [aɕuɐ̯] a:[a] j:[ɕ] ou:[u] r:[ɐ̯]
blouson sb. [blusʌŋ] b:[b] l:[l] ou:[u] s:[s] o:[ʌ] n:[ŋ]
blousons sb. [blusʌŋs] b:[b] l:[l] ou:[u] s:[s] o:[ʌ] n:[ŋ] s:[s]
boule sb. [bulː] b:[b] ou:[u] le:[lː]
bouquet sb. [bukɛ] b:[b] ou:[u] qu:[k] et:[ɛ]
bouquets sb. [bukɛs] b:[b] ou:[u] qu:[k] et:[ɛ] s:[s]
boutique sb. [butig] b:[b] ou:[u] t:[t] i:[i] que:[g]
clou sb. [klu] c:[k] l:[l] ou:[u]
clous sb. [klus] c:[k] l:[l] ou:[u] s:[s]
coulomb sb. [kulʌŋ] c:[k] ou:[u] l:[l] o:[ʌ] mb:[ŋ]
couscous sb. [kuskus] c:[k] ou:[u] s:[s] c:[k] ou:[u] s:[s]
croupier sb. [kʁupje] c:[k] r:[ʁ] ou:[u] p:[p] i:[j] er:[e]
croupiers sb. [kʁupjes] c:[k] r:[ʁ] ou:[u] p:[p] i:[j] er:[e] s:[s]
crouton sb. [kʁutʌŋ] c:[k] r:[ʁ] ou:[u] t:[t] o:[ʌ] n:[ŋ]
croutons sb. [kʁutʌŋs] c:[k] r:[ʁ] ou:[u] t:[t] o:[ʌ] n:[ŋ] s:[s]
deroute sb. [deʁud] d:[d] e:[e] r:[ʁ] ou:[u] te:[d]
deroutes sb. [deʁuds] d:[d] e:[e] r:[ʁ] ou:[u] te:[d] s:[s]
douce adj. [dus] d:[d] ou:[u] ce:[s]
douch vb. [duɕ] d:[d] ou:[u] ch:[ɕ]
douche vb. [duɕə] d:[d] ou:[u] ch:[ɕ] e:[ə]
douche sb. [duɕ] d:[d] ou:[u] che:[ɕ]
douchen vb., sb. [duɕən] d:[d] ou:[u] ch:[ɕ] e:[ə] n:[n]
douchens sb. [duɕəns] d:[d] ou:[u] ch:[ɕ] e:[ə] n:[n] s:[s]
doucher vb., sb. [duɕʌ] d:[d] ou:[u] ch:[ɕ] er:[ʌ]
douchers sb. [duɕʌs] d:[d] ou:[u] ch:[ɕ] er:[ʌ] s:[s]
douches vb. [duɕəs] d:[d] ou:[u] ch:[ɕ] e:[ə] s:[s]
douchet vb. [duɕəð] d:[d] ou:[u] ch:[ɕ] e:[ə] t:[ð]
fourer sb. [fuʁɛˀɐ̯] f:[f] ou:[u] r:[ʁ] e:[ɛˀ] r:[ɐ̯]
fourers sb. [fuʁɛˀɐ̯s] f:[f] ou:[u] r:[ʁ] e:[ɛˀ] r:[ɐ̯] s:[s]
gouache sb. [guæːɕ] g:[g] ou:[u] a:[æː] che:[ɕ]
gourmand sb. [guɐ̯mɑŋ] g:[g] ou:[u] r:[ɐ̯] m:[m] a:[ɑ] nd:[ŋ]
gourmands sb. [guɐ̯mɑŋs] g:[g] ou:[u] r:[ɐ̯] m:[m] a:[ɑ] nd:[ŋ] s:[s]
gourmet sb. [guɐ̯me] g:[g] ou:[u] r:[ɐ̯] m:[m] et:[e]
gourmets sb. [guɐ̯mes] g:[g] ou:[u] r:[ɐ̯] m:[m] et:[e] s:[s]
gouter vb. [guteˀɐ̯] g:[g] ou:[u] t:[t] e:[eˀ] r:[ɐ̯]
mousse sb. [mus] m:[m] ou:[u] sse:[s]
mousser sb. [musʌ] m:[m] ou:[u] ss:[s] er:[ʌ]
moussers sb. [musʌs] m:[m] ou:[u] ss:[s] er:[ʌ] s:[s]
moustache sb. [musdæːɕ] m:[m] ou:[u] s:[s] t:[d] a:[æː] che:[ɕ]
nougat sb. [nuga] n:[n] ou:[u] g:[g] at:[a]
nougats sb. [nugas] n:[n] ou:[u] g:[g] at:[a] s:[s]
poulard sb. [pulɑˀd] p:[p] ou:[u] l:[l] ar:[ɑˀ] d:[d]
poulards sb. [pulɑˀds] p:[p] ou:[u] l:[l] ar:[ɑˀ] d:[d] s:[s]
retouche sb. [ʁɛtuɕ] r:[ʁ] e:[ɛ] t:[t] ou:[u] che:[ɕ]
rouleau sb. [ʁulo] r:[ʁ] ou:[u] l:[l] eau:[o]
rouleaus sb. [ʁulos] r:[ʁ] ou:[u] l:[l] eau:[o] s:[s]
souper sb. [supe] s:[s] ou:[u] p:[p] er:[e]
souper vb. [supeˀɐ̯] s:[s] ou:[u] p:[p] e:[eˀ] r:[ɐ̯]
soupers sb. [supes] s:[s] ou:[u] p:[p] er:[e] s:[s]
souschef sb. [suɕɛˀf] s:[s] ou:[u] sch:[ɕ] e:[ɛˀ] f:[f]
souschefs sb. [suɕɛˀfs] s:[s] ou:[u] sch:[ɕ] e:[ɛˀ] f:[f] s:[s]
touche sb. [tuɕ] t:[t] ou:[u] che:[ɕ]
touché sb. [tuɕe] t:[t] ou:[u] ch:[ɕ] é:[e]
touchen sb. [tuɕən] t:[t] ou:[u] ch:[ɕ] e:[ə] n:[n]
touchens sb. [tuɕəns] t:[t] ou:[u] ch:[ɕ] e:[ə] n:[n] s:[s]
toucher sb. [tuɕʌ] t:[t] ou:[u] ch:[ɕ] er:[ʌ]
touchers sb. [tuɕʌs] t:[t] ou:[u] ch:[ɕ] er:[ʌ] s:[s]
toupé sb. [tupe] t:[t] ou:[u] p:[p] é:[e]
touper vb. [tupeˀɐ̯] t:[t] ou:[u] p:[p] e:[eˀ] r:[ɐ̯]
toupés sb. [tupes] t:[t] ou:[u] p:[p] é:[e] s:[s]
vermouth sb. [væɐ̯mud] v:[v] e:[æ] r:[ɐ̯] m:[m] ou:[u] th:[d]
vermouths sb. [væɐ̯muds] v:[v] e:[æ] r:[ɐ̯] m:[m] ou:[u] th:[d] s:[s]

Man kan bemærke at der ingen engelske lånekopiord er. Altså, de må klassificere <ou> i fx allround anderledes end dem i kopiordene fra fransk.

Af den årsag kørte jeg min egen søgning på min lidt daterede kopi af retskrivningsordbogen (som ikke indeholder lyddata) vha. mit DAT (Dictionary Analysis Tool)-værktøj. En søgning på <ou> hvor som helst i et ord giver 245 resultater:

accoucheur adoucere ajour ajourføre ajourføring allround allroundviden amourøs anjouvin bijouteri bijouterivarer billedjournalist blackout blouson blousonjakke boucle bouclé boucletæppe bouclétæppe boudoir bougainvillea bouillabaisse bouillon bouillonterning boule boulevard boulevardpresse boulevardteater bouquet bourgeois bourgeoisi bourgogne brisselragout cameroun camerouner camerounsk camouflage camouflagemalet camouflere camouflering chokolademousse civilcourage clou coulomb country country og western country og western-musik countrysanger coupe coupé courage courgette couscous croupier crouton deroute desavouere desavouering discount discountbutik discountuddannelse djibouti djiboutier djiboutisk double doubleton douce douche dropout embouchure fingertouch foulard foulardsilke fourage fouragere fouragering fourer freelancejournalist glamour glamourisere glamourisering glamourøs golden delicious-æble gonzojournalist gonzojournalistik gouache gouda goudaost gourmand gourmet goutere greyhound greyhoundløb groupie handout haute couture hoffourer house housecoat housewarming housewarmingparty jalousi jalousidrama jalousiskab jaloux joule jour jourhavende journal journalføring journalindsigt journalisere journalisering journalist journalistelev journalistik journalistisk journalnummer kartouche kilojoule knockabout knockaboutnummer knockout knockoutbesejre knockoute kompound kompoundmaskine kontoudskrift kontoudtog layout layoute layouter limousine lockout lockoute lounge luxembourg luxembourger luxembourgsk merinould mixed double modejournal mouillere mouillering mountainbike mousse moussere moustache newfoundlænder nougat nougatfarvet nougatis nyreragout ounce out outfit output outreret outrigger outsider outsource outsourcing ouverture ouzo partout partoutkort passepartout patchouli penthouselejlighed petitfour petitjournalist petitjournalistik plusfour plusfours pompadour pompadourhæl postillon d’amour potpourri poulard poussere ragout ragoutfad ratatouille redoute rembours remboursere remoulade rendezvous ressource ressourceforbrug retouche retouchepensel retouchere retouchering retouchør revolverjournalistik rouge rough roulade rouleau roulere roulet roulette roulettere sioux siouxindianer soubrette souffle soufflé soul souljazz soulmusik sound soundtrack souper soupere sousafon souschef soutenør souvenir surroundsound sygejournal thousand island-dressing timeout touch touche touché touchere touchering tough toupe toupé toupere toupering toupet tour de force tournedos tournure tout troubadour velour vermouth voucher whiskysour workout

En hel del af dem af kopiord fra engelsk, som er svære at give en dansk stavemåde. Her kan fx nævnes allround, blackout, workout, soul. Hvordan skulle man skrive [əʊ] på dansk? <åu>? Hvad med [ɑʊ]? <av>? I så fald får man noget i retning af orlravnd, bla(r)kavt, wørkavt, såul. Disse stavemåder er ret dårlige, og man nok beholde de nuværende engelske stavemåder indtil at ordene får en fordansket udtale, måske bortset fra soul hvor såul virker okay efter min mening.

Men der er en hel del franske ord som klart burde have en stavemåde med bare <u>. Dette er allerede inkluderet i Lyddansk i regel O3 som konverterer med ord <ou> og en u-vokel ([u], [u:] o.lign.) til <u>.

Det er, som altid, værd at citere Aage Hansen’s 1969 bog (s. 11):

Det historiske eller etymologiske hensyn ytrer sig ved at man opretholder en skriftform der stammer fra en ældre tid hvor den stemte overens med den da brugte ortografi, simpelthen fordi man ikke har nænnet at ændre den eller påstået at den var af nytte til adskillelse af ordet fra et andet ellers ensskrevet ord. Som eksempler kan nævnes thi og af. Eller formen bevares fordi den skal vise at ordet kommer af det og det, etymologisk hører sammen med de og de ord. Vi har alle fået indterpet i skolen at halvtreds og halvfjerds skal skrives med d men tres uden d fordi de første oprindelig indeholder ordene tredje og fjerde, det sidste ordet tre som der ikke er noget d i. Men mon ikke de fleste, jeg hører selv til dem, trods god skolegang hver gang de skal til at skrive et af disse ord må stanse et øjeblik og tænke sig om: hvordan pokker er’et nu? – Hvorfor skal vi dog have det mas! Et andet eksempel: vi skriver dans(e), krans(e), lanse, sans(e) (hvor man tidligere skrev dands(e) osv.), hvorfor skal vi da skrive standse (lige ovenfor er jeg kommet til at skrive det uden d, gud véd hvor mange der har bemærket det)? Jo, fordi etymologerne mener at ordet vistnok (!) er afledt af stande, en gammel form for stå. Mange andre eksempler vil man finde nedenfor i kapitel III.

Det morfologiske princip vs. det fonetiske princip

Jeg leder konstant efter relativt forskning mht. retskrivningens virkning på læse- og skrive færdigheder. I det henseende er det smart at holde øje med artikler som citerer artikler som omhandler emnet. Fx kikkede jeg på hvilke papers som citerer:

Juul, Holger, and Baldur Sigurdsson. Orthography as a handicap? A direct comparison of spelling acquisition in Danish and Icelandic. Scandinavian Journal of Psychology 46.3 (2005): 263-272

på Google Scholar. Da fandt jeg:

Landerl, Karin, and Pieter Reitsma. Phonological and morphological consistency in the acquisition of vowel duration spelling in Dutch and German. Journal of Experimental Child Psychology 92.4 (2005): 322-344.
Abstract. In Dutch, vowel duration spelling is phonologically consistent but morphologically incon- sistent (e.g., paar–paren). In German, it is phonologically inconsistent but morphologically consistent (e.g., Paar–Paare). Contrasting the two orthographies allowed us to examine the role of phonological and morphological consistency in the acquisition of the same ortho- graphic feature. Dutch and German children in Grades 2 to 4 spelled singular and plural word forms and in a second task identiWed the correct spelling of singular and plural forms of the same nonword. Dutch children were better in word spelling, but German children outper- formed the Dutch children in nonword selection. Also, whereas German children performed on a similar level for singular and plural items, Dutch children showed a large discrepancy. The results indicate that children use phonological and morphological rules from an early age but that the developmental balance between the two sources of information is constrained by the specific orthography. Keywords: Cross-linguistic comparison; Morphology; Vowel spelling; Spelling acquisition

Hvorfor er lige netop denne artikel værd at skrive om? Fordi at det kaster lys over en gammel problemstilling som jeg aldrig har set nogen tidligere undersøge systematisk. Aage Hansen skrev i Om Moderne Dansk Retskrivning i 1969 at:

Dette etymologiske hensyn må ikke forveksles med et
andet: bevarelse af ordstammens skriftform i alle ordets
bøjningsformer og ved afledninger der stadig føles som
hørende til ordet, altså bevarelsen af et fast ordbillede i
alle ordets former, ment som en hjælp ved genkendelsen af
ordet. Altså: man skriver godt med et d der ikke svarer til
noget i udtalen, fordi grundformen er god hvor d er tegn
for lyden 5. Vi skriver hårdt og fandt for at vedligeholde
forbindelsen med hård og finde (i ingen af tilfældene svarer
d til noget i udtalen). Jeg tror mig ikke i stand til at afgøre
hvilken værdi dette identifikationshensyn har, men jeg er
skeptisk. Hvis vi var vant til at skrive god : got (som man for-
øvrigt tidligere gjorde), hård : hårt, finde : fant, mon så be-
vidstheden om formernes sammenhæng var mindre end nu?

Imidlertid er vor retskrivning i den grad præget af dette
hensyn at en simplificering her vil betyde et stort antal
ændringer. Jeg mener at retskrivningsændringer bør ske så
lempeligt som muligt, uden for mange og for store ændringer
på én gang, derfor er jeg betænkelig ved at foreslå en
gennemgående forenkling på dette punkt. Hvor derimod
bevidstheden om det omtalte tilhørighedsforhold er svækket
eller helt forsvundet, er vi ovre i det etymologiske og her
må ændringer være berettiget. Kun ét eksempel: seksten,
en skriftform der står helt alene og uden kontakt med den
tilsvarende udtaleform, og kun opretholdes for at minde os
om at ordet egentlig er en afledning af seks. –

Studiet viser, at børnene bruger det morfologiske princip til at stave efter, og at dette tilsyneladende vægter højere, eller er simplere at bruge, eller bliver lært tidligere end det fonetiske princip. Hvis flere studier kan bekræfte dette, så tyder det jo så på, at man bør beholde det morfologiske princip som vigtigere end det fonetiske i dansk retskrivning. Det har jeg ikke umiddelbart noget problem med, og har heller ikke foreslået nogle ændringer om dette i Lyddansk, netop fordi at der var en mangel på vished om det faktisk ville hjælpe.

Studie: Indsaml fejlrettelsesdata fra Wikipedia

I forbindelse med noget andet jeg var ved at arbejde på, så stødte jeg på et paper: Pfeil, Ulrike, Panayiotis Zaphiris, and Chee Siang Ang. Cultural differences in collaborative authoring of Wikipedia. Journal of Computer‐Mediated Communication 12.1 (2006): 88-113. Selve hoveddelen af artiklen er ikke voldsomt interessant eller særlig overbevisende. Men det deres data gav mig en god ide:

wiki_comparative

Jeg kikkede naturligvis mest på de sproglige, grammar, spelling. Jeg tænker på en tabel fra Foundation literacy acquisition in European orthographies, British Journal of Psychology (2003), 94, 143–174.

foundation lit

Af de fire sprog de har valgt, så er fransk det sværeste if. tabellen, hvorefter at man skulle forvente flere stavefejlrettelser. Derefter hollandsk, og til sidst tysk. Det er præcis den rækkefølge med ser i dataene fra deres lille Wikipedia-studie. Japansk har også en lav stavefejlrettelses%, så spørgsmålet er naturligvis nu: passer det med hvor regulær den japanske retskrivning er? Jeg kikkede lidt omkring på Wikipedia, men kunne ikke umiddelbart finde noget om hvor regulær japansk retskrivning er. Men det er velkendt at de har et besværlig skriftsprog med 3 forskellige systemer af skriftegn.

Derefter gik turen til Google Scholar, hvor man kan finde alt muligt godt.

Hino, Yasushi, et al. “The effects of polysemy for Japanese katakana words.” Reading and Writing 10.3 (1998): 395-424.
Because each katakana character corresponds to a single syllable (mora), katakana is considered to be a shallow orthography which has virtually no spelling-to-sound irregularities. Thus, in terms of the dual-route model, the nonlexical route would be able to produce correct phonological codes for all these words. As noted, according to Balota and Chumbley’s arguments, if both word frequency and polysemy effects are due to lexical selection, both of these effects should not vary in size across tasks in which lexical selec- tion is fully involved. Our use of a completely regular orthography, however, changes those predictions. First of all, with respect to word frequency effects, the cross-task equivalence would not be expected because, as noted, a dual- route analysis suggests that low frequency words often do not require lexical selection. Thus, the expectation is that there would be a smaller frequency effect in naming than in lexical decision. More importantly, with respect to polysemy effects, the cross-task equivalence should hold for high frequency words because, for these words, the lexical route generates phonological codes much faster than the nonlexical route, meaning that the contribution of the nonlexical route to performance in the naming task would be minimal. For low frequency katakana words, however, the expectation would be that the polysemy effect should be smaller in naming than in lexical decision because of the large contribution of the nonlexical route in naming. [min emfase]
Delattre, Marie, Patrick Bonin, and Christopher Barry. “Written spelling to dictation: Sound-to-spelling regularity affects both writing latencies and durations.” Journal of Experimental Psychology: Learning, Memory, and Cognition 32.6 (2006): 1330.
The dual-route model of spelling production (e.g., Ellis, 1982) proposes that two processing systems operate in parallel: a lexical route that retrieves spellings of known words from a memory store of word-specific knowledge and a nonlexical (or assembled) route that generates spellings using a process of sublexical sound-to- spelling conversion. The assembled spelling route would be effi- cient in languages whose orthographies have predictable or con- sistent orthographic-to-phonological correspondences (such as Turkish, Italian, and Japanese kana) but would be considerably less effective for English and French, whose orthographies are characterized by highly inconsistent relationships (e.g., the vowel /i:/ is spelled in many different ways in English words, as in eel, tea, theme, thief, Keith, people, me, key, quay, ski, etc.). There are many irregular and some almost arbitrarily spelled words in En- glish (e.g., pint, yacht) and French (e.g., fraise, monsieur). The lexical route would work for all known words (irrespective of regularity) but could not provide spellings for new words or nonwords. The assembled route would work for nonwords but would often produce phonologically plausible errors (PPEs), par- ticularly to irregular words, such as yacht (YOT) and monsieur (MESSIEU). [min emfase]
Buchanan, Lori, and Derek Besner. “Reading aloud: Evidence for the use of a whole word nonsemantic pathway.Canadian Journal of Experimental Psychology/Revue canadienne de psychologie expérimentale 47.2 (1993): 133.

Reading Japanese Written Japanese consists of three distinct scripts. The logographic Kanji represents content words while the syllabic Kana scripts consist of Hiragana which represents grammatical morphemes and Katakana which represents borrowed words such as television and computer. Both Hiragana and Katakana have very consistent spelling-sound correspondences (i.e., they are shallow scripts). Transcribing a word which normally appears in one Kana script into the other Kana script produces a pseudohomophone, a word that is ortho- graphically unfamiliar at the whole word level but retains its original pronunciation. Since readers must rely entirely on the assembled routine to read such character strings aloud, any evidence of priming for these words is evidence that the use of assembled routine can result in priming. [min emfase]

Altså, uden at kende noget mere til japansk kana (katakana+hiragana), så lader det til at være meget regulært. Så skulle man forvente relativt få rettelser for stavefejl. Det er en skam at japan også bruger kanji, ellers ville deres retskrivning være næsten helt konsistent, hvilket ville få en til at forudsige, at de rettede færre fejl end tyskerne gør. Men deres fejlrettelses%er var ca. ens.

Næste skridt må jo være at kikke på nogle flere Wikipedia-sider for at bekræfte mønstret, og at kikke på andre sprog (især dansk og engelsk). Deres metode kræver dog en del manuelt arbejde, så den er ikke optimal. Måske man kunne forsøge sig med en keyword baseret løsning? Når man laver en rettelse på Wikipedia, så kan man nemlig skrive nogle få ord om hvad ens rettelse gik ud på. Mange som retter stavefejl skriver det nok her, hvilket gør det muligt at måle antal stavefejlrettelser udfra keywords. Det kræver dog stadig at man kan de sprog som man vil undersøge, ellers ved man ikke hvilke keywords man skal søge efter.

At gøre det ovenstående ville dog nødvendiggøre at dataene ikke var sammenlignelige med deres. Deres dataindsamlingsmetode er dårlig (kræver for meget tid), men ideen er god: bruge data fra Wikipedia til at estimere hvor ofte folk retter fejl.

Skal vi følge Dansk Sprognævn, når det ikke følger loven?

Af Henning Bergenholtz. Første gang bragt i Den Korte Avis.

—-

Ansatte, elever og studerende ved offentlige institutioner skal rette sig efter Dansk Sprognævns normeringsafgørelser, når det drejer sig om retstavning. Hvad så “retstavning” dækker, er mere uklart, end man skulle tro, men det kan vi tage op en anden gang.

Når det drejer sig om brug af bindestreger eller ej, er der ikke nogen tvivl om, at det er et retskrivningsanliggende. Her skal man følge Dansk Sprognævn.

Men skal man også det, hvis Dansk Sprognævn har truffet afgørelser, som ikke følger Sprogloven af 1997? Her står der, at man efter traditionsprincippet normalt ikke må ændre i retstavningen, kun hvis gode og sikre sprogbrugere i skriftlige tekster bruger andre stavemåder.

Dansk Sprognævn følger sprogbrugerne … i Dansk Sprognævn

I november 2001 kom der en ny retskrivningsordbog, hvor man for eksempel afskaffede skrivemåden kraftvarmeværk, for i stedet at kræve brug af to bindestreger: kraft-varme-værk.

Jeg søgte dengang på nettet og fandt flere tusinde belæg med det nu forbudte ord uden bindestreger, men kun seks med to bindestreger. Og de var alle fra tekster skrevet af medarbejdere i Dansk Sprognævn.

Man kunne dengang få det indtryk, at Dansk Sprognævn tolkede loven sådan, at de selv var de (få) sikre og gode sprogbrugere. Alle andre, inklusive medarbejderne på kraftvarmeværker, var det ikke. Nu 11 år senere er der stadig ikke mange, der retter sig efter ændringen, heller ikke medarbejderne på kraftvarmeværkerne.

Væk med den normale sprogbrug

Tilsvarende kræver man to bindestreger i cost-benefit-analyse. I Den Danske Regnskabsordbog findes både costbenefitanalyse og cost-benefit-analyse som opslagsord, men brugerne opfordres til at bruge formen uden bindestreger, fordi det svarer til den normale sprogbrug i regnskabstekster.

Samtidig med, at man i tiltagende grad kræver bindestreger i “lange” ord, er de blevet forbudt i kortere ord. Det er fx forkert at skrive ikke-ryger, det skal hedde ikkeryger. Det er forkert at skrive u-land. Det skal skrives uden bindestreg som uland.

Der kommer en ny retskrivningsordbog i år. Mon Dansk Sprognævn går tilbage til loven og selv prøver at rette sig efter den? Så ville sprogbrugerne måske også i højere grad rette sig efter Dansk Sprognævn.

Én eller ét?

Af Henning Bergenholtz. Første gang bragt på Den Korte Avis.

—-

Hvis en person skriver en bord, er det forkert. Det hedder et bord. Hvis vi ser bort fra ærkejyder og indvandrere, har vi danskere ved de allerfleste substantiver ikke problemer og laver ikke fejl.

Eksperter” tager fejl

Når flere læsere i læserbreve til Den Korte Avis, bl.a. Hanne Niebe, Merethe Egeberg Holm, Tommy Frost-Hansen, beklager sig over professorer og andre ”eksperter”, som virker utroværdige, når de bruger en og et i flæng, er jeg enig med læserne. Det er møgirriterende, det er også påfaldende.

For eksempel hørte jeg for nogle måneder siden speakeren i TV2-Nyhederne sige: ”I piratfarvande kan det være en spørgsmål om liv og død.” Men denne fejltype forekommer faktisk ikke ret hyppigt. Vi lægger bare særligt meget mærke til den.

Fremmedord

I andre tilfælde er det måske ikke bare sprogbrugerne, men også den kritiske lytter og læser i tvivl ved en del substantiver, særligt fremmedord og nyord, hvor sprogbrugen varierer. Hvis en ekspert i en tv-udsendelse første gang siger spagnummen, virker det sjusket, når vedkommende næste gang siger spagnummet.

I dette tilfælde er det sådan, at Dansk Sprognævn godtager begge former. Eksperten har ikke lavet en sprogfejl, men bruger sproget usystematisk og forvirrende for lytteren.

1500 substantiver hvor begge dele er tilladt

Sådan er det for knap 1500 danske substantiver, for eksempel cirkus, maraton, kulilte. Her tillades både en og et. Det er fint, at Dansk Sprognævn ikke nøjes med at tillade en cirkus, så enhver brug af et cirkus skulle rettes af læreren eller en korrekturlæser, der vil følge sprogloven.

Kunne Dansk Sprognævn da finde på det? Ja, det kunne de, selvom man må håbe på, at de i den nye udgave af Retskrivningsordbogen, som kommer i november i år, vil rette op på nogle af deres fejl.

Det er for eksempel ikke tilladt at skrive på langt sigt, kun på lang sigt, fordi sigt efter Dansk Sprognævns norm kun kan være fælleskøn. Den forbudte variant giver knap 400.000 hits ved en Google-søgning, den tilladte knap dobbelt så mange.

Et detergent

Det er heller ikke tilladt at skrive en detergent, kun et detergent (kemisk middel, der fjerner kalk i vand og afspænder det, så eksempelvis vaskemidler får lettere ved at gøre tøj eller opvask rent). Og det selvom man i fagtekster og aviser næsten kun finder brug af fælleskøn. Her bør begge køn tillades, både i disse og flere andre tilfælde.

Denne løsning er ikke tilstrækkelig, men den ville rigtignok sørge for, at vi ikke i for høj grad og helt uden grund gøres til et folk af sproglige lovovertrædere.

At tillade alt eller bare mere giver nemlig ikke den hjælp, som en sprogbruger, der kommer i tvivl, har brug for.

Hvis en person kommer i tvivl om, hvorvidt det nu er bedst at skrive en eller et cirkus eller en eller et detergent, bør der oplyses om, at begge former bruges, men at den ene er den almindeligt brugte og derfor anbefales.

Personen kan så vælge at følge anbefalingen, dvs. et cirkus og en detergent.

Det er åndssvagt, at man skal skrive åndsvagt

Af Henning Bergenholtz. Første gang bragt på Den Korte Avis.

—-

Hvis det skulle gå efter det farisæiske café latte-miljø, ville ordet åndssvag for længst være afskaffet. For dette ord kan opfattes som gammeldags og diskriminerende, ikke mindst fordi det også kan bruges som skældsord.

Nej, man skal tale om mennesker, som er født med et psykisk handicap. De kan så, mener farisæerne, kaldes udviklingshæmmede.

Med eller uden fuge-s?

I dette bidrag drejer det sig dog ikke om en kommende afskaffelse af ordet åndssvag, men mere om, at det faktisk allerede er forbudt!

Hvordan det? Jo, det er ikke tilladt af Dansk Sprognævn. Hvis nogen skriver åndssvag, skal en lærer i skolen rette ordet og stryge et s. Og en offentlig ansat må heller ikke skrive åndssvag.

Hvorfor nu det? Inden vi kommer til svaret, vil jeg lige se på et par andre eksempler.

De fleste danske sammensætninger bruger ikke et såkaldt fuge-s. Det hedder solbriller, ikke solsbriller. Derimod hedder det altid afstandsbriller, aldrig afstandbriller.

I nogle tilfælde er begge varianter tilladt

Men ved et par tusind ordsammensætninger viser sprogbrugen, at et ord bruges både med og uden fuge-s. I parentes tilføjer jeg antallet af hits ved en Google-søgning i august 2012:

aluminiumgryde / aluminiumsgryde (284 / 8.110)

aprilvejr / aprilsvejr (37.600 / 7.770)

I disse og mange andre tilfælde tillader Dansk Sprognævn i Retskrivningsordbogen begge varianter.

I andre tilfælde må kun én bruges

Sådan er det ikke altid, undertiden godtages kun en af varianterne, nogle gange med fuge-s, nogle gange uden. Jeg viser igen antallet af hits ved en Google-søgning foretaget i august 2012:

bidragyder / bidragsyder (159.000 / 165.000)

sindsyg / sindssyg (412.000 / 345.000)

I begge tilfælde er de to varianter næsten lige hyppige. Men Dansk Sprognævn godtager kun bidragyder (uden fuge-s) og kun sindssyg (med fuge-s). De to andre varianter er officielt set fejlskrivninger.

Plat og krone

Her kan jeg så forsøge at svare på spørgsmålet: Hvorfor nu det? Jeg aner det ikke, man har vel slået plat og krone i disse to tilfælde. Men hvorfor man så ikke forbyder de sjældnere varianter i de to første tilfælde, er Dansk Sprognævns hemmelighed. Det svarer i hvert fald ikke til sproglovens ånd og bogstav.

Vi kan så komme til åndssvag. Det er nemlig også forbudt at skrive dette ord med dobbelt-s – ifølge Dansk Sprognævn. Hvis vi her ser på mængden af fundne hits ved en Google-søgning, er den relative fordeling som ved sindsyg/sindssyg:

åndsvag / åndssvag (45.300 / 45.700)

Men hvor Dansk Sprognævn foretrækker sindssyg, forbyder det åndssvag. Hertil er der kun at sige: Det er åndssvagt.

Sådan burde man gøre

Man burde i sådanne tilfælde altid tillade begge varianter, så lærere og korrekturlæsere kan bekymre sig om stilistiske fejl og rene systemfejl.

Men fint ville det være, hvis man på samme tid tillod begge varianter og anbefalede brugen af en af dem. Så ville man hjælpe den usikre sprogbruger med et råd uden at gøre alle, der ikke følger rådet, til lovbrydere.