otte og ottende

Et problem for Lyddansk 1 som ændrer stavemåden baseret på vokal, er visse bøjninger. Jeg er stødt på et sådant eksempel: otte /å:tə/ har en skidt stavemåde. Der er dobbeltkonsonantbogstav til et ord med lang vokal, og vokalen er angivet forkert. På LD staves det åtte, men man kunne sagtens tillade åte også, som giver en bedre angivelse, men ikke følger af reglerne. Problemet kommer når man skal til bøjningen ottende /ɔdənə/ if. PNO, men måske nærmere /ɔdnə/. Skal man ændre stavemåden på dette ord så det følges med otte? Det er ikke en ændring som sker på baggrund af reglerne: O med /ɔ/ ændres ikke. Men måske man skulle lave en undtagelse alligevel så morfemet så forbindelsen mellem otte og afledningen ottende holdes tydelig.

Synkoper

En synkope er det som sker i ord som cykel som bøjes til cykler i pluralis. Stavemåden følger ikke altid helt med disse ændringer. Man kunne argumentere for, at det måske ligefrem er en god idé, at beholde stavemåder som er regelmæssige til disse ord. I eksemplet/eksempelet fra før ville stavemåden for cykler altså forblive cykeler.

TO har faktisk allerede en række alternative stavemåder for sådanne ord. Denne praksis bør man blot udvide til at omfatte de ord som den ikke dækker lige nu.

Forfatterne af Dansk Grammatik nævner et par eksempler: eksemplet og eksempler i stedet for eksempelet og eksempeler. Dette er mærkeligt, da dette er en tilladt variant. Måske en ændring siden at de skrev bogen? Som eksempel på hvor som ikke har synkope i stavemåden, men som har i udtalen nævner de tunneltunneler ikke *tunler. På LD ville dette blive tånler hvis man fjerne stumme bogstaver.

Hvor mange ord drejer det sig om? Det er svært at sige, men vi kan gætte lidt. Alle deres eksempler slutter på enten EL eller ER. Sådanne ord kan man jo finde i RetO vha. DAT. I min gennemgang af nogle tilfældige ord som kunne mangle en anden stavemåde, så fandt jeg ikke nogen som gjorde dette. Altså, alle ordene jeg fandt som opfylder betingelserne havde allerede en variant uden stumt E i RetO. Så synkope er åbenbart ikke noget stort problem for TO. Dette er jo godt, da man i så fald ikke skal ændre noget!

Navne og Lyddansk

Stavemåden af navne er nok dem som folk er mest konservative med. Derfor finder man stadig folk som hedder Schou til efternavn, som er en gammel tysk-agtig stavemåde for Skov, som folk også hedder. Ja, begge efternavne er faktisk i stigning if. Danmarks Statistiks Navnestatistik, hhv. 3.808 til 3.827 (+19) og 7.496 til 7.552 (+56). Heldigvis er den gode stavemåde mest udbredt, og den spreder sig også hurtigere.

Grunden til at efternavne forbliver uændrede er, at folk arver dem, og hvis man i så fald ændrede dem, så ville det ikke passe med resten af familien. Så, man kan enten vælge at stave det anderledes end resten af familien, eller måske forsøge at ændre navnene på alle i familien på en gang. Der er jo en grund til at man ændrer stavemåderne til noget som giver mening, nemlig den, at så kan folk faktisk stave til ens navn. De fleste danskere er nok bekendt med en eller anden som har et efternavn som er svært muligt at stave til, ikke fordi at det er specielt udenlandsk, men bare fordi at det har en obskur stavemåde.

Denne forklaring virker dog kun for efternavne (disse arves), og ikke for fornavne. Men også her finder man en række andre stavemåder.

Pigenavne

Her ses top 20 pigenavne:

1 Anne 47.466
2 Kirsten 45.268
3 Hanne 40.595
4 Mette 39.225
5 Anna 36.001
6 Helle 34.665
7 Susanne 31.949
8 Lene 31.617
9 Maria 28.183
10 Karen 28.063
11 Inge 27.946
12 Marianne 27.689
13 Lone 26.001
14 Bente 25.664
15 Camilla 24.705
16 Pia 24.605
17 Inger 24.458
18 Jette 24.207
19 Charlotte 23.911
20 Louise 23.881

 

Camilla kan også staves med K, altså Kamilla. En stavemåde som er bedre. Fordelingen er 24.705 vs. 3.371.

Man kunne forestille sig, at nogen har rettet stavemåden på Charlotte til noget som giver mere mening, dvs. Sjarlotte. Men et opslag viser, at der er <3 som hedder dette.

Louise kunne man godt stave uden enten O eller U (alt efter hvilken vokal man ønsker udtalt). Standard stavemåden har 23.881, mens Loise nøjes med 36, og Luise har 635.

Nogle af disse navne hvor vokalen er /æ/ men stavemåden er E. I Lyddansk ville disse blive ændret til at staves med Æ. Dette er måske ikke alt for smart, nu hvor man er meget internationale. Navnene er: Mette, Helle, Bente, Jette. En søgning på en variant af disse giver 3, <3, <3, <3 resultater, hhv.

Til sidst er er navnet Inger som jo har en /e/ vokal, og derfor burde skrives Enger. Men en søgning giver 0 resultater. I kontrast, så staves de nærliggende navneord Eng (en slags græsområde) og England (et land) med E.

Drengenavne

Top 20 drengenavne er:

 

1 Jens 50.697
2 Peter 50.336
3 Lars 46.209
4 Michael 45.617
5 Henrik 43.258
6 Søren 42.498
7 Thomas 42.258
8 Niels 40.048
9 Jan 39.639
10 Jørgen 38.145
11 Hans 38.062
12 Christian 37.318
13 Martin 37.291
14 Anders 34.987
15 Morten 34.423
16 Jesper 34.307
17 Ole 34.130
18 Per 33.613
19 Erik 32.885
20 Mads 30.277

 

Her er en række navne som ville blive stavet anderledes på Lyddansk.

Navne med CH og /k/ som Michael og Christian findes også i alternative og bedre udgaver. Hhv. Mikael og Kristian, med 5.381 (-17) og 16.566 (-83).

Stumt H er nærliggende at se på, og findes i navnet Thomas. Her er den åbenlyse forbedring Tomas som har 1.012 (+14).

Niels udtales /’nels/ hvorfor at stavemåden Nels er optimal. Alternativt så bruges også Nils. Denne er vel marginalt bedre da den ikke har dobbelt angivelse af en vokal, men i stedet har den beholdt det forkerte bogstav. Disse to stavemåder har hhv. 149 (0) og 2.320 (-16).

Mads har et stumt D som dog ikke bliver rettet i Lyddansk 1, men hvis man bare sletter dem, så virker stavemåden Mas optimal. Denne har dog <3.

Ligesom med pigenavnene, så er der et par navne med E som udtales /æ/: Jens, Henrik, Jesper. Disse kunne ændres til at have Æ. Alle tre har <3.

Til sidst er der to navne med I som udtales med /ä/ nemlig Henrik, Christian. Alt efter hvad man synes, at man skal gøre med denne vokal, så får man enten versioner med E eller Æ. Jeg foretrækker E. Alle varianter af Henrik har <3, mens at Krestian har 46 (-3) og Chrestian har 4 (+1). Versioner med Æ har <3.

Efternavne

Top 20 efternavne er:

1 Jensen 268.346
2 Nielsen 267.030
3 Hansen 223.478
4 Pedersen 168.268
5 Andersen 162.563
6 Christensen 122.199
7 Larsen 119.299
8 Sørensen 114.366
9 Rasmussen 96.958
10 Jørgensen 90.695
11 Petersen 82.195
12 Madsen 65.686
13 Kristensen 61.623
14 Olsen 49.522
15 Thomsen 39.557
16 Christiansen 37.763
17 Poulsen 32.667
18 Johansen 31.702
19 Møller 30.357
20 Knudsen 30.019

 

Mange af disse kan rettes på samme måde som deres beslægtede fornavne. -sen i de danske efternavne betyder blot “søn” Altså, Petersen = søn af Peter. Disse stammer fra dengang at staten besluttede sig for, at nu skulle alle have et efternavn. Disse kaldes derfor for patronymer, eller som Familiestyrelsen kalder dem med redundans “patronymnavne” – fader-navne-navne.

Tomsen har 46 (+2), Krestensen 15 (-1), Krestiansen <3 (0), Masen <3 (0), Povlsen 1.609 (-3), Knusen <3 (0), Nilsen 198 (+6), Nelsen <3 (0), Jænsen <3.

Specifikke navne som ikke er nævnt tidligere

Af og til støder jeg på en ny stavemåde for et navn som jeg ikke tidligere har set. Jeg vil i fremtiden forsøge at notere dem nedenunder.

 

Laura 14.648 (+518) – Lavra 5 (+1)

Mikkel 26.481 (+508) – Mekkel 3 (+3)

Jacob 19.701 (+83) – Jakob 15.868 (+101)

En anekdote om glemsel

I dag oplevede jeg, at jeg simpelthen ikke kunne huske stavemåden på et dansk ord som jeg normalt ville kunne stave nemt. Det skete ved, at jeg så Facebook så, at min mor havde brugt den lyddanske stavemåde sjangse som passer mere eller mindre perfekt med mønstrene i dansk retskrivning. Jeg vidste godt, at dette ikke var den samme som den i RetO, men jeg kunne simpelthen ikke huske den normale. Jeg blev faktisk nødt til at oversætte det engelske ord chance i en ordbog for at få TO stavemåden. Denne giver jo heller ikke så meget mening, så den er svær at huske. Dette er nemlig problemet, men skal huske stavemåden uafhængigt af ordet. Jeg kunne jo godt huske udtalen, bare ikke stavemåden.

Ord som har to ens bogstaver ved siden af hinanden som udtales forskelligt

Jeg er ved at læse en mere eller mindre tilfældig bog (Sproget – Hverdagens mirakel af Hans Arndt – HA) om lingvistik. Tilfældigheden er, at den anbefales til dem som gerne vil læse noget mere om lingvistik før at de starter på lingvistikstudiet. Jeg fandt en brugt kopi for 50 dkk, og tænkte “hvorfor ikke?”. På side 15 skriver HA

Sprogrigtighed

Dansk Sprognævn rådgiver (bl.a. i Retskrivningsordbogen) om hvad der er godt dansk. Det gør de ved at registrere hvad gode sprogbrugere gør. Jeg må indrømme at jeg ikke i alle tilfælde følger deres råd. Fx skriver jeg Du og Dig med stort – det er i overensstemmelse med almindelig praksis for tiltaleformer som De, Dem, og I (men af forskellige grunde ikke jer), og i ældre sprog Eder. Desuden skriver jeg sukces og akceptere – c udtales på to forskellige måder (som k eller s), på dansk, men at have de to ved siden af hinanden forekommer mig uheldigt. Jeg følger stort set principperne fra enhedskommatering som de er udstukket af Dansk Sprognævn, men afviger på nogle punkter hvor jeg mener at en anden kommatering letter læsningen. Endelig sætter jeg ikke punktum efter småforkortelser som dvs, osv og evt – det kan undertiden forstyrre tydeligheden at et punktum ikke er et punktum. Jeg håbe min læser vil tilgive mig disse (u)vanner, såvel som de trykfejl eller stavefejl som utvivlsomt også er blevet tilbage.

Inden vi kommer til hovedemnet, så vil jeg da lige bemærke, at jeg er stærkt uenig i hans undskyldende måde at bryde med standarden på. Denne attitude er nødt til at stoppe! Der er intet helligt eller specielt ved standarden som den er i dag.

Mht. hans ræsonnering, ja det er jo svært at være uenig, og når bogstaverne står lige ved siden af hinanden så er det særligt tydeligt. Jeg bemærkede da også dette i Lyddansk essayet i en fodnode

[cancer er] I øvrigt et eksempel på et ord hvor det går helt galt da C et sted udtrykker [k] og et andet sted [s] i samme ord, et andet eksempel er TO accent [ɑksaŋ] (p. 44)

Tidligere på siden diskuterede jeg også ord med dobbelt initialt UU, men lad os se på problemet helt generelt. Ved hjælp af DAT er det jo relativt let at finde alle ord som har det samme bogstav to gange i træk. At sortere disse for ord som også har disse to bogstaver med forskellige lyde, er et større arbejde, selv hvis jeg havde adgang til en ordbog med lyddata. Politikens Nydansk ordbog har ganske rigtigt lyddata, men deres datafil er ikke åben, så jeg kan ikke lave noget software som graver de rigtige data frem. En skam!

A

Der er ikke så mange ord, 12, med dobbelt A, og ingen af disse ser ud til at have forskellige lyde, medmindre at vi altså betragter stumhed som en lyd. Disse ord er enten sammensatte fx extraarbejder /ægstrɑ ɑ:bajdɔ/ eller har et stumt A som angiver vokallængde fx afrikaans /ɑfrikɑ:ns/.

B

Der er en del ord, 200, med dobbelt B en hel del af dem baseret på dobbelt og kobber. kobber er jo særligt interessant da B’erne her er associeret med lyden /w/ i stedet for /b/ som er standardlyden. Der er et par ord hvor B nogle gange udtales /w/ typisk nævnes pibe, skib, købe. Jeg fandt ikke et ord som havde to forskellige lyde med de to B’er.

C

Lidt færre ord end B, 83, men stadig en del. Her findes et stort antal ord som har C med to forskellige lyde, og en masse ord som ikke har. I første kategori finder man acceleration /ɑg’sælərɑ’sjon/, accept /ɑg’sæbt/, accent /ɑg’sɑŋ/. I anden kategori finder man ord som broccoli, piccolo, toccata, alle med lyden /g/. Der er også en underkategori af første kategori. Her finder man ord som har C med to forskellige lyde, men på en helt absurd måde, fx boccia /bɔdsja/, capriccio /kɑ’pridsjo/ hvor C angiver lyden /d/. Øh. Disse ord er relativt få og ser ud til at komme fra italiensk.

D

Her er der mange ord, 614. Alt for mange til at gennemgå. Der er en del ord hvor DD angiver /d/ fx addere /a’deɔ/ eller /ð/ som i vædde /vædə/ og nogle hvor DD angiver /ðd/ fx sammensatte bløddyr /bløðdyr/. Jeg kunne ikke finde et ord som ikke var sammensat og havde to forskellige lyde. Om HA vil inkludere sammensatte ord ved jeg ikke. Formentlig ikke.

E

172 ord. Alle ordene ser ud til at være sammensatte fx typeenhed eller engelske låneord som weekend.

F

468 ord. Ord med dobbelt FF er interessante mht. HA’s idé. af alene udtales jo bare /a/, men i sammensætningen er udtalen /ɑv/, en anden A-vokal samt en ekstra konsonant. En typisk ord er nok affald /ɑv’fal/. En hel del andre ord har bare FF med lyden /f/, fx kaffe /kɑfə/.

G

640 ord. Alle ord har vistnok GG som /g/ fx hygge /hygə/. Nogle af dem er sammensatte. Det mest anormale jeg spottede var glægg som er det eneste ord i RetO med GG i slutposition.

H

9 ord. De fleste af dem forkortelser, fx hhv. Et ord opfylder vores kriterie, men det er et låneord fra engelsk highhat /hɑjhat/.

I

19 ord. Nogle af dem sammensatte fx biindtægt, andre med en enkelt lyd /i/ fx Hawaii nogle med en gentaget lyd /ii/ fx shiisme /sji’ismə/.

J

Ingen ord.

K

1240 ord. Næsten alle af dem med lyden /g/ fx nikke, nogle få med lyden /k/ fx okkult /o’kult/ el. /ɔ’kult/. Måske findes der nogle få ord med /gk/. Dette er muligt hvis ordet består af to dele. En del som slutter på /g/ med et K, og en del som starter på K med /k/. Jeg ledte efter et men fandt ikke et.

L

2043 ord. Langt de fleste med LL som /l/, men minimum et ord skiller sig ud billard /biljɑ:d/.

M

1526 ord. Alle med /m/, tror jeg. Fx amme.

N

684 ord. Alle med /n/, tror jeg. Fx danne.

O

99 ord. Der er lidt af hvert. Nogle af dem er sammensatte fx autoophug. Nogle engelske låneord fx look. Nogle har /oå/ fx koordinere /koådi’neɔ/ if. PNO, men jeg tror nu at mange udtaler det /kɔdi’nere/. Nogle har /oo/ fx zoologi /soolo’gi/ if. PNO, men jeg tror at mange udtaler det lignende engelsk dvs. /su:lo’gi/.

P

691 ord. Vistnok alle med lyden /b/ fx oppe.

Q

Ingen ord.

R

726 ord. Lidt forskellige udtalelser. Svært at kategoriere, da lydskriften ikke klarer opgaven alt for godt. Jeg fandt ikke lige noget ord som klart har to forskellige lyde.

S

1637 ord. Ser alle sammen ud til at have /s/ fx masse.

T

1546 ord. De fleste har /d/ satte nogle /t/ fx brutto, men nogle sammensatte har andre ting fx /ŋt/ i accenttegn.

U

28 ord. Nogle har lang vokal /u:/ fx Nuuk. Nogle sammensatte har /uu/ fx uudtalt, andre har /uå/ fx uundgåelig. Nogle har /uå/ if. PNO fx vakuum, men jeg tror nu ikke at folk udtaler det sådan. Folk siger nok nærmere /vɑkum/ el. /vɑkåm/. Men annuum udtales nok /anuåm/ af de fleste. Vil HA skrive dette som annuåm?

V

44 ord. Alle sammen enten sammensatte eller forkortelser (vvs). Nogle af sammensætningerne har /vv/ fx livvagt, andre har /wv/ fx havvand.

W

Ingen ord.

X

Ingen ord.

Y

Ingen ord.

Z

33 ord. Nogle af dem har /s/ fx jazz, andre har /ts/ fx pizza. Dette kan HA da umuligt være tilfreds med. Vil han gå hele vejen og skrive pitsa (som i Lyddansk!) eller nøjes han med at rette et bogstav og få pitza?

Æ

Ingen ord.

Ø

Ingen ord.

Å

Ingen ord.

jeg, jaj, ja, /a/, og /jɑ/

I Lyddansk 1 blev stavemåden af jeg ændret til jaj. Denne stavemåde er bedre end den forrige, men stadig ikke helt optimal. Hvorfor? Fordi at slutposition /j/ sjældent udtales, og ordet derfor udtales /jɑ/ i stedet for udtalen /jɑj/ som skrivemåden lægger op til. Man kunne godt ændre stavemåden til ja, men det ville helt sikkert skabe en masse forvirring med det meget anvendte ord ja, som ikke udtales /jɑ/, men i stedet /ja/.
Den bedste løsning ville være at indføre to forskellige bogstaver for vokalerne /a/ og /ɑ/, men dette blev ikke gjort i Lyddansk 1. Dette kunne man godt gøre i Lyddansk 2, en lidt mere videregående reform end Lyddansk 1 som jeg har gået og tænkt på at skrive noget om.
Lige nu må stavemåden forblive ved jaj da dette er det bedste af de nuværende muligheder.

Angivelse af /e/ i nonstandard position

En mindre detalje i dansk retskrivning er angivelsen af /e/ (som i ble) i ord hvor man normalt ville udtale det som /ə/ (som i høne). Det drejer sig bl.a. om en række ord som slutter på -e eller -é i TO. Siden at disse er angivet til é i RetO, så er det nemt at finde dem med DAT. En søgning på é finder dem alle. Der er 126 som slutter på -é i RetO:

allé andenklasseskupé armé armékorps attaché attachétaske autodafé bogcafé bouclé bouclétæppe café café au lait caféteater cendré centralkomité chargé d’affaires chassé chaussé chaussésten composé coupé diaré diarré diatomé dommerkomité dragé dublé eksekutivkomité eksposé entré entrébillet entrédør envoyé epopé farmakopé fragilité frikassé frisé frisésalat frotté frottéhåndklæde førsteklasseskupé gelé geléagtig glacéhandske gonoré gonorré gulddublé guldlamé handelsattaché idé idéassociation idéforladt idéhistorie kamé kanapé karré kliché klichéanstalt klichéfyldt komité komitémedlem kommuniké koncertturné kulturattaché kupé lamé lamékjole lammefrikassé livré livréklædt manér manérlig marineattaché maté matiné militærattaché moiré mortér mortérgranat moské negligé odyssé orkidé papmaché paré passé paté piké piqué plissé portepé praliné presseattaché protegé puré purésigte renommé resumé ribsgelé rosé rosévin rygekupé rygerkupé rønnebærgelé sekspersonerskupé soiré soufflé stillekupé sølvlamé timoté timotégræs tomatpuré touché toupé tracé traké turné turnéteater umanérlig varieté varietéstjerne vingelé visér visérlinje wengé

Det ser ud til at være en samling ord som kommer fra fransk.

Men der mangler nogle ord. Det drejer sig om ord som ikke slutter på /e/. Det er ord som system. Efter normale lydangivelsesmønstre, så burde dette jo udtales /’systəm/ eller /’sysdəm/. Men det gør det ikke. Det udtales /sys’dem/ eller /sys’tem/. Der er ingen måde at vide, at trykket ligger på sidste stavelse og e’et i sidste stavelse ikke udtales /ə/ som det jo normalt gør.

Jeg er ikke klar over hvor mange andre af sådanne ord som findes. En søgning på -em giver 165 resultater. Men jeg ved ikke om de alle slutter på -em. Nogle af dem slutter måske på -en? Jeg skimmede listen med 165 ord og fandt et par stykker til:

diadem eksem emblem fonem grafem ibidem item morfem poem problem system ødem

Det ser ud til at være en række ord som kommer fra græsk.

Man kunne også skimme listen med ord på -en, men denne indeholder ~1200 ord! Her er et par eksempler:

almen allergen antigen arsen athen autogen

Ser igen ud til at være en række ord fra græsk, især eller kun med endelsen -gen. Begrænser man søgningen til -gen, så er der 126 ord. Egentligt er det diskuterbart om disse overhovedet tæller. Nogle af dem er jo bare et sammensat navneord med gen (biologi). Andre af dem er ikke.

Løsning?
Den nemme løsning er jo blot at udvide den allerede eksisterende løsning med at bruge é/É til at angive en alternativ udtale ifht. standard lydangivelsesmønster. I så fald får man resultater som idé problém systém. Dette er med et normalt dansk keyboard layout ret irriterende at skrive. Men løsningen er nem. Man kan blot bruge ALTGR+E±SHIFT til at skrive hhv. é/É.

Men hvordan skal man så skrive € (eurotegnet)? Med ALTGR+5. Hvis man prøver begge dele på sit keyboard, så vil man opdage at dette tegn er bundet til to forskellige kombinationer. Meget underligt. Typisk viser keyboardet dog kun tegnet på E-tasten. Mig bekendt er der ikke andre tegn som kan laves på flere forskellige måder hvis man ser bort fra numpad samt at bruge forskellige SHIFT-taster.

Lyddansk og U- præfikset

En ting som jeg lige lagde mærke til. I TO støder man nogle gange ind i ord som bare er trælse at skrive og læse. En sådan slags ord er ord som starter med to U’er i træk, fx uundgåeligt. Sådanne ord dannes typisk vha. præfikset u- som er et af de mange danske negationspræfikser. Dette resulterer i ord som de ovenstående. Det værste ved sådanne ord, er at de to U’er lige ved siden af hinanden er associeret med forskellige vokaler! I ovenstående tilfælde /u/ og /å/. I Lyddansk 1.0 laves det andet U om til Å og således uåndgår man de indledende dobbelte U’er. Ordet bliver da til uåndgåeligt. Et andet ord er uundværlig, som bliver ændret til uåndværlig.