Noen ganger blir diftonger (også kalt tvelyder) beskrevet som «sammensetning av to monoftonger i én stavelse». En slik definisjon blir upresis. Når vi ser (eller lytter) nøyere på diftonger, ser vi at det på vei fra den første vokalen til den avsluttende vokalen ofte forekommer flere andre vokaler. Vi kan altså kalle det en glidelyd. Ta for eksempel uttalen av den norske diftongen [æ͜ʉ]. Den kan beskrives som en glidende overgang mellom lydeneː [æ→œ→ø→u]. Vi kan også si at diftongene er som en lang vokal som slutter et annet sted enn hvor den begynner.

Norsk har tre ordinære diftonger [æ͜ɪ], [œ͜ʏ] og [æ͜u]. I tillegg har vi fire diftonger som hovedsakelig forekommer i fremmedord, nemlig [ɑ͜ɪ], [ɛ͜ɪ], [ɔ͜ʏ] og [u͜ʏ]. Lange vokaler kan også ha diftongisert uttale. Alle de norske diftongene er såkalte fallende diftonger, hvor åpningen i munnens hulrom er større i starten av diftongen, og mindre i slutten. Uttalen av diftongen har større intensitet (lydvolum) i begynnelsen enn til slutt.

Hoveddiftongene er beskrevet i egne oppslag. Her er en beskrivelse av de perifere diftongene:

[ɛ͜ɪ]
[ɛ͜ɪ] som i ordene deit, mail. I det sentrale østlandsområdet forekommer denne diftongen bare i låneord.

[ɔ͜ʏ]
[ɔ͜ʏ] som i ordene koie, boikott og soya. [ɔ͜ʏ] glir fra [ɔ] til [ʏ]. I samme posisjon kan vi også ha lydsammensetningen [ɔjː], især foran lyden [ə]. I det sentrale østlandsområdet forekommer denne diftongen bare i låneord.

[ʉ͜ɪ]
[ʉ͜ɪ] som i ordet huie. I samme posisjon kan vi også ha diftongen [u͜ɪ].