Rijke neurale fantasie

21 december 2017

Ging het in de vorige aflevering om een purse die voor nurse werd aangezien, vandaag kijk ik naar een soortgelijk voorbeeld waarin een neuraal netwerk er een in menselijke ogen nogal aparte manier van ‘denken’ op na blijkt te houden.

Tot vandaag figureerde op mijn website de volgende zin:

Er is niet, zoals in Frankrijk, de VS en het VK, een disctrictenstelsel, waarbij per district maar één vertegenwoordiger in het parlement komt.

Ik wil die samenvatting ook het Duits hebben, en omdat Duits schrijven voor mij erg vermoeiend is (kleine woordenschat, moet veel opzoeken, twijfel dan nog steeds) laat ik me weer assisteren door DeepL. Die maakt ervan:

Es gibt nicht, wie in Frankreich, den USA und Großbritannien, ein distriktbasiertes Sanktionssystem mit nur einem Vertreter pro Distrikt im Parlament.

Sanktionssystem”? Hoe komt-ie daar nou toch bij? Dit gaat helemaal niet over sancties, maar over verkiezingen en volksvertegenwoordigers. Wat stond er dan in de kennelijk gebruikte tussentaal Engels? Dit:

There is not, as in France, the US and the UK, a district-based system of sanctions, with only one representative per district in parliament.

Raadselachtig. Pas na een hele tijd staren zag ik het: ik heb indertijd een tikfout gemaakt en geen goede spellingscontrole gedaan. (En er stond nog een tikfout in het artikeltje: “regeringbeleid” moet natuurlijk ‘regeringsbeleid’ zijn.) Ik had staan: “disctrictenstelsel” in plaats van ‘districtenstelsel’.

Na verbetering van de tikfout wordt de Duitse vertaling meteen heel anders en veel beter:

Es gibt nicht, wie in Frankreich, den USA und Großbritannien, ein distriktbasiertes Sanktionssystem mit nur einem Vertreter pro Distrikt im Parlament.

verandert in:

Es gibt kein Distriktsystem, wie in Frankreich, den USA und Großbritannien, mit nur einem Vertreter pro Distrikt im Parlament.

Wat doet een menselijke vertaler met zo’n foutje? Ze zouden niet moeten voorkomen, maar doen dat in de praktijk wel. De menselijke vertaler ziet de fout vaak niet eens, want leest begrijpend, en vertaalt niet wat er staat maar wat ongetwijfeld bedoeld was. Of zhij ziet de fout wel, maar negeert die stilzwijgend: een vertaler wordt betaald om het origineel te vertalen, niet om het ook nog te proeflezen.

Het komt voor dat de fout belangrijk is, bijvoorbeeld een gevaarlijk misverstand kan wekken. Dan, en ook als ik over die zin of alinea toch al iets anders had op te merken, maak ik melding in een lijstje dat ik achteraf bij de vertaling inlever. Desgewenst kunnen de tekstschrijvers er hun voordeel mee doen. Ook komt het voor dat wat er feitelijk staat, ook juist zou kunnen zijn, hoewel het minder waarschijnlijk is. Of beide interpretaties zijn even goed mogelijk. Dan vraag ik tijdens het vertalen al na of mijn aanname juist is. Vaak komt er antwoord. Soms niet. Dat is raar.

Wat ik als vertaler in elk geval niet doe, is gaan dagdromen over associaties die het verkeerd geschreven woord bij me oproept. DeepL doet dat wel. Dat blijkt als ik het goede en foute woord apart aanbied: “Districtenstelsel. Disctrictenstelsel.” wordt in het Engels “District system. Disciplinary system.

Dus wat er bij DeepL kennelijk is misgegaan, is dat de lettercombinatie “disc” in het fout gespelde “disctrictenstelsel” hem doet denken aan ‘discipline’ en aanverwante woorden. Dus dan vertaalt hij dat maar. Als mens vind ik dat raar, de associatie met het correcte woord ‘district’ is immers veel sterker en die met ‘discipline’ zo zwak dat ik die dus in eerste instantie helemaal niet zag.

Maar ja, DeepL is dan ook geen mens, ook al zijn zijn neurale netwerken en deep learning-technieken wel afgekeken van wat we denken te weten over het functioneren van de menselijke hersenen. Tekenend is trouwens wat daar in de Wikipedia onder het kopje Errors vermeld staat:

Some deep learning architectures display problematic behaviors, such as confidently classifying unrecognizable images as belonging to a familiar category of ordinary images and misclassifying minuscule perturbations of correctly classified images.

Inderdaad, een minuscule verandering, en er dan opeens iets heel anders van maken, dat is aan de hand bij nurse i.p.v. purse, bij het toevoegen of weglaten van een punt achter een woord, en bij ‘discipline’ voor ‘disctrict’.