Het gemiddeld verwacht leesniveau is een inschatting van het taalniveau dat een lezer gemiddeld nodig heeft om de tekst te begrijpen. Dit niveau wordt uitgedrukt in het Europees referentiekader voor talen, ook wel CEFR of ERK genoemd. De niveaus lopen van A1 (zeer laag) tot C2 (zeer hoog). Een tekst op B1-niveau is leesbaar voor iemand met een B1-leesvaardigheid — niet andersom.
Een score van B1 in het Webmonitoring-rapport betekent dus: deze tekst verwachten we dat mensen met een B1-leesvaardigheid kunnen begrijpen. Hoe hoger het niveau, hoe kleiner de groep lezers die de tekst zonder moeite kan volgen.
Zijn taalniveaus niet bedoeld voor mensen die een taal leren?
Dat is hoe ze begonnen zijn, ja. Het Europees referentiekader werd in 2001 gepubliceerd en was oorspronkelijk bedoeld voor vreemdetalenonderwijs — om bij te houden hoe goed iemand een andere taal dan zijn moedertaal beheerst. A1 en A2 zijn voor beginners, B1 en B2 voor mensen die zich redelijk kunnen redden, C1 en C2 voor gevorderde gebruikers. In de communicatiewereld is het gebruik echter verbreed: taalniveaus worden nu ook gebruikt als aanduiding voor de complexiteit van teksten zelf. Als we zeggen dat een tekst op B1-niveau geschreven is, bedoelen we daarmee: leesbaar voor mensen die minimaal B1-leesvaardigheid hebben.
En dan zijn er ook nog 1F, 2F, 3F en 4F — wat is dat?
Dat zijn de referentieniveaus uit het Nederlandse onderwijs, ook wel de Meijerink-niveaus genoemd. Ze zijn in 2008 vastgesteld door een commissie onder leiding van Henk Meijerink, op verzoek van het ministerie van Onderwijs, en zijn wettelijk verankerd via de Wet referentieniveaus Nederlandse taal en rekenen (2010). Ze beschrijven wat leerlingen op verschillende momenten in hun schoolloopbaan aan taalvaardigheid moeten beheersen: 1F is het niveau aan het einde van de basisschool. 2F is het niveau aan het einde van vmbo/mbo 2-3 — het maatschappelijk basisniveau. 3F is het niveau aan het einde van havo/mbo 4. 4F is het niveau aan het einde van het vwo.
Wat is de relatie tussen 1F/2F en A2/B1?
De twee systemen zijn apart ontwikkeld maar overlappen in de praktijk aanzienlijk. De CEFR-niveaus zijn voor taalleerders (NT2), de F-niveaus voor moedertaalsprekers (NT1). Anderstaligen die Nederlands als tweede taal leren, moeten B1 behalen voor het Staatsexamen NT2. Dat niveau komt globaal overeen met wat een native speaker rond 2F beheerst. A2 wordt in de communicatiewereld gezien als het niveau van laaggeletterden en mensen in inburgering — vergelijkbaar met 1F in het onderwijs.
Wie zijn eigenlijk laaggeletterden?
Laaggeletterdheid betekent dat iemand moeite heeft met lezen, schrijven of rekenen. Stichting Lezen en Schrijven telt 3,3 miljoen mensen van 16 jaar en ouder in Nederland die laaggeletterd zijn — dat zijn mensen die op of onder 1F/A2-niveau lezen. Dat zijn niet alleen nieuwkomers of anderstaligen. Het gaat ook om mensen die in Nederland zijn geboren en opgegroeid, maar door omstandigheden — leer- of taalproblemen, thuissituatie, onderbroken scholing — nooit een hoger leesniveau hebben bereikt.
Wat zegt B1 dan eigenlijk voor mijn communicatie?
Als jullie consequent op B1-niveau schrijven, is jullie communicatie al goed leesbaar voor het grootste deel van de bevolking: mensen met een vmbo-, havo- of mbo-opleiding. Dat is een enorme stap vooruit ten opzichte van hoe de meeste overheids- en semipublieke organisaties nu schrijven. Maar het bereikt nog niet iedereen. Voor de 3,3 miljoen laaggeletterden, voor nieuwkomers en voor anderstaligen is B1 nog te ingewikkeld. Zij zijn geholpen met teksten op A2-niveau, met korte zinnen, heel gewone woorden en visuele ondersteuning.
Hoe bepaalt Tolkie dit niveau?
Tolkie heeft hier een eigen model voor getraind. Om te kunnen inschatten op welk taalniveau een tekst ligt, is het nodig dat het model de Nederlandse taal door en door kent — niet alleen de grammatica, maar ook welke woorden gewoon zijn en welke zeldzaam of formeel. Daarvoor is gebruikgemaakt van het corpus van GPT-NL: een grote verzameling Nederlandse teksten die ook informatie bevat over woordfrequentie. Zo kan ons model niet alleen kijken naar zinsstructuur, maar ook inschatten hoe vertrouwd de woorden in een tekst zijn voor de gemiddelde lezer. Dit model draait volledig binnen Tolkie — zonder generatieve AI, zonder ChatGPT: betrouwbaar, consistent en veilig in Europa.
