Taal analyseren om belanghebbenden te identificeren

Het gebruik van kunstmatige intelligentie in openbare raadplegingsprocessen zou de deelname aan regelgeving kunnen vergroten.

Overleg met het publiek wordt algemeen erkend als een instrument om deelname aan regelgeving te waarborgen en tegelijkertijd de legitimiteit en het vertrouwen in regelgevende instanties te vergroten.

Veel deskundigen hebben al besproken hoe de deelname van belanghebbenden aan de raadpleging kan worden verbeterd, een resultaat dat niet automatisch volgt op het formeel openstellen van raadplegingen voor iedereen. Tegelijkertijd is het nog steeds onderwerp van discussie, zowel in Europa als in de Verenigde Staten, hoe gemarginaliseerde groepen – doorgaans burgers en kleine bedrijven – een stem kunnen geven. Bekende benaderingen om met dit laatste probleem om te gaan, zijn onder meer het gebruik van e-consultaties, meerdere consultatiemethoden en op maat gemaakte consultatiedocumenten.

Maar onlangs heeft een nieuwe vraag het wetenschappelijke debat aangewakkerd: moeten regelgevende instanties rekenhulpmiddelen gebruiken om de deelname aan raadplegingen te vergroten? Sommige overheidsfunctionarissen maken inderdaad al gebruik van kunstmatige intelligentie (AI) om opmerkingen in overleg te verwerken en te analyseren.

De Europese Commissie laat in dit opzicht een gemengde houding zien. Enerzijds gebruikt het tekstverwerkingstechnologieën zoals Atlas.ti om opmerkingen te analyseren die zijn verzameld in overleg met een groot aantal deelnemers. Anderzijds bevat de Better Regulation Toolbox 2021 van de Commissie aanbevelingen om alleen data-analysesoftware, zoals STATA of NVio, te gebruiken om het bestaan ​​van georganiseerde belangen vast te stellen.

Computerhulpmiddelen kunnen instanties helpen bij het oplossen van problemen die worden gepresenteerd door massale opmerkingen, zoals gesuggereerd door de Administratieve Conferentie van de Verenigde Staten (ACUS). Technologie kan bijvoorbeeld identieke opmerkingen ontdubbelen. Bovendien moeten automatisch door de computer gegenereerde opmerkingen mogelijk worden gemarkeerd en apart van andere opmerkingen worden opgeslagen, wat regelgevende instanties kunnen bereiken met AI om veel tijd en middelen te besparen. Tegelijkertijd kunnen deze systemen echter soms automatisch massale opmerkingen uitsluiten of ze als één enkele opmerking beschouwen, wat een verkeerde voorstelling kan geven van het niveau van publieke steun achter de opmerkingen.

AI-tools kunnen ook de participatie van het publiek in overleg via sociale media vergroten. ACUS raadt regelgevende instanties aan extra voorzichtig te zijn bij het gebruik van sociale-mediaplatforms om opmerkingen van leken te verzamelen. Hoewel verhalen van burgers details toevoegen aan het regelgevende discours, zijn ze moeilijk te assimileren met de bestuurlijke, rationele taal die wordt gebruikt door besluitvormers, en ze vertalen zich zelden naar input voor het regelgevingsproces. Volgens de Europese Rekenkamer kan deze uitkomst gevoelens van vervreemding opwekken bij burgers, die bang zijn genegeerd te worden door regelgevers.

Tegen deze achtergrond is er een ander belangrijk en onderontwikkeld gebied waar computerhulpmiddelen de participatie zouden kunnen verbeteren: identificatie van belangengroepen.

Op taal gebaseerde computerhulpmiddelen kunnen helpen bij het identificeren van belangengroepen en het geven van een stem aan gemarginaliseerde groepen. Leden van deze groepen nemen deel aan consultaties door middel van documenten en verhalen die worden gedigitaliseerd, die vervolgens kunnen worden geanalyseerd met hulpmiddelen zoals natuurlijke taalverwerking (NLP), waarmee computers spraak kunnen herkennen en analyseren.

In een recent artikel hebben mijn co-auteurs en ik de haalbaarheid aangetoond van het gebruik van NLP-technieken om clusters van groepen belanghebbenden te helpen creëren in consultatieprocessen op basis van semantiek – dat wil zeggen, de manier waarop groepen sleutelwoorden en uitdrukkingen begrijpen en gebruiken die verband houden met een gegeven beleid. We noemen dit proces “taalgebaseerde stakeholderclustering” (LBSC).

LBSC kan taalkundige hulpmiddelen op verschillende manieren gebruiken om belanghebbenden te identificeren. Woordinbedding is bijvoorbeeld een hulpmiddel dat de semantische waarde van verschillende woorden in een tekst berekent en groepen maakt op basis van het gedeelde begrip van mensen over de betekenis van woorden. Onderwerpmodellering is een andere techniek die de frequentie en het patroon van woorden in een tekst scant en groepen maakt op basis van gedeelde onderwerpen. Een andere techniek, sentimentanalyse, kan tekst ontleden en vervolgens groepen maken op basis van gedeelde meningen, voorkeuren en gevoelens van mensen over een onderwerp.

Taalkundige analyse van de antwoorden van mensen op raadplegingen biedt verschillende voordelen. Deze nieuwe methodologie vergroot niet alleen het empirische bewijs dat regelgevers tot hun beschikking hebben, maar kan ook helpen om barrières voor deelname te overwinnen, vooral voor burgers en kleine bedrijven. LBSC zou verhalen uit verschillende bronnen kunnen analyseren, of het nu nieuwere bronnen zijn zoals posts op sociale media of klassieke bronnen zoals antwoorden op vragenlijsten of feedbackdocumenten.

Interessant is dat LBSC ertoe kan leiden dat belanghebbenden worden geclusterd op een manier die verschilt van clusters die het resultaat zijn van traditionele kwalitatieve en kwantitatieve analyses. Dit resultaat kan optreden – zoals het deed in ons werk – omdat LBSC inzichten verzamelt uit de eigen geschreven taal van belanghebbenden.

Op basis van de reacties van individuen op de raadplegingen over wat later de voorstellen voor de Digital Services Act en Digital Markets Act werden, heeft LBSC bijvoorbeeld drie groepen geclusterd: individuele/micro-organisaties, kleine organisaties en middelgrote organisaties. Deze clusters werden gerechtvaardigd door statistisch significante verschillen in de manier waarop groepen belanghebbenden sleuteltermen zoals ‘poortwachters’, ‘zelfregulering’ en ‘leesbaarheid’ gebruikten en begrepen.

Met behulp van LBSC hebben we vastgesteld dat zelfs groepen die tot dezelfde gemeenschap behoren, sleutelbegrippen vaak heel anders begrijpen, wat suggereert dat niet alle groepen dezelfde zorgen uiten, zelfs als ze dezelfde woorden zeggen. We zouden ook het verschil tussen de standpunten van elke stakeholdergroep in de consultatie kunnen kwantificeren. Deze bevinding zou kunnen helpen bij verder onderzoek, omdat het kan helpen om te verduidelijken welke standpunten tijdens consultaties later worden vertaald in concrete regels.

Computationele tools kunnen, indien gecombineerd met traditionele, een beter begrip geven van de taal die wordt gebruikt door gemarginaliseerde groepen en wat ze willen. Ook kan het clusteren van groepen op basis van taalkunde bijdragen tot verdere deelname van de minst georganiseerde groepen, door hen een echte “stem” toe te kennen en hen aan te sporen om deel te nemen. Daarom zouden regelgevers moeten overwegen om deze technieken te gebruiken in combinatie met traditionele instrumenten om de participatie en effectiviteit van raadplegingen te vergroten.

Fabiana Di Porto is universitair hoofddocent rechten aan de Universiteit van Salento in Lecce, Italië, waar ze de onderzoeksgroep Algorithmic Disclosure Regulation leidt.

.

Leave a Comment