Anonimiseren
Octobox Anonimiseren werkt op basis van 1) algoritmen om in de context van gegevens te zoeken 2) waardenlijsten waarmee termen automatisch herkend kunnen worden en 3) Natural Language Processing (NLP). NLP kan teksten classificeren door te herkennen wat het onderwerp van de zin is of wat bijvoorbeeld een werkwoord of naam is. De software maakt gebruik van onderliggende opensource engines zoals SpaCy en Yolo waarbij labels worden toegekend aan herkende entiteiten - deze worden vervolgens door Octobox nogmaals gevalideerd en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt. en indien binnen de confidence-zone zullen ze geaccepteerd worden ter beoordeling door gebruiker alvorens ze definitief worden gemaakt.
Algemene verordening gegevensbescherming (AVG), Algemene Wet Bestuursrecht (AWB), Bekendmakingswet, Wet open Overheid (WOO), Wet Elektronische Publicaties (WEP).
De software van Octobox werkt op basis van een door de provincie ingesteld inrichtingsdocument. De provincie kan middels dit inrichtingsdocument bepalen welke categorieën van informatie de software in concept lakt. Denk hierbij aan namen van mensen, BSN-nummers, of handtekeningen. De lakkende medewerker houdt de controle door een voorstel goed te keuren, te wijzigen of af te keuren.
Het grootste risico is dat informatie onjuist gelakt of per ongeluk toch openbaar wordt gemaakt, wat kan leiden tot schending van privacywetgeving (zoals de AVG), reputatieschade voor de provincie, of schade voor betrokken personen (zoals identiteitsdiefstal of misbruik van gegevens). Deze risico's worden gemitigeerd door verplichte menselijke controle: Octobox doet alleen suggesties en medewerkers maken de uiteindelijke beslissing. Daarnaast worden medewerkers opgeleid in het gebruik van Octobox en zijn er aanvullende richtlijnen beschikbaar.
Het gebruik van de anonimiseringstool zorgt voor een versnelling en vereenvoudiging van het proces voor passieve en de actieve openbaarmaking. Het geautomatiseerd anonimiseren is tevens minder foutgevoelig dan menselijk handelen. Daardoor is de kans op een datalek kleiner en zijn de gegevens van burgers en bedrijven beter beschermd. Octobox anonimiseren automatiseert dit proces, door het herkennen van te beschermen informatie. De inzet van Octobox is gerechtvaardigd omdat (opgeleide) medewerkers altijd de suggestie van Octobox moeten goedkeuren, wijzigen of afkeuren.
Het algoritme verwerkt complete documenten die worden beoordeeld op openbaarmaking, zoals Woo-verzoeken, beleidsdocumenten, rapporten of e-mails. Deze documenten kunnen alle soorten informatie bevatten, waaronder persoonsgegevens zoals namen, adressen, telefoonnummers, e-mailadressen, geboortedata, BSN-nummers, financiële gegevens of handtekeningen. Octobox scant het volledige document om mogelijke te beschermen informatie te detecteren. Het algoritme is dus niet beperkt tot specifieke gegevenscategorieën, maar werkt op de totale inhoud van het document.
- Start
- januari 2024
- Leverancier
- Octobox Nederland B.V.
- Contact
- algoritmeregister@brabant.nl
- Register-standaard
- v1.0