INTERSYSTEMS BENELUX B.V.

Automatische bottom-up tekstanalyse: een wereld van verschil

30/05/2016 OM 09:00 - Luc Willemijns

Binnen organisaties is gemiddeld 30% van de gegevens gestructureerd in databases opgeslagen. Het overgrote deel van de gegevens is echter verspreid over formulieren, e-mails en bestanden. Hoe haal je nu informatie uit die enorme berg aan gegevens zonder dat het veel geld en moeite kost? Door de binnen de organisatie aanwezige teksten automatisch te analyseren en de inhoud te categoriseren met een innovatieve tekstanalyse-tool. Dat kan heel interessante informatie opleveren, bijvoorbeeld uit artsenverslagen in patiëntendossiers.

De afgelopen decennia hebben de ontwikkelingen op het gebied van business intelligence zich voornamelijk toegespitst op getallen en cijfers. Vooral de financiële sector heeft veel behoefte aan en beschikt over cijfermatige data. Uit die gegevens kan voor hen veel relevante en bruikbare informatie worden gehaald.

In de medische sector wordt ook veel gewerkt met getallen, denk aan laboratoriumresultaten. Maar er wordt niet alleen gewerkt met getallen. Een groot - en essentieel - deel van de digitaal opgeslagen medische informatie bestaat uit teksten (artsenverslagen, e-mails, aantekeningen). En die gegevens worden nog niet optimaal gebruikt.

Toenemend gebruik tekstanalyse

In verschillende branches wordt er inmiddels steeds vaker gewerkt met tekstanalyse-tools. Denk bijvoorbeeld aan de opsporingsdiensten (die zoeken naar subversieve activiteiten en bewijslast), het bankwezen (dossieranalyse voor risico-inschatting van de leningenportefeuille), marketing (peilen van de stemming over producten en diensten op de social media), call centra (analyse van de transcripties van telefoongesprekken), juristen (zoeken naar verbanden tussen rechtszaken), …

Digitalisering biedt mogelijkheden

Nu er ook in de zorgsector steeds meer wordt gedigitaliseerd, is de vraag naar tools die de teksten in bijvoorbeeld een patiëntendossier kunnen “begrijpen”, enorm toegenomen. Voor het analyseren van dit soort ongestructureerde gegevens is een tekstanalyse-tool dan heel bruikbaar.

Automatisch verbanden leggen

Voorheen was het analyseren van teksten alleen mogelijk door naar trefwoorden en combinaties te zoeken. Hierdoor moet er vooraf bepaald worden waar naar gezocht zou gaan worden, vaak aan de hand van een theasaurus of taxonomie. Inmiddels zijn toepassingen in de markt die het mogelijk maken teksten zonder vooraf opgestelde thesaurus te analyseren. De software gaat zelfs op zoek naar concepten en analyseert die vervolgens. Een enorme vooruitgang. In plaats van het automatisch zoeken, zoals oudere tekstanalyse-toepassingen, in teksten naar woorden, worden de teksten geëxploreerd.

Zo kan de zoektocht worden gestart vanuit een bepaalde voorkeur, een bepaald onderwerp. Je wil bijvoorbeeld weten wat er in jouw data over hypertensie te vinden is. Dat is een gestuurde operatie. Bij exploratie ligt het initiatief aan de andere kant, met name bij de analyse-tool. De tool geeft, op basis van zelf opgebouwde kennis, aan wat belangrijk is in de teksten, welke concepten veel naar voren komen,

Belang van context en woordgroepen

Performante tekstanalyse-tools onderzoeken woordgroepen en de context daarom heen. Neem bijvoorbeeld het automatisch highlighten in medische dossiers, wat veel door software tools wordt gedaan. Als je daar goed naar kijkt, zie je direct hoe semantisch fout dat is. Gespecialiseerde software heeft als opdracht om overal het woord hypertensie te kleuren. Dat zal in 70% van de gevallen best goed gaan, maar in de overige 30% niet.

Er staat bijvoorbeeld in de tekst: “De patiënt heeft geen last van hypertensie”. Of “De patiënt heeft acute pulmonale hypertensie”. Maar dat is een bepaalde vorm die niet zomaar met een algemene hoge bloeddruk kan worden vergeleken. Daarom zijn die woordgroepen zo belangrijk.

Verrassende uitkomsten

Dit bottom-up exploreren van teksten heeft veel voordelen. Onderzoekers stuiten bijvoorbeeld hierdoor op aspecten die nooit hadden kunnen worden gevonden met een top-down architectuur, die vanuit taxonomieën met medische termen start.

Top-down staat voor vooraf gedefinieerde vragen. Daarom kan een data warehouse alleen antwoord geven op vragen die van tevoren zijn bedacht en ingebouwd. Bottom-up staat voor onbevooroordeeld en laat het exploreren aan de tool over. Met bottom-up exploratie ontdekt de IT-manager ook wat er nou eigenlijk allemaal in de dataverzameling zit, dikwijls met verrassende uitkomsten.

Betere data

Tekstanalyse is niet alleen handig voor de categorisering van de gegevens en om te ontdekken wat voor data er nou allemaal binnen een organisatie aanwezig zijn. Het is ook een heel bruikbare tool voor het verbeteren van de kwaliteit van de te analyseren teksten. Is bijvoorbeeld bij de digitalisering alles uit de ruwe files in de database terecht gekomen? En vindt er bij de gegevensinvoer niet te veel “copy-paste” plaats? Dat kan dan weer een aanleiding zijn om extra aandacht aan het data-entry proces te besteden.

(Bovenstaande bijdrage kwam tot stand in samenwerking met InterSystems Benelux B.V. (Vilvoorde))

Meer info: 02/464.97.20 of www.intersystems.com.

INTERSYSTEMS BENELUX B.V.

Volg dit bedrijf om op de hoogte gebracht te worden van al hun nieuws.

INTERSYSTEMS BENELUX B.V. ICT, Telecommunicatie & Internet Vlaams-Brabant

Benieuwd welke bedrijven vandaag interesse tonen in dit onderwerp? Wij tonen u in 20 minuten wat dat betekent voor uw marktpositie.

dVO deelt geen individuele leesgegevens. Wij werken uitsluitend met geaggregeerde en geïnterpreteerde marktinzichten.

Plan 20 min inzicht

Voor u geselecteerd

Kort de voordelen van een abonnement...

Neem dVO Leads

Belangrijk nieuws te delen?

Contacteer onze redactie

Meer context. Dieper begrip.

Artikels zoals deze brengen het nieuws.

Met een dVO-abonnement krijgt u dat nieuws in de juiste zakelijke context — met inzicht in sectoren, bedrijven en strategische bewegingen.

Waarom bedrijven dVO gebruiken

Volledige toegang tot alle artikels en thematische dossiers met verkoopkansen
Context bij bedrijfsnieuws, investeringen en benoemingen
Relevant voor ondernemers, managers, beslissers en medewerkers

Gratis lezen

Registreer gratis

Toegang tot een een paar artikels
Wekelijkse nieuwsbrief met 3 nieuwsfeiten
Geen persoonlijke bibliotheek
Geen historiek per bedrijf
Geen alerts
Geen context bij prospecten of klanten
👉 Geschikt om dVO te leren kennen, niet om het actief te gebruiken in prospectie of voorbereiding.

Meest gekozen

dVO Leads

€19/Maand

Activeer abonnement

Maandelijks opzegbaar

Onbeperkte toegang tot alle artikels met SALESKANSEN, en gematcht aan uw profiel
Persoonlijke bibliotheek (bewaar artikels per bedrijf)
Zoekfunctie op bedrijven en sectoren
Historiek: wat speelde de voorbije maanden bij een bedrijf
7 print edities per jaar
Selecteer uw klanten, leveranciers of prospects en ontvang automatisch meldingen wanneer er nieuws over hen of over uw bedrijf verschijnt.
U weet waarover u moet praten vóór elke afspraak en wint tijd in voorbereiding
U mist geen relevante ontwikkelingen
U detecteert kansen vóór anderen
U bouwt structureel kennisvoordeel op
U begrijpt uw markt beter

dVO Interview en bereik 35.000 ceo's

€124/Maand

Bestel nu

Jaarlijks opzegbaar

Interview met uw bedrijf/ceo en bereik 35.000 ondernemers/beslissers
Multimediale creatie en publicatie
Interviewcreatie: Tekst, audio, video
Publicatie: dVO.be, socials, Spotify, Youtube, nieuwsbrieven, ...
Leadinformatie en data beschikbaar

Bedrijven

Regio's

Sectoren

Topics

Automatische bottom-up tekstanalyse: een wereld van verschil

Meest gelezen

16/03/2026

Bancontact herdoopt Payconiq-app tot Bancontact Pay

19/03/2026

Schneider Electric en NVIDIA ontwikkelen gevalideerde blueprints voor AI-fabrieken op gigawatt-schaal

18/03/2026

Vrooem.com wil wereldwijd verhuurplatform uitbouwen voor wagens, mobilhomes en exclusieve voertuigen

20/03/2026

Kappa Data lanceert IT Compass voor resellers in complex netwerk- en security-landschap

20/03/2026

Arctic Wolf benoemt Will May tot chief revenue officer

INTERSYSTEMS BENELUX B.V.

Benieuwd welke bedrijven vandaag interesse tonen in dit onderwerp? Wij tonen u in 20 minuten wat dat betekent voor uw marktpositie.

Voor u geselecteerd

Kort de voordelen van een abonnement...

Belangrijk nieuws te delen?

Meer context. Dieper begrip.

Waarom bedrijven dVO gebruiken

Gratis lezen

dVO Leads

€19/Maand

dVO Interview en bereik 35.000 ceo's

€124/Maand

Ontvang Leads voor 19€/mnd

DVO

Contact

Informatie

Krijg toegang tot deze inhoud met een gratis dVO account

Automatische bottom-up tekstanalyse: een wereld van verschil

Meest gelezen

16/03/2026

Bancontact herdoopt Payconiq-app tot Bancontact Pay

19/03/2026

Schneider Electric en NVIDIA ontwikkelen gevalideerde blueprints voor AI-fabrieken op gigawatt-schaal

18/03/2026

Vrooem.com wil wereldwijd verhuurplatform uitbouwen voor wagens, mobilhomes en exclusieve voertuigen

20/03/2026

Kappa Data lanceert IT Compass voor resellers in complex netwerk- en security-landschap

20/03/2026

Arctic Wolf benoemt Will May tot chief revenue officer

INTERSYSTEMS BENELUX B.V.

Benieuwd welke bedrijven vandaag interesse tonen in dit onderwerp? Wij tonen u in 20 minuten wat dat betekent voor uw marktpositie.

Voor u geselecteerd

Kort de voordelen van een abonnement...

Belangrijk nieuws te delen?

Meer context. Dieper begrip.

Waarom bedrijven dVO gebruiken

Gratis lezen

dVO Leads

€19/Maand

dVO Interview en bereik 35.000 ceo's

€124/Maand

Cookie voorkeuren

Functionele cookies

Analytische cookies

Marketing cookies