Ingezonden persbericht
(Collexis is genomineerd voor de Broos van Erp Prijs 2002, de aanmoedigingsprijs
voor succesvolle, startende ondernemers uit het midden- en kleinbedrijf. De
prijs is ingesteld op initiatief van de Tweede Kamer door het ministerie van
Economische Zaken.)
Collexis introduceert nieuwe versie Collexis
® Engine
Sneller de juiste informatie vinden in grote hoeveelheden ongestructureerde data
Geldermalsen, 20 maart 2002 - Collexis - een organisatie die technologie en
applicaties ontwikkelt en implementeert voor het toegankelijk maken van grote
hoeveelheden ongestructureerde informatie - heeft een nieuwe versie uitgebracht
van de Collexis® Engine. De 3.5 versie heeft een aantal nieuwe eigenschappen,
waardoor het mogelijk is nog beter en sneller de juiste informatie te vinden in
grote hoeveelheden ongestructureerde informatie.
Collexis® is gebaseerd op het principe van 'fingerprinting'. Hierbij vindt een
indexering plaats van tekst door vergelijking met kennis die is vastgelegd in
thesauri. Het systeem kan fingerprints creëren van een grote verscheidenheid aan
informatie-items; rapporten, artikelen, e-mails, webpagina's et cetera. Deze
fingerprints zijn, net als menselijke vingerafdrukken, kleine unieke
representaties van hun bron. In de Collexis® Engine 3.5 is het mogelijk metadata
bij de fingerprints op te slaan, zoals publicatiedatum en naam van de publicatie
of auteur. Hierdoor kunnen gerichte filteringen in de zoekopdracht worden
gemaakt.
Als een gebruiker een zoekvraag invoert, wordt deze vraag eveneens samengevat in
een fingerprint - net zoals is gebeurd met de informatie-items waarop wordt
gezocht. Vervolgens wordt de zoekfingerprint met de fingerprints in de catalogus
vergeleken en worden de meest relevante resultaten gevonden. De resultaten
hebben een verwijzing naar de originele content, die op basis van gewenste
autorisatieregels beschikbaar kan worden gesteld. Informatie kan worden gevonden
zonder dat er moet worden gecategoriseerd rondom een bepaald onderwerp of
meerdere onderwerpen. Omdat er dikwijls toch vraag is naar het weergeven van
documenten in categorieën, biedt Collexis® Engine 3.5 de mogelijkheid om
documenten automatisch te plaatsen in een of meerdere relevante categorieën. Dit
werkt tevens omgekeerd: documenten kunnen worden weergegeven per geselecteerde
categorie.
Wanneer een organisatie Collexis® implementeert, kan zij ervoor kiezen om
bestaande databases te fingerprinten of door middel van het dynamisch
fingerprinten met een leeg systeem te beginnen. Als de catalogus met
fingerprints eenmaal is gevuld, kan deze worden doorzocht door een tekst als
zoekvraag te gebruiken; een projectbeschrijving, een webpagina of eerder
gebruikte zoekvragen behoren tot de mogelijkheden. Het vergelijkings- en
matchingproces is snel en efficiënt: een fingerprint is gemiddeld slechts 400
bytes groot, waardoor een catalogus met 500.000 fingerprints in 20
milliseconden kan worden doorzocht. Naast de uitstekende performance van dit
matchingproces zijn in versie 3.5 ook aanpassingen gemaakt aan andere
(achtergrond)processen, die hierdoor aanzienlijk in performance zijn verbeterd -
soms wel met een factor tien.
Collexis® Engine 3.5 kan dus informatie ontsluiten uit elke soort database; maar
ook informatie in bijvoorbeeld webpagina's of e-mails, die normaal niet in een
database worden opgeslagen, kan op deze manier in het matchingproces worden
meegenomen. Alleen de fingerprints worden opgeslagen op een centrale server. Dit
is dan ook de enige hardware-investering die noodzakelijk is. De Collexis®
Engine 3.5 draait naast Windows NT en Windows 2000 ook op een XP-platform.
- einde persbericht -
Over Collexis
Collexis ontwikkelt en implementeert unieke technologie en applicaties voor het
toegankelijk maken van grote hoeveelheden ongestructureerde informatie. Collexis
werd in 1999 als bedrijf opgericht met als doel het systeem, dat oorspronkelijk
werd ontwikkeld voor wetenschappelijke toepassingen, geschikt te maken voor een
bredere markt. Collexis®-software levert toegevoegde waarde aan organisaties met
grote hoeveelheden ongestructureerde data. Tot de klantenkring van Collexis
behoren onder andere grote uitgeverijen, zoals Nature Publishing en Elsevier
Science, maar ook de Wereldbank en het Nederlandse Ministerie van Economische
Zaken. Collexis bezit het intellectuele eigendomsrecht op de software. Een deel
van de inkomsten wordt afgestaan aan projecten in ontwikkelingslanden. Het
hoofdkantoor van Collexis is gevestigd in Geldermalsen en Collexis wordt
vertegenwoordigd in andere Europese landen, de Verenigde Staten, Afrika en Azië.