Datacompressieprogramma's kunnen ook structuur aanbrengen
Promotie Informatica
vrijdag 23 februari, 10.00 uur
Rudi Cilibrasi introduceert een nieuwe vorm van statistische analyse, gebaseerd op datacompressie. Het gaat hier om een praktische variant op het theoretische concept van een 'universele informatie-afstandsmaat' waarmee de overeenkomst tussen twee willekeurige bestanden wordt bepaald. Hoe meer de bestanden op elkaar lijken, hoe kleiner hun 'afstand'. Door bestanden met kleine onderlinge afstand als een cluster (groep) te beschouwen ontstaat een geheel nieuwe vorm van clusteranalyse, die bijvoorbeeld toegepast kan worden op literaire teksten, DNA-sequenties en muziekbestanden. In tegenstelling tot eerdere methodes wordt er geen gebruik gemaakt van a priori kennis van het te clusteren domein: alle soorten bestanden worden geanalyseerd met behulp van eenzelfde computerprogramma, gebaseerd op eenvoudige datacompressiemethodes. De uitkomsten zijn vaak verrassend en doen niet onder voor resultaten die verkregen worden met gespecialiseerde, veel ingewikkelder software. Verder laat Cilibrasi zien dat een variant van de universele afstandsmaat gebaseerd kan worden op internet. Begrippen kunnen automatisch geclusterd en geclassificeerd worden aan de hand van de context waarin ze voorkomen op het web. Dit leidt soms tot intrigerende resultaten. Cilibrasi heeft zijn onderzoek uitgevoerd bij het Centrum voor Wiskunde en Informatica (CWI) in Amsterdam.
R.L. Cilibrasi: Statistical Interference Through Data Compression. Promotor is prof. dr. ir. P.M.B Vitányi.
Dit is een overzicht van promoties, oraties, afscheidscolleges en andere activiteiten aan de Universiteit van Amsterdam. Meer informatie over de items in deze agenda kunt u krijgen bij de afdeling Persvoorlichting, tel. 020 - 525 2695, e-mail:
Universiteit van Amsterdam