Zoektechniek voor plaatjes herkent visuele patronen
15 februari 2005
NWO-onderzoeker Mirela Tanase ontwikkelde een nieuwe techniek voor het
zoeken naar beelden met zoekmachines. Ze baseerde haar techniek op de
manier waarop het menselijk oog objecten herkent. Met de nieuwe
techniek stijgt het resultaat van de zoekactie van 10 procent naar 70
procent juist gevonden objecten. Tanase promoveert op 16 februari aan
de Universiteit Utrecht.
Promovendus Mirela Tanase ontwikkelde twee methoden om objecten op te
delen en de vormen te herkennen. De eerste methode deelt het
binnengebied van de contour op. Hoewel dit voor de mens eenvoudig is,
is het voor een computer niet altijd duidelijk hoe een object moet
worden opgedeeld. De tweede methode werkt op allerlei skeletten en
deelt de contour zelf op in delen in plaats van de opvulling.
Splitsingen in het skelet geven een aanwijzing over welke delen van de
contour visueel verschillende delen vormen.
Vervolgens ontwikkelde Tanase een 'part-based'-zoekmachine. Deze
zoekmachine vindt plaatjes op basis van delen van objecten. Deze delen
van objecten worden door de zoekmachine zelf aangemaakt. Bij de
afbeelding van een hert kan de machine bijvoorbeeld zoeken op de poten
van het hert. Onder de resultaten zijn dan niet alleen afbeeldingen
van een hert, maar ook andere afbeeldingen met dezelfde contouren,
bijvoorbeeld elanden, paarden of olifanten.
Deze zoekmethode blijkt een goede aanvulling te zijn voor de methode
die door MPEG7 is gekozen om contouren te zoeken. Zo wordt in bepaalde
gevallen waar de MPEG7-methode het relatief slecht doet, het aantal
juist gevonden objecten verhoogt van 10 procent naar 70 procent.
Digitalisering
In rap tempo zijn de afgelopen jaren veel fotocollecties
gedigitaliseerd en via internet voor iedereen beschikbaar gemaakt.
Niet alleen musea en art galeries maken hiervan gebruik, ook
ziekenhuizen hebben inmiddels databanken met foto's en veel bedrijven
hebben een uitgebreid overzicht van al hun producten op het web.
Internetzoekmachines als Google werken goed voor tekstbestanden, maar
schieten tekort in een zoekactie naar afbeeldingen. Naarmate het
aantal afbeeldingen in collecties toeneemt, worden goede zoekmethoden
belangrijker. Het zoeken op sleutelwoorden kost veel tijd en is niet
altijd even effectief. Door te kijken naar visuele informatie zoals
kleur, textuur en vormen die in de plaatjes zitten, neemt het aantal
juist gevonden objecten bij een zoekactie sterk toe.
Het onderzoek van Mirela Tanase wordt gefinancierd door het programma
Open Competitie van het NWO-gebied Exacte Wetenschappen.
..................................
Meer informatie bij:
* drs. M. (Mirela) Tanase-Avatavului (UU, Instituut voor Informatica
en Informatiekunde)
* t: +31 (0)30 253 14 54, mirela@cs.uu.nl
* promotie 16 februari, promotor prof. dr. M.H. Overmars
Nederlandse Organisatie voor Wetenschappelijk Onderzoek