maandag 15 januari 2007

Fuzzy Search

Fuzzy search kan het eenvoudigst worden beschreven als: "hoe komt een woord overeen met een ander?" Om een woord in een ander woord te veranderen, kan je een karakter toevoegen, weglaten of vervangen. De eerste graad is de verandering van een letter. Bijvoorbeeld:
-
Om "commuter" in "computer" te veranderen is er maar een verandering nodig: de tweede "m" met "p." Een graad.
-
Om "computw" in "computer" te veranderen verseist een vervanging en een toevoeging: vervang "w" met "e" en voeg "r" toe. Twee graden.
-
Om "coinputer" in "computer" te veranderen verseist een vervanging en een verwijdering: vervang "i" met "m", en verwijder "n." Twee graden. Hoe hoger de graad, hoe groter de foutmarge; hoe lager de graad, hoe minder ruis is toegestaan bij de overeenkomst van de zoekopdracht met de woorden in uw bestanden.

Geen opmerkingen: