Hebbes! Tijd winnen met turbo zoektools
Door: Fred Teunissen
Volgens onderzoekers zijn wij ongeveer een kwart van onze tijd kwijt met het zoeken naar de juiste informatie. Dat zijn enorm veel verspilde uren. Met de inzet van goede zoekhulpmiddelen kunnen we ruimte scheppen voor nuttiger zaken.
Zo langzaamaan komen we om in de bestanden. Afhankelijk van de bedrijfsactiviteiten verdubbelt de hoeveelheid data om de zes tot achttien maanden. Het is gaandeweg een grote, gistende databerg aan het worden met e-mail, tekstdocumenten, PDF-files, spreadsheets, database files, webpagina's, PowerPoint-bestanden, AutoCad-files, digitale foto's, video's en wat u in uw organisatie verder nog aan bestanden omgaat. Uw harddisks lopen er in rap tempo mee vol.
Dat levert twee uitdagingen op:
Allereerst: waar laat u al die bestanden? In de Bizz van februari dit jaar hebben we aandacht aan die vraag besteed in het artikel 'Data slim parkeren'. De kern daarvan is dat het verstandig is om uw data weg te halen van de desktop en op een centrale plaats in uw netwerk onder te brengen. Met een duur woord heet dit Network Attached Storage (NAS). De data buiten uw bedrijf in een datacenter neerzetten kan natuurlijk ook.
De tweede uitdaging is hoe u snel de juiste informatie kunt terugvinden. In welk mapje zaten die specificaties van product X ook alweer? Waar zijn die e-mails gebleven van een paar jaar geleden toen we dat meningsverschil hadden met klant Y? Waar staan die foto's van de beurs in Londen van dit voorjaar? Enzovoort.
Enterprise Search
Zolang uw gegevens zich allemaal op één computer bevinden, heeft u genoeg aan zoeksoftware voor de desktop (zie kader Desktop search). Maar in de meeste bedrijven is dat al lang niet meer het geval. Daar zijn de gegevens over het hele netwerk verspreid. Op desktop pc's, laptops en allerhande soorten server-computers, waaronder fileservers, databaseservers en webservers. Daar helpt de desktop zoeksoftware niet meer, maar moet u naar een netwerk-oplossing gaan omkijken. Met een moeilijk woord heet deze tak van sport 'enterprise search', maar het gaat gewoon om de inzet van digitale zoekhulpjes, die uw complete netwerk kunnen omspannen. Zulke tools zijn er in soorten en maten. Grote bedrijven zijn er vaak al wel bekend mee. Kleinere bedrijven beginnen de noodzaak ervan te voelen. We bespreken er hier een paar, om een indruk te geven.
Coveo Enterprise Search
Coveo is een spin off van het beroemde Copernic-project voor Desktop Search. Een paar jaar geleden stapten een paar medewerkers uit dit project en gingen verder met het ontwikkelen van zoeksoftware voor op de server. Coveo Enterprise Search is daarvan het resultaat. Het is software waarvoor betaald moet worden, maar die wel nauw samenwerkt met de Copernic Desktop-software, die nog steeds gratis is.
Het licentiemodel is niet gebaseerd op aantal gebruikers, maar op zogeheten documentenbundels van steeds 50.000 stuks. Daarvoor wordt eenmalig (dus niet jaarlijks) een bedrag in rekening gebracht. Standaard bevat de software connectoren met onder meer Microsoft SharePoint Portal, Lotus Notes, Novell en Microsoft Exchange.
Door de koppeling met Active Directory in de Windows serversoftware laat Coveo na een zoekopdracht alleen die bestanden zien, waarvoor de gebruiker ook toegangsrechten (lees-, schrijf-, kopieer-, of printrechten e.d) heeft.
Optioneel zijn er modules voor het indexeren van pdf-files (dwz niet alleen op bestandsnaam, maar ook op inhoud) en voor videofiles, waarbij de geluidsopnames eerst worden omgezet in tekst, die dan vervolgens als basis dient om bepaalde videofragmenten terug te vinden. Het transcript van de geluidsopname kan worden meegelezen. Het gezochte trefwoord staat er vetgedrukt in.
Google Mini
Google Mini is hard- en software in één. Het is een server van het blade-model, die zo in een 19 inch rack (serverkast) past. In de server zit de Google zoeksoftware. Deze kan gebruikt worden voor het zoeken binnen de eigen website, het eigen intranet en het interne netwerk. En uiteraard ook voor zoekacties op het internet. Net als bij Coveo laat de software alleen die zoekresultaten zien, die overeenkomen met de rechten, die de systeembeheerder tevoren heeft toegekend binnen de Windows serveromgeving.
Ook hier is het licentiemodel gebaseerd op een eenmalige prijs per 'tranche' van 50.000 te indexeren documenten.
Lucene
Lucene is open source zoeksoftware en wordt ontwikkeld door de Apache Software Foundation als open alternatief voor Google. Deze software is gratis te gebruiken. Wel moet die door een specialist worden ingebouwd in het content management systeem van uw website, intranet of bedrijfsportal.
Lucene is nog niet zo bekend in Nederland. Er zijn een paar IT-dienstverleners die er ervaing mee hebben, zoals het bedrijf Proteon in Delft. Lucene is ook de motor in de gratis zoeksoftware, waarmee IBM en Yahoo onlangs de markt op kwamen.
IBM OmniFind Yahoo! Edition
IBM en Yahoo introduceerden deze software december vorig jaar. Het is een combinatie van de open sourrce zoekengine Lucene, de eigen zoekmachine van Yahoo en onderdelen van de zoeksoftware van IBM. Deze drie-eenheid kan tot 500.000 documenten aan en is gratis te downloaden. Voor support moet natuurlijk wel worden betaald. Overschrijdt u de grens van een half miljoen documenten, dan komt IBM´s eigen OmniFind oplossing in beeld en die is allesbehalve gratis.
Ultraseek
Met Ultraseek van Autonomy tenslotte haalt u een zoek-Ferrari in huis. Deze software kan de betekenis van informatie duiden, ongeacht de woorden, waarvan gebruik gemaakt wordt. Ultraseek bevat ook andere geavanceerde technieken, zoals de mogelijkheid van clustering van zoekresultaten. Door die clusters op verschillende tijdstippen met elkaar te vergelijken ontstaat een beeld van trends, die anders verborgen zouden blijven.
Misschien staan bij u alle bestanden netjes en overzichtelijk op één fileserver en is die bij lange na nog niet vol. Dan is het nu nog niet nodig om powertools aan te schaffen, die netwerkbreed werken. Maar als uw medewerkers nu al veel tijd kwijt zijn met het zoeken op meerdere locaties, dan doet u er verstandig aan u te oriënteren in de wereld van het pure zoekgeweld.
Desktop search
In elke Windows-versie zit een zoekfunctie ingebakken. Als u naar 'Start' gaat en vervolgens naar 'Zoeken naar bestanden en folders', dan kunt u op de hele harde schijf zoeken aan de hand van criteria als trefwoord, datum of bestandsomvang. Het werkt, maar het kost veel tijd en erg duidelijk zijn de overzichten, die u zo voorgeschoteld krijgt, niet.
In Windows Vista is dit wel sterk verbeterd, maar nog niet dusdanig dat gespecialiseerde zoekprogramma's, zoals de Desktop Search van Google. Copernic Desktop Search of X1 overbodig geworden zijn. Deze zoekprogramma's kunt u gratis downloaden van het internet en vervolgens op uw pc installeren. Tijdens de installatie worden alle gegevens op uw harde schijf geïndexeerd. Dankzij ingebouwde semantische slimmigheidjes wordt de context van deze inhouden eveneens meegenomen, zodat ook inhoudelijke verbanden worden herkend. Het resultaat van een zoekopdracht is daarom méér dan een lijstje onderwerpen en trefwoorden. Hoe dit precies werkt is 'het geheim van de smit', maar het werkt en daar gaat het om.
Meer informatie:
http://desktop.google.nl/
www.copernic.com
www.x1.com
Dit is een verkorte versie van een artikel dat in juni 2007 in het zakenblad Bizz verscheen.
Licentie: cc by nc