Op weg naar de Amazoogle bibliotheek (1): discovery

In een interessant artikel onder de titel “Discovery versus Disintermediation” schetst Jane Burke, vice-president van Pro Quest de ontwikkeling van nieuwe zoektechnologieën in de digitale bibliotheek. ProQuest is een toonaangevende Amerikaanse leverancier van informatieproducten, zowel content (o.a. dissertaties) als software. Hieronder mijn vrije bewerking van dit artikel. (Oorspronkelijk geschreven als interne blogpost op het Windesheim intranet, 12 okt., n.a.v. een discussie over federatieve zoekmachines).

Disintermediatie doelt op het verschijnsel dat in veel bedrijfstakken er steeds minder plaats is voor tussenpersonen (bijvoorbeeld in de reisbranche, boek- en muziekhandel). Ook bibliotheken krijgen hiermee te maken. Veel bibliotheken zien hun rol in onderzoeksprocessen verwateren. Ze worden mikpunt voor bezuinigingen en raken bij de eindgebruiker buiten beeld.

Bedreigingen

Bibliotheken bieden een geweldige rijkdom aan kwalitatief hoogstaande informatiebronnen, maar ze slagen er niet in om die veelheid van bronnen zo te organiseren dat eindgebruikers daarmee goed uit de voeten kunnen. Onderzoek (2009) bij wetenschappelijke bibliotheken geeft aan dat meer dan 80% van de studenten en medewerkers het scala van de aanwezige bronnen niet overziet, laat staan optimaal gebruikt. Drie oorzaken:

  • De startpagina van de bibliotheek biedt geen helder en aantrekkelijk startpunt voor onderzoek
  • Gangbare namen en beschrijvingen van databanken maken het moeilijk om geschikte bronnen te identificeren
  • Gebruikers hebben onvoldoende inzicht in het totale aanbod van informatiebronnen

Aan de kant van de eindgebruiker speelt een ander probleem: tijdgebrek. Studenten maar ook docenten zoeken informatie op basis van het “just in time” criterium. Snelle resultaten zijn cruciaal. Vandaar de populariteit van Google en internet. De bibliotheek wil studenten en medewerkers graag ondersteunen bij hun onderzoek, met betrouwbare bronnen. Maar de organisatie van die bronnen is vaak nogal ingewikkeld. Gebruikers moeten veel geduld en navigatievermogen opbrengen. Dikwijls ervaren zij onzekerheid en frustratie.

Het is een stevig dilemma. Investeren in de collectie, in nog meer digitale bronnen, verergert de complexiteit van het aanbod. Maar níet investeren is geen keuze, er komen altijd nieuwe bronnen bij. Wat bibliotheken niet inzien is dat eindgebruikers geen onderscheid maken tussen al die verschillende typen en formats van informatieobjecten.
De huidige organisatie van content in gescheiden silo’s of containers vormt een groot obstakel. Informatie moet beschikbaar komen via “single search” zoekacties. Eenvoudig, gemakkelijk en snel. Het Amazoogle model is het leidende principe.

Kansen

De strategie waar bibliotheken tegenwoordig op inzetten heet “discovery”. Dat kun je inderdaad vertalen als Ontdekking… Het gaat vooral over de optie van een geïntegreerd aanbod van content uit diverse bronnen. Daarnaast streeft men ernaar om de complexe kanten van informatiemanagement drastisch te vereenvoudigen.
Belangrijke elementen zijn:

  • Een aantrekkelijke zoekinterface
  • Gemakkelijk zoeken (single search) in allerlei typen metadata
  • Representatie van alle bibliotheekcollecties en soorten content.

De ontwikkelingen spitsen zich toe op drie categorieën van “discovery services” :

  • Vernieuwing van lokale bibliotheekcatalogi (Discovery Layers)
  • Instrumenten voor zgn. “federatief zoeken” (Federated Search)
  • Integratie van webcontent (Web-scale Discovery)

Catalogusvernieuwing

De traditionele bibliotheekcatalogus (web OPAC) wordt steeds meer verrijkt met Web 2.0 elementen (discovery layers): tags, coverafbeeldingen, commentaar, ratings, suggesties, facetgebaseerd zoeken, lokale taxonomieën, visualisatie van zoekresultaten en metadata, en niet in de laatste plaats de presentatie op mobiele platforms. De Aquabrowser, sinds kort een Proquest product, is een voorbeeld van een visuele zoekmachine die bij veel Nederlandse (openbare) bibliotheken bekend is. Naast de bibliotheekcollectie kunnen ook andere lokale bestanden worden ontsloten, bijv. een repository van medewerkerspublicaties. Een op die manier gepimpte publiekscatalogus zal veel aantrekkelijker zijn voor eindgebruikers. Maar ook zo’n Next-Gen catalogus is slechts een gedeeltelijke oplossing. De ontsluiting van fulltext content uit externe, commerciële databanken komt daarmee niet dichterbij.

Federatief zoeken

De wens om vanuit één interface en vanuit één enkele zoekvraag gelijktijdig en realtime meerdere contentverzamelingen (databanken) te doorzoeken is een lang bestaand ideaal. Bibliotheken in de jaren ’80 kenden al het z39.50 protocol om zoekvragen te vertalen naar verschillende databanken. In 1998 presenteerde Webfeat (ook Proquest) zich als de eerste echte federated search engine. Tegenwoordig bestaan er ontelbare vergelijkbare softwaretoepassingen, onder uiteenlopende noemers: metasearch, cross-database search, broadcast search, distributed search, deep web search. Die laatste term geeft precies aan waar het om draait: het zoeken en vinden van content in niet publieke, commerciële databanken (ook wel aangeduid als het diepe web).

De kern van de federatieve zoekmachine bestaat uit connectoren, stukjes software die de zoekvraag vertalen en overdragen naar de aangesloten databanken. De resultaten van zoekacties moeten vervolgens worden terugvertaald, geordend, bijgeschaafd en ontdubbeld. Daar zitten dan meteen ook de zwakke plekken in het systeem. Connectoren zijn kwetsbaar, kunnen ontregeld raken of het zoekproces vertragen. Een andere zorg is of de opgeleverde en bewerkte zoekresultaten nog wel voldoende relevantie hebben.

Integratie van webcontent

Om aan de problemen van federatieve zoekmachines tegemoet te komen worden nu systemen ontwikkeld die niet werken met connectoren, maar met een vooraf aangelegde index (unified search index, pre-aggregate index). Dit vereist wel dat met alle betrokken contentleveranciers overeenkomsten worden gesloten over beschikbaarstelling van hun materiaal en metadata. Bestaande containers (databanken) moeten worden opengebroken om toegang tot de fulltext content mogelijk te maken, via die ene voorgecoördineerde index. Dat is een enorme opgave. Maar de eerste resultaten zijn er. In 2009 werd Summon (ook Proquest) gelanceerd als eerste “web-scale discovery service”. Het idee erachter is om de databankencollectie van de bibliotheek te ontsluiten volgens het Google-model. Om het beste van twee werelden te combineren: éénstaps zoeken naar hoogwaardige content in de bibliotheek. Gemakkelijk, eenvoudig en snel. Discovery is vandaag het toverwoord. Of dat het tij zal keren en de kloof tussen bibliotheek en eindgebruikers kan dichten? We lezen er de komende tijd ongetwijfeld meer over.

Naar de volledige tekst van het artikel van Jane Burke

Meer:

Discovering discovery services

Discovery services don’t make federated search useless

Federated search: users might actually like it

3 Reacties op “Op weg naar de Amazoogle bibliotheek (1): discovery

  1. Pingback: [gastpost] Op weg naar de Amazoogle bibliotheek?·

  2. Klopt, bibliotheken maken onderscheid tussen bronnen. Gebruikers niet: voor hen is de informatiewereld een cloud waar je uit plukt.
    1 interface met alle bronnen erachter verborgen lijkt hierbij dus aan te sluiten op deze behoefte en kan disintermediatie bestrijden.
    Integatie van webcontent zou mijn voorkeur hebben, omdat alle content al vooraf geindexeerd is (sneller). Gebruik van connectoren in federatieve search leidt alleen maar tot meer beheer in onderhoud.

  3. Pingback: Tweets that mention Op weg naar de Amazoogle bibliotheek? « Doc 1.5 -- Topsy.com·

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s