Klik op Verslag stage Tom Blikslager!
Berichten getagged purplesearch
Official Blast-off of PurpleSearch Januari 12 2009

Monday January 12 2009 is the day of the official blast-off of the University of Groningen bibliographic search tool PurpleSearch.
The day will start with promotional activities in the University Library of Groningen University.
PurpleSearch is a tool which will stay perpetual beta, but the coming period major innovations are not at hand.
Next week more information on the launching of PurpleSearch will be reported on this site!
Monday Januari 19 2009:
Some links (just in dutch – shame, shame):
- Launching of new search engine PurpleSearch
- General info on PurpleSearch
- PurpleSearch
Filling the ISSN database
We’re still filling our ISSN database. Some parts are going fast, other take more time.
The ISSN database already contains about 600.000 journals, from which about 30.000 are peer reviewed journals.
We collected the data from several sources locally, and on the Web.
OPAC data
We also want to squeeze the University Catalogue to get information concerning the journal holdings.
We do some test imports with the SRU interface of the OCLC PICA OPAC.
And we are trying to understand the PICA and PICA+ formats.
We must translate one format into the other. The information from the OPAC is all PICA+. We want to translate it to PICA or MARC21.
We want to import ISSN’s, titles, subtitles, holding information (signatures, stack numbers, available years etc.).
When we have built this ISSN database, we hope to keep it uptodate by searching all changes in the OPAC from a specific moment in time (f.i.each week), and automatically import the new data in the database.
Other parts of the project
* In PurpleSearch, and also the earlier version, LiveTrix, we already mention(ed) ISI Impact Factors.
* If possible, we import in the database links to tables of contents. Ulrich’s supplies links to tables of content of electronic journals. And maybe we can get some useful information via the xISSN database of WorldCat. David Walker told me that all OCLC cataloguing libraries in the USA could use World for free. And the same counts for the dutch cataloguing libraries, e.g. the Library of the University of Groningen.
* A minor project in this database story is the collecting of journal covers. Our goal is to store the covers in Groningen. So it won’t cost time when we present within the PurpleSearch results, journal information and also covers.
From Elsevier we already received about 2.000 covers (in zip!). Oxford University Press told us we could use their covers. But we ourselves must collect them (ca. 400). Cambridge Journals Online already told us to sent zipfile with their journal covers.
Wiley’s is still thinking about it. Other suppliers didn’t react untill now.
So, there’s a lot to do in 2009! And off course we have enough ideas to proceed. When we have this ISSN database working and running, and when we have more data locally stored in Groningen, we can think of extanding our services pack for PurpleSearch:
- Subject information (FRBR; faceting)
- Photo and film data
- Feed Navigator Plugin for RSS alerts.
- and more.
Have a nice holiday!
Enhancing PurpleSearch: December news.
In the enhancing project of PurpleSearch, until now the following has happened:
* I have compared a few search systems (Xerxes , VuFind, Primo Iowa / Kopenhagen / Vanderbilt).
* We received a database with peer reviewed journals, from David Walker (CalState University) – Thank you very much!
* A new trainee, computer science student, Ain Uljas from Tartu, Estonia, came to Groningen. He’ll also be involved in the programming part for PurpleSearch the coming year.
* We made a plan to build a database, necessary to enhance PurpleSearch:
- Make an ISSN database; we try to get the ISSN data out of the catalogue and the SFX data.
- Connect to the ISSN database holding information of the University of Groningen catalogue. Information how is available.
- Connect to the ISSN database impact factors we get from ISI Web of Science.
- Connect to the ISSN database subject information from the dutch central catalogue NCC, GOO, from Library of Contents, LC, and DDC. We hope to develop FRBR faceting options in PurpleSearch, using GOO, LC, and DDC codes to refine a search result.
- Connect to the ISSN database tables of contents of journals. We hope to find this maybe in Ulrich’s, or via electronic journals publishers & aggregators.
- Connect to the ISSN database of journal covers. We hope to find them, maybe in Ulrich’s, or via electronic journals publishers & aggregators.
Why do we use a static database, and not a live connection to updated sites, such as XISSN service of WorldCat?
- We think we can make a faster service, when we host data in Groningen, instead of using WorldCat or other data.
- The XISSN of WorldCat service probably costs money.
- We hope to develop some smart programming, so that we can update parts of our ‘static’ ISSN database.
- When the database is ready, and we have done some more programming, new services will be available in PS.
So let’s go for it!
Ulrich’s, waar zijn ze nou?
In de zoektocht naar lijsten met peer reviewed journals (zie vorige post), bedachten we dat we natuurlijk ook de database Ulrich’s Periodicals Directory kunnen gebruiken.
De RU Groningen heeft een abonnement op dit bestand. En met Ulrich’s kun je zoeken op refereed journals, peer reviewed dus.
Na een zoekactie op refereed vonden we ruim 28.000 treffers, om precies te zijn 28.262.
Tijdens het bladeren door de lijst ontdekten we iets vreemds. We begonnen te bladeren, 25 of 125 per keer. Daarna pasten we de resultaat-URL enigszins aan, zodat we elke – in plaats van 125 – 1500 records tegelijk op het scherm kregen. Werkt wel zo snel, bij zoveel treffers.
Al bladerend – 1500, 3000, 4500, 6000, 7500, 9.000 – kwamen we tot 10.000 records.
Maar verder konden we niet bladeren! We waren inmiddels bij de Z aangeland. Hoezo 28.000 refereed journals?
[/caption]Ulrich’s, waar zijn ze gebleven, die andere 18.000 refereed tijdschriften?
Wie het weet, mag het zeggen!!! En ook als iemand ergens nog een lijstje met ruim 28.000 refereed of peer reviewed journals heeft…
Peer reviewed journals in Xerxes, ook in PurpleSearch?
Toen we wat gingen Googlen vonden we allerlei lijstjes peer reviewed tijdschriften, voor allerlei vakgebieden. Maar geen A-Z-lijst per reviewed tijdschriften voor alle wetenschappelijke disciplines.
Omdat er geen definitieve lijst op internet is te vinden, gaan we zelf een lijst maken, samengesteld uit diverse bronnen.
Web 2.0-achtige onderdelen van verschillende zoekmachines

Tijdens mijn stage bekijk ik de opties die verschillende zoekinterfaces aanbieden. Behalve naar Purple Search en zijn voorloper RUG Combine, heb ik VuFind (University of Villanova, Pennsylvania), Xerxes (California State University), de zoekmachine van de Staats- und Universitätsbibliothek Bremen (SUUB) en Primo University of Iowa vergeleken.
Wat valt op? Zijn er interessante opties voor PurpleSearch?
Web 2.0-achtige opties die PurpleSearch (nog) niet heeft:
- Zelf schrijven van een commentaar (VuFind, SUUB en Primo).
- Zelf tags toevoegen (VuFind, Xerxes, Primo)
- Aanbieden van inhoudsopgave (Primo)
- RSS op zoekresultaten (Primo)
- RSS op onderwerpscodes (SUUB)
- Sms van zoekresultaten (VuFind)
De volgende Web 2.0-achtige opties biedt PurpleSearch al:
- Recommendatie andere bestanden (alleen PurpleSearch (PS) en SUUB) en
- Zoeken in andere databases (alleen PS)
- Presenteren van andere versie van een gevonden editie
- Presentatie van boekomslagen in de zoekresultaten
- Zoeken op related phrases (alleen PS)
- My Library-optie (is meer Web1.0)
- Zelf schrijven van een review
- Subject cloud
- Aanvullen van zoektermen
Naast Web 2.0 achtige opties zijn er ook andere opties mogelijk:
- Zoekfunctie op exacte woorden of frase (niet met deze zoekinterfaces)
- Inperken zoekactie op aanwezige illustraties (alleen VuFind)
- Inperken zoekactie op taal (VuFind, SUUB, Primo) en materiaalsoort (zelfde plus Xerxes)
- Inperken zoekactie op classificatiecodes (Primo)
- Aanduideling percentage relevantie t.o.v. zoekvraag (heeft RUG Combine wel, PS niet)
- Inperken zoekactie op onderwerp (heeft RUG Combine; PS heeft een subject cloud)
- Vermelding Peer Reviewed in resultaten d.m.v. een icoontje!
- Aanbieden van titelbeschrijving in APA of MLA-stijl
- Citatie-export naar Bibsonomy, Connotea, Del.icio.us, Zotero
- Citatie-export naar Refman, EndNote, RefWorks (heeft PS)
- Een Ask Librarian-optie heeft PS m.o.m. (maar die zou wellicht duidelijker moeten)
Sommige van hierboven genoemde opties zouden zeker nuttig zijn in PS. Of een en ander technisch mogelijk is, moet nader uitgezocht worden. Bijvoorbeeld het aanbieden van inhoudsopgaves van boeken. Dat is natuurlijk afhankelijk van beschikbaarheid ervan, bijvoorbeeld in Google Books of bij e-Book-aanbieders.
Of bijvoorbeeld het aangeven met een icoontje, dat een gevonden artikel peer reviewed is.
Voor andere opties zal bekeken moeten worden, of het gewenst is. Bijvoorbeeld het toevoegen van tags door gebruikers, en die tags vervolgens doorzoekbaar maken.
Mijn zoektocht gaat verder: praten met deskundigen en gebruikers, en veel lezen staat op mijn programma.
Volgende week zal ik ook verder gaan met zoeken met PS.
Wordt vervolgd.
PurpleSearch, het zoeksysteem en zijn eigenaardigheden
Een van de onderdelen van mijn stage is het goed doorgronden van het zoeksysteem PurpleSearch (PS). PS is net als RUG Combine gebasseerd op de X-server van Ex Libris’ Metalib.
De zoeksystematiek van PurpleSearch
PurpleSearch is een hybride zoekmachine (‘smart combine harvester’). Door zoektermen in te voeren in PS, maakt het programma verbinding met allerlei (wetenschappelijke) databases over de wereld en zoekt PS (wetenschappelijke) literatuur. De resultaten worden naar Groningen gehaald, en gepresenteerd per database.
Om de zoektijd te bekorten, worden lokaal in Groningen indexen van zoekresultaten opgeslagen. Dat levert veel tijdwinst op.
Op de achtergrond zoekt PS ook in alle andere databases, zodat het systeem in welk bestand PS het beste kan zoeken bij een bepaalde zoekterm (recommender-functie).
Dat kan dus best een heel andere database zijn, dan een docent of student zelf zou bedenken.
Eigenaardigheden van PurpleSearch
Omdat PS eigenlijk pas dit najaar echt beschikbaar is, zijn voor bepaalde vakgebieden (bijvoorbeeld Letteren) nog maar weinig zoekacties gedaan. Dat heeft een effect op de resultaten die PS geeft. Soms zullen in eerste instantie niet de bestanden met de meeste treffers doorzocht worden. Omdat het systeem dat nog niet weet.
Bij instructiecolleges voor de afdeling IB/IO stelden we een vraag over literatuur zoeken in WorldWide Political Science Abstracts. Zoektermen waren “superpower China”. Met de native interface van WPSA vonden ze 315 treffers. Met PS een stuk of 6. Een WPSA werd niet als eerste doorzocht. Blijkbaar moet PS eerst een aantal zoekacties over dit onderwerp doorvoeren voordat WPSA boven komt drijven. Met de tijd zal de knowledgebase van PS gevuld worden.
Meer informatie over PurpleSearch: bezoek de wiki van PurpleSearch!





