skip to content

Institutsinterne Suche

Sie möchten ein Suchfeld auf Ihrer Instituts-Website einbinden, das nur Ihre Webseiten durchsucht.

Um die Ergebnisse Ihrer Suchanfrage einzugrenzen, können Sie die Suchfunktion auf bestimmte Seiten eingrenzen.

Suchanfrage

Das dafür notwendige Suchfeld erzeugen Sie mit den folgenden HTML-Anweisungen:

  • „inurl:“ Dieser Befehl steht als Präfix, zum Beispiel vor dem Verzeichnisnamen eines Webauftritts. Eine Suche mit „inurl:informatik“ wird nur Ergebnisse zeigen, die „informatik“ in der URL aufweisen.
  • „+OR+“ Hiermit lassen sich Dokumente auf verschiedene Bereiche verteilen. Es können mehrere inurl-Einschränkungen mit „+OR+“ zusammen stehen. Verwenden Sie keine Leerzeichen. Zum Beispiel: „inurl:rrzk+OR+inurl:themen+OR+inurl:/kurse“. Eine komplette INPUT-Anweisung lautet in HTML:

     

    <INPUT type="hidden"name="as_q"value="(inurl:rrzk+OR+inurl:themen+OR+inurl:/kurse)" />
  • „site“ Das Präfix „site:“ bewirkt, dass der Suchvorgang auf eine bestimmte Webseite (Domäne) eingegrenzt ist. „site:“ und „inurl:“ können problemlos kombiniert werden:

     

    <INPUT type="hidden" name="as_q" value="site:webapps.uni-koeln.de+inurl:kurse" />

Layout und Frontend

Anpassungen im Layout von Ergebnisseiten sind in geringem Maße möglich. Das gilt für Kopf sowie Fuß der Seite, wo beispielsweise der Institutsname und die Fakultät veränderbar sind. Beispiel: google.uni-koeln.de

Bitte beachten Sie, dass diese Änderungen ausschließlich von den Webmastern des RRZK durchgeführt werden können. Erstellen Sie hierfür Ihren Wunsch HTML-Code; sowohl für den Header als auch den Footer der Website.

Hinweis: Externe Style Sheet-Dateien können nicht eingebunden werden, ebenso keine SHTML-Codes. Legen Sie Formatierungen stattdessen über den Parameter <… style=“…“> fest.

Wir bauen anhand dieser Angaben ein „Google-Frontend“, welches den Namen des jeweiligen Instituts enthält. Auf diesen Namen wird beim Aufruf der lokalen Google-Suche Bezug genommen:

  • In der form-Anweisung für das Suchfeld. Dort ist „default“ durch den Frontend-Namen zu ersetzen. Am Beispiel des Instituts I für Deutsche Sprache und Literatur (idsl1) heißt das:

     

    name="client" value="idsl1_frontend"

     

    name="proxystylesheet" value="idsl1_frontend"
  • Im HTML-Code des Headers der Seite. Ist eine fremdsprachige Version der Suchseite vorgesehen, passen Sie bitte den für den Kopf der Seite an.

Es stehen noch weitere Möglichkeiten zur Verfügung:

  • Die Suche auf vorgegebene Pfade oder Server mit einem Filter einschränken.
  • Ein "Remove"-Filter zum Sperren von Verzeichnissen. Das auch wie in der Übersichtsseite beschrieben mittels der Datei robots.txt möglich ist.

XML-Ausgabe

Um Suchergebnisse in ein eigenes Seiten-Layout einzubetten oder weiterzuverarbeiten, nutzen Sie die XML-Ausgabe. Suchanfrage oder Verarbeitung betten Sie in einem Skript ein, welches über den Google-Aufruf „wget“ erfolgen kann. Dabei werden die oben in den <INPUT>-Tags angegebenen Parameter als Vorgaben beim Aufruf von Google übergeben. Ein Beispiel:

    wget -O file http://google.uni-koeln.de/search?q=Suchbegriff&as_q=URL&client=default_frontend&output=xml&ie=iso-8859-1&hl=de

Weiter exemplarisch: Die Suche nach „SPSS Kurs“ auf den Seiten unterhalb www.uni-koeln.de/rrzk. Die Ergebnisse sind in die Datei ergebnis.xml geschrieben:

    wget -O ergebnis.xml http://google.uni-koeln.de/search?q=spss+kurs&as_q=www.uni-koeln.de/rrzk&client=default_frontend&output=xml&ie=iso-8859-1&hl=de

Bitte beachten Sie, dass die Sonderzeichen in Parameterwerten des query string der URL-kodiert beziehungsweise URL-escaped sein müssen. Alternativ: Die URL-Kodierung bietet für jedes Byte eines Zeichens einen entsprechenden Zeichencode an. Bei den beiden gängigen Kodierungen von ISO-889-1 und UTF-8 folgt es dem Schema %-Zeichen, gefolgt von zwei weiteren Zeichen. So wird aus „ä“ %e4 beziehungsweise %c3%a4.

Zudem bietet Google SOAP-Schnittstellen, über die ein Extrakt des XML-Files erhältlich ist, das möglicherweise leichter zu verarbeiten ist. Zunächst kann ein SOAP-Array erzeugt werden, das durch ein kleines Skript "lesbar" gemacht wird. Da hierfür individuelle kleinere Skripte erforderlich sind, bitten wir Sie, vor der Nutzung mit den RRZK-Webmastern zu sprechen.

Dokumentation für die XML-Ausgabe: Google-Referenz-Manual (Suchprotokollreferenz)

Sprachen

Google unterstützt viele Sprachen, die beim individuellen Frontends grundsätzlich realisierbar sind. Die Auswahl des passenden Frontends läuft standardmäßig über die Spracheinstellung des genutzten Browsers der Besuchenden. Sie kann aber auch gezielt über einen Parameter im Link erfolgen (siehe unten). Das Frontend kann - muss aber nicht - so eingestellt werden, dass nur Dokumente in der eingestellten Sprache gesucht werden. Die Spracherkennung eines Dokumentes erfolgt nicht über HTML-Spezifikationen, sondern durch Google über Texterkennung.

Anmerkung zu Footer und Header:

Die RRZK-Suchseite wird in Deutsch und Englisch angeboten. Im Ankermenü rechts oben erfolgt der Sprachwechsel. Dort muss in den darunterliegenden Links die jeweils anderssprachige Suchseite verlinkt werden. Das setzt voraus, dass der oben angegebene HTML-Code für Kopf und Fuß auch in zwei Sprachen vorhanden ist. Die Verlinkung sieht dann wie folgt aus:

http: //google.uni-koeln.de/search?&client=rrzk_frontend&output=xml_no_dtd&proxystylesheet=rrzk_frontend&hl=en&proxycustom=<HOME/>

Die Sprachbestimmung ausschließlich über den Parameter „hl=en“ beziehungsweise „hl=de“.

Aufruf einer Suchseite und Parameter

Eine Standardsuchseite, die ein Eingabefeld, Links auf die Komfortsuche oder Links auf eine Hilfeseite enthält, lässt sich über den folgenden Link aufrufen:

http://google.uni-koeln.de/search?&client=default_frontend&output=xml_no_dtd&proxystylesheet=default_frontend&hl=en

  • Die Spezifikationen „default_frontend“ beziehen sich auf das oben angegebene Frontend. Damit wird die Standardsuchseite der Universität gewählt. Analog kann über einen individuellen Namen des Frontends eine andere lokale Suchseite gewählt werden.
  • Über den Parameter „hl“ wird die Sprache ausgewählt, zum Beispiel über „hl=de“ die deutschsprachige Suchseite und „hl=en“ die englischsprachige, soweit definiert.

Weitere Parameter können beim Aufruf übergeben werden. Eine Liste enthält der Abschnitt Suchparameter der Referenzdokumentation. Diese Parameter können auch bei dem eingangs beschriebenen Suchfeld in folgender Anweisung Verwendung finden („name“ ist der Parametername und „value“ die dazugehörige Spezifikation):

<INPUT type="hidden" name="..." value="..."/>

Contact
If you have any questions or problems, please contact the RRZK-Helpdesk