|
Sie können nach jedem Wort oder Ausdruck auf einer Website suchen, indem Sie das Wort
oder den Ausdruck in ein Abfrageformular eingeben und auf die Schaltfläche klicken, mit
der die Abfrage ausgeführt wird (z. B. die Schaltfläche Suchen im
Beispielabfrageformular). In diesem Abschnitt werden folgende Themen behandelt:
- Boolesche Operatoren und Nähe-Operatoren:
Erläutert, wie mit Booleschen und Nähe-Operatoren präzise Abfragen erstellt werden
können.
- Platzhalterzeichen: Ermöglicht die Suche nach
Seiten mit Wörtern, die einem vorgegebenen Wort ähnlich sind.
- Volltextabfragen: Beschreibt, wie eine
Abfrage auf der Grundlage der Bedeutung eines Ausdrucks anstelle des exakten Wortlauts
formuliert werden kann.
- Vektorraumabfragen: Erläutert, wie
Abfrageergebnisse erzielt werden können, die mit einer Liste von Wörtern und Ausdrücken
übereinstimmen.
- Eigenschaftswertabfragen:
Beschreibt, wie eine Abfrage nach den Eigenschaftswerten einer Datei durchgeführt werden
kann.
- Abfragebeispiele: Gibt Beispiele für
unterschiedliche Abfragen.
- Liste mit Eigenschaftsnamen: Nennt und
beschreibt Eigenschaftsnamen, die ständig für Abfragen verfügbar sind.
Durch Suchvorgänge wird eine Liste von Dateien erstellt, die das Wort oder den
Ausdruck unabhängig von der jeweiligen Position im Text enthalten. In dieser Liste stehen
die Regeln für das Formulieren von Abfragen:
- Aufeinander folgende Wörter gelten als ein Ausdruck; sie müssen in dem
übereinstimmenden Dokument in derselben Reihenfolge stehen.
- In den Abfragen wird nicht nach Groß- und Kleinschreibung unterschieden, die Abfragen
können demnach mit Groß- oder Kleinbuchstaben geschrieben werden.
- Sie können nach jedem beliebigen Wort suchen, ausgenommen sind die Wörter der
Ausnahmeliste (für Englisch sind diese a, an, and, as
und andere häufig vorkommende Wörter), die während einer Suche ignoriert werden.
- Die Wörter der Ausnahmeliste werden bei Ausdruck- und Nähe-Abfragen wie Platzhalter
behandelt. Suchen Sie beispielsweise nach "Word für Windows", können
"Word für Windows" und "Word und Windows" als Ergebnis zurückgegeben
werden, da für ein nicht signifikantes Wort ist und in der Ausnahmeliste steht.
- Satzzeichen wie Punkt (.), Doppelpunkt (:), Semikolon (;) und Komma (,) werden bei der
Suche ignoriert.
- Wenn Sonderzeichen wie &, |, ^, #, @, $, (, ) in einer Abfrage verwendet werden,
muss die Abfrage in Anführungszeichen (") gesetzt werden.
- Wenn nach einem Wort oder Ausdruck mit Anführungszeichen gesucht werden soll, muss der
gesamte Ausdruck in Anführungszeichen gesetzt werden. Weiterhin müssen um das Wort oder
die Wörter, die in Anführungszeichen stehen sollen, noch einmal Anführungszeichen
gesetzt werden. Bei "World Wide Web oder ""Web""" wird
beispielsweise nach World Wide Web oder "Web" gesucht.
- Sie können auch Boolesche Operatoren (AND, OR
und NOT) und den Nähe-Operator (NEAR)
einsetzen, um zusätzliche Daten für die Suche anzugeben.
- Mit dem Platzhalterzeichen (*) kann nach Wörtern gesucht
werden, die ein vorgegebenes Präfix haben. Bei der Abfrage entf* werden Ausdrücke wie
"ENTF", "entfernen" usw. gesucht.
- Volltextabfragen können ohne Rücksicht auf die
Abfragesyntax angegeben werden.
- Vektorraumabfragen können angegeben werden.
- Es können auch Abfragen von Eigenschaftswerten für
ActiveX (OLE) und Dateieigenschaften erstellt werden.
Mit Booleschen und Nähe-Operatoren kann eine präzisere Abfrage erstellt werden.
| Suche |
Beispiel |
Ergebnisse |
| Zwei Begriffe auf derselben Seite |
Zugriff and Standard
-Oder -
Zugriff & Standard |
Seiten mit den beiden Wörtern "Zugriff" und
"Standard" |
| Einer der beiden Begriffe auf einer Seite |
cgi or isapi
-Oder -
cgi | isapi |
Seiten mit den Wörtern "cgi" oder "isapi" |
| Der erste Begriff ohne den zweiten Begriff |
Zugriff and not Standard
-Oder-
Zugriff & ! Standard |
Seiten mit dem Wort "Zugriff" und ohne das Wort
"Standard" |
| Seiten, bei denen ein Eigenschaftswert abweicht |
not @size = 100
- Oder -
! @size = 100 |
Seiten, die nicht 100 Byte umfassen. |
| Beide Begriffe auf derselben Seite und in gewissem Abstand voneinander |
Excel near Projekt
- Oder -
Excel ~ Projekt |
Seiten, auf denen das Wort "Excel" in der Nähe des Wortes
"Projekt" steht |
Hinweise:
- Durch Hinzufügen von Klammern können Ausdrücke innerhalb einer Abfrage verschachtelt
werden. Die Ausdrücke in Klammern werden vor dem Rest der Abfrage ausgewertet.
- Mit Anführungszeichen (") kann angezeigt werden, dass ein Boolesches oder ein NEAR-Operatorschlüsselwort
in der Abfrage ignoriert wird. Bei "Abbott and Costello" werden beispielsweise
Seiten gesucht, die diesen Ausdruck enthalten, nicht Seiten, die mit dem Booleschen
Ausdruck übereinstimmen. Neben der Funktion als Operator ist das Wort and im
Englischen auch ein nicht signifikantes Wort.
- Der Operator NEAR ist mit dem Operator AND
vergleichbar, denn NEAR gibt eine Übereinstimmung zurück, wenn sich
beide gesuchten Begriffe auf einer Seite befinden. Der Operator NEAR
unterscheidet sich jedoch von AND, da der durch NEAR
zugewiesene Rang von der Nähe der Wörter zueinander abhängt. Dies bedeutet, dass der
Rang einer Seite, bei der die beiden gesuchten Wörter näher zusammenstehen, höher oder
gleich dem Rang einer Seite ist, bei der die Wörter weiter voneinander entfernt sind.
Beträgt der Abstand zwischen den gesuchten Wörtern mehr als 50 Wörter, so gilt der
Abstand als zu groß, und die Seite wird mit Null eingestuft.
- Der Operator NOT kann nur nach einem AND-Operator in
Inhaltsabfragen verwendet werden; mit ihm können Seiten ausgeschlossen werden, bei denen
eine vorherige Inhaltsbeschränkung zutrifft. In Eigenschaftswertabfragen kann der NOT-Operator
unabhängig vom AND-Operator eingesetzt werden.
- Der AND-Operator hat eine höhere Priorität als OR.
Die ersten drei Abfragen sind beispielsweise gleich, aber die vierte Abfrage ist anders: a
AND b OR c
c OR a AND b
c OR (a AND b)
(c OR a) AND b.
Anmerkung Die Symbole (&, |, !, ~) und die
englischen Schlüsselwörter AND, OR, NOT
und NEAR haben in allen von Index Server unterstützten Sprachen
dieselben Funktionen. Es stehen auch lokalisierte Schlüsselwörter zur Verfügung, wenn
das Gebietsschema des Browsers auf eine der folgenden sechs Sprachen gesetzt ist:
| Sprache |
Schlüsselwörter |
| Deutsch |
UND, ODER, NICHT, NAH |
| Französisch |
ET, OU, SANS, PRES |
| Spanisch |
Y, O, NO, CERCA |
| Niederländisch |
EN, OF, NIET, NABIJ |
| Schwedisch |
OCH, ELLER, INTE, NÄRA |
| Italienisch |
E, O, NO, VICINO |
Anmerkung Der NEAR-Operator kann nur bei Wörtern
oder Ausdrücken eingesetzt werden.
Mit Platzhaltern können Sie nach Seiten suchen, die ähnliche
Wörter wie das vorgegebene Wort enthalten.
Das Abfragemodul sucht nach Seiten, die die Wörter und
Ausdrücke in einer Volltextabfrage am besten treffen. Dies geschieht durch eine
automatische Suche nach Seiten, die mit der Bedeutung übereinstimmen, nicht mit dem
exakten Wortlaut der Abfrage. Boolesche, Nähe- und Platzhalter-Operatoren werden
innerhalb einer Volltextabfrage ignoriert. Der Volltextabfrage wird $contents
vorangestellt.
Das Abfragemodul unterstützt Vektorraumabfragen. Vektorabfragen geben Seiten zurück,
die mit einer Liste von Wörtern und Ausdrücken übereinstimmen. Der Rang jeder Seite
zeigt an, wie gut die Seite mit der Abfrage übereinstimmt.
| Suche |
Beispiel |
Ergebnisse |
| Seiten, die bestimmte Wörter enthalten. |
Licht, Lampe |
Dateien mit Wörtern, die am besten mit den gesuchten Wörtern
übereinstimmen |
| Seiten, die gewichtete Präfixe, Wörter und Ausdrücke enthalten. |
Erf*, Licht[50], Lampe[10],
"Glühlampe"[400] |
Dateien, die Wörter mit dem Präfix "Erf", die Wörter
"Licht", "Lampe" und den Ausdruck "Glühlampe" enthalten
(die Begriffe sind gewichtet). |
- Die Komponenten in Vektorabfragen sind durch Kommas getrennt.
- Komponenten in Vektorabfragen können gewichtet werden, indem die Syntax [weight]
verwendet wird.
- Die bei Vektorabfragen zurückgegebenen Seiten müssen nicht alle Begriffe der Abfrage
enthalten.
- Vektorabfragen sind besonders geeignet, wenn die Ergebnisse sortiert werden.
Mit Eigenschaftswertabfragen kann nach Dateien gesucht werden, deren Eigenschaftswerte
mit vorgegebenen Kriterien übereinstimmen. Zu den Eigenschaften, die abgefragt werden
können, zählen grundlegende Dateiinformationen wie Dateiname und Dateigröße sowie
ActiveX-Eigenschaften wie die Dokumentzusammenfassung (Informationen), die in Dateien
gespeichert sind, die durch ActiveX-erkennende Anwendungen erstellt wurden.
Es gibt zwei Arten von Eigenschaftsabfragen:
- Relationale Eigenschaftsabfragen bestehen aus
einem "at"-Zeichen (@), einem Eigenschaftsnamen,
einem relationalen Operator und einem Eigenschaftswert. Um nach allen Dateien mit mehr als einer
Million Byte zu suchen, können Sie die Abfrage @size > 1000000 ausgeben.
- Eigenschaftsabfragen mit regulärem Ausdruck bestehen aus einem Nummernzeichen
(#), einem Eigenschaftsnamen und einem regulären Ausdruck
für den Eigenschaftswert. Um beispielsweise nach allen Videodateien (.avi) zu suchen,
müssen Sie die Abfrage #filename *.avi ausgeben. Reguläre Ausdrücke stimmen nie mit den
besonderen Eigenschaften Contents (#contents) und All
(#all) überein. Eigenschaften, die zur Zeit der Abfrage nicht abrufbar sind, können in
#-Abfragen nicht verwendet werden. Dazu zählen HTML META-Eigenschaften, die nicht im
Eigenschaften-Cache gespeichert sind.
In diesem Abschnitt werden folgende Themen erläutert:
Den Eigenschaftsnamen geht entweder das "at"-Zeichen (@) oder das
Nummernzeichen (#) voran. Verwenden Sie @ für relationale Abfragen und # für Abfragen
mit regulären Ausdrücken.
Ist kein Eigenschaftsname angegeben, wird @contents vorausgesetzt.
Folgende Eigenschaften sind für alle Dateien verfügbar:
| Eigenschaftsname |
Beschreibung |
| All |
Sucht Übereinstimmungen von Wörtern, Ausdrücken und einer beliebigen
Eigenschaft |
| Contents |
Wörter und Ausdrücke in der Datei |
| Filename |
Dateiname |
| Size |
Dateigröße |
| Write |
Letztes Änderungsdatum der Datei |
Auch ActiveX-Eigenschaftswerte können in Abfragen verwendet werden. Websites mit
Dateien, die durch die meisten ActiveX-erkennenden Anwendungen erstellt wurden, können
nach den folgenden Eigenschaften abgefragt werden:
| Eigenschaftsname |
Beschreibung |
| DocTitle |
Titel des Dokuments |
| DocSubject |
Thema des Dokuments |
| DocAuthor |
Verfasser des Dokuments |
| DocKeywords |
Schlüsselwörter des Dokuments |
| DocComments |
Kommentare zum Dokument |
Eine vollständige Liste der Eigenschaftsnamen finden Sie unter Liste mit Eigenschaftsnamen weiter hinten in diesem Text.
Relationale Operatoren werden in Abfragen nach relationalen Eigenschaften verwendet.
| Suche |
Beispiel |
Ergebnisse |
| Eigenschaftswerte in Beziehung zu einem festen Wert |
@size < 100
@size <= 100
@size = 100
@size != 100
@size >= 100
@size > 100 |
Dateien, deren Größe mit der Abfrage übereinstimmt. |
| Eigenschaftswerte, bei denen alle Bits eines Satzes an sind. |
@attrib ^a 0x820 |
Komprimierte Dateien, bei denen das Archivbit an ist. |
| Eigenschaftswerte, bei denen einige Bitsätze an sind. |
@attrib ^s 0x20 |
Dateien, bei denen das Archivbit an ist |
| Suche |
Beispiel |
Ergebnisse |
| Ein bestimmter Wert |
@DocAuthor = Bert Blum |
Dateien, die von "Bert Blum" verfasst wurden. |
| Werte, die mit einem Präfix beginnen. |
#DocAuthor Georg* |
Dateien, deren Verfassername mit "Georg" beginnt. |
| Dateien mit einer beliebigen Erweiterung aus einem Satz von
Erweiterungen. |
#filename *.|(exe|,dll|,sys|) |
Dateien mit .exe-, .dll- oder .sys-Erweiterung |
| Dateien, die nach einem bestimmten Datum verändert wurden |
@write > 96/2/14 10:00:00 |
Dateien, die nach dem 14. Februar 1996, 10:00 GMT geändert wurden. |
| Dateien, die nach einer relativen Datumsangabe geändert wurden. |
@write > -1d2h |
Dateien, die in den letzten 26 Stunden geändert wurden. |
| Vektoren, die mit einem Vektor übereinstimmen |
@vectorprop = { 10, 15, 20 } |
ActiveX-Dokumente mit einem vectorprop-Wert von { 10, 15, 20 } |
| Vektoren, bei denen jeder Wert mit der Vorgabe übereinstimmt. |
@vectorprop >^a 15 |
ActiveX-Dokumente mit einem vectorprop-Wert, bei dem alle Werte in dem
Vektor größer als 15 sind. |
| Vektoren, bei denen mindestens ein Wert mit der Vorgabe übereinstimmt |
@vectorprop =^s 15 |
ActiveX-Dokumente mit einem vectorprop-Wert, bei dem mindestens ein Wert
15 beträgt. |
- Vor den Eigenschaftsnamen muss ein Nummernzeichen (#) gesetzt werden, wenn ein
regulärer Ausdruck in einem Eigenschaftswert verwendet wird, in allen anderen Fällen ist
ein "at"-Zeichen (@) zu verwenden. Der relationale Operator Gleichheitszeichen
(=) wird für Abfragen mit einem regulären Ausdruck vorausgesetzt.
- Der Dateiname (#filename) ist die einzige Eigenschaft, die reguläre Ausdrücke mit
Platzhaltern zur linken Seite des Textes effizient unterstützt.
- Datums- und Zeitwerte haben das Format tt/mm/jjjj hh:mm:ss oder tt-mm-jjjj
hh:mm:ss. Die zwei ersten Zahlen der Jahreszahl und die Zeitangabe können
ausgelassen werden. Werden die ersten beiden Zahlen der Jahresangabe ausgelassen, wird 29
oder eine kleinere Zahl als Jahr 2000 interpretiert, und 30 oder eine größere Zahl wird
als 1900 interpretiert. Alle Datums- und Zeitangaben sind in mittlerer Zeit Greenwich
(Greenwich Mean Time = GMT) angegeben.
- Datums- und Zeitangaben, die relativ zur aktuellen Zeit sind, können mit einem
Minuszeichen (-) gefolgt von Null oder durch weitere Paare von Ganzzahleinheiten und
Zeiteinheiten ausgedrückt werden. Zeiteinheiten werden wie folgt ausgedrückt: (j) für
Jahre, (m) für Monate, (w) für Wochen, (t) für Tage, (h) für Stunden, (n) für Minuten
und (s) für Sekunden. Bei Datumsangaben kann wahlweise ein dreistelliger Wert für
Millisekunden hinter dem Wert für Sekunden angegeben werden. Zum Beispiel: 08.12.1997
10:10:03:452
- Währungswerte haben das Format x,y, wobei x der Ganzbetrag des Wertes
ist und y der Teilbetrag. Es gibt keine Vorgabe für Einheiten.
- Boolesche Werte sind (t) oder (true) für TRUE und (f) oder (false)
für FALSE.
- Vektoren (VT_VECTOR) werden als öffnende Klammer ({) gefolgt von einer durch Kommas
getrennten Werteliste und einer schließenden Klammer (}) ausgedrückt.
- Einzelwertausdrücke, die mit Vektoren verglichen werden, werden als relationaler Operator ausgedrückt, danach folgt (^a) für
all of oder (^s) für some of.
- Numerische Werte können dezimal oder hexadezimal sein (0x wird vorangestellt).
- Die contents-Eigenschaft unterstützt keine relationalen Operatoren. Ist ein
relationaler Operator angegeben, werden keine Ergebnisse zurückgegeben. Bei der Abfrage
@contents Microsoft werden beispielsweise Dokumente gesucht, die Microsoft enthalten, bei
@contents=Microsoft wird jedoch kein Dokument zurückgegeben.
Reguläre Ausdrücke in Eigenschaftsabfragen sind folgendermaßen definiert:
- Alle Zeichen außer Sternchen (*), Punkt (.), Fragezeichen (?) und senkrechter
Strich (|) stimmen standardmäßig nur mit dem jeweiligen Zeichen überein.
- Reguläre Ausdrücke können in Anführungszeichen stehen (") und müssen sogar in
Anführungszeichen stehen, wenn sie ein Leerzeichen ( ) oder eine schließende Klammer ())
enthalten.
- Die Zeichen *, . und ? werden wie bei Windows behandelt; sie stimmen mit einer
beliebigen Anzahl von Zahlen, mit (.) oder mit dem Ende einer Zeichenfolge überein sowie
mit jedem einzelnen entsprechenden Zeichen.
- Das Zeichen | ist ein Escape-Zeichen. Hinter | folgende Zeichen haben eine besondere
Bedeutung:
( öffnet eine Gruppe. Der Klammer muss entsprechend ) folgen.
) schließt eine Gruppe. Der Klammer muss ( vorangehen.
[ öffnet eine Zeichenklasse. Dem Zeichen muss entsprechend ] folgen.
{ öffnet eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend } folgen.
} schließt eine gezählte Übereinstimmung. Dem Zeichen muss entsprechend {
vorangehen.
, trennt OR-Abschnitte.
* ordnet keine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem
vorangehenden Ausdruck zu.
? ordnet keine oder eine auftretende Übereinstimmung mit dem vorangehenden Ausdruck
zu.
+ ordnet eine Übereinstimmung oder mehrere auftretende Übereinstimmungen mit dem
vorangehenden Ausdruck zu.
Alle anderen Zeichen, einschließlich |, stimmen mit dem jeweiligen Zeichen überein.
- Folgende Zeichen haben in eckige Klammern ([]) gesetzt eine besondere Bedeutung:
^ sucht nach allem außer nach folgenden Klassen. Es muss das erste Zeichen sein.
] sucht nach ]. Ihm kann nur ^ vorangestellt sein, sonst schließt es eine Klasse.
- Bereichsoperator. Davor und dahinter stehen normale Zeichen.
Alle anderen Zeichen stimmen mit den jeweiligen Zeichen überein (oder beginnen bzw.
beenden selbst einen Bereich).
- Zwischen geschweiften Klammern ({}) gilt folgende Syntax:
|{m|} sucht exakt nach m Vorfällen des vorangehenden Ausdrucks. (0 < m
< 256).
|{m,|} sucht nach mindestens m Vorfällen des vorangehenden Ausdrucks. (1 <
m < 256).
|{m,n|} sucht nach m bis n Vorfällen des vorangehenden Ausdrucks
(einschließlich). (0 < m < 256, 0 < n < 256).
- Um nach *, . und ? zu suchen, müssen diese Zeichen in Klammern gesetzt werden
(z. B.: |[*]Beispiel sucht nach "*Beispiel").
| Beispiel |
Ergebnisse |
@size > 1000000 |
Seiten, die größer als eine Million Byte sind. |
@write > 95/12/23 |
Seiten, die nach diesem Datum geändert worden sind. |
Apfelbaum |
Seiten mit dem Ausdruck "Apfelbaum". |
"apfelbaum" |
Siehe oben |
@contents apfelbaum |
Siehe oben |
Microsoft and @size > 1000000 |
Seiten mit dem Wort "Microsoft", die größer als eine Million
Byte sind. |
"microsoft and @size >
1000000" |
Seiten mit dem angegebenen Ausdruck (nicht wie oben). |
#filename *.avi |
Videodateien (das Präfix # wird verwendet, weil die Abfrage einen
regulären Ausdruck enthält). |
@attrib ^s 32 |
Seiten, bei denen das Archivbit an ist. |
@docauthor = Johannes Schmidt |
Seiten, die der angegebene Verfasser erstellt hat. |
$contents warum ist der Himmel blau? |
Seiten, die mit der Abfrage übereinstimmen |
@size < 100 & #filename *.gif |
Dateien im Grafik-Austausch-Format (Graphics Interchange Format = GIF),
die kleiner als 100 Byte sind. |
Diese Eigenschaften stehen für Abfragen immer zur Verfügung. Zusätzliche
Eigenschaften können abhängig von der Konfiguration des Webservers ebenfalls verfügbar
sein.
| Name |
Datentyp |
Eigenschaft |
| A_HRef |
DBTYPE_WSTR | DBTYPE_BYREF |
Text für HTML HREF. Dieser Eigenschaftsname wurde für
Microsoft® Site Server erstellt und entspricht dem Eigenschaftsnamen HtmlHRef unter Index
Server. Kann zwar abgefragt, aber nicht abgerufen werden. |
| Access |
VT_FILETIME |
Datum des letzten Zugriffs auf die Datei. |
| All |
(nicht anwendbar) |
Sucht nach jeder Eigenschaft für eine Zeichenfolge. Kann
zwar abgefragt, aber nicht abgerufen werden. |
| AllocSize |
DBTYPE_I8 |
Größe der Datenträgerzuweisung für eine Datei. |
| Attrib |
DBTYPE_UI4 |
Dateieigenschaften. In Win32 SDK dokumentiert. |
| ClassId |
DBTYPE_GUID |
Klassenbezeichnung eines Objekts, z. B. WordPerfect,
Word usw. |
| Characterization |
DBTYPE_WSTR | DBTYPE_BYREF |
Charakterisierung oder Auszug des Dokuments. Wird von Index
Server verarbeitet. |
| Contents |
(nicht anwendbar) |
Hauptinhalt der Datei. Kann zwar abgefragt, aber nicht
abgerufen werden. |
| Create |
VT_FILETIME |
Erstellungsdatum der Datei. |
| Directory |
DBTYPE_WSTR | DBTYPE_BYREF |
Physischer Pfad der Datei, ohne Dateinamen. |
| DocAppName |
DBTYPE_WSTR | DBTYPE_BYREF |
Name der Anwendung, mit der die Datei erstellt wurde. |
| DocAuthor |
DBTYPE_WSTR | DBTYPE_BYREF |
Verfasser des Dokuments. |
| DocByteCount |
DBTYPE_14 |
Anzahl von Byte im Dokument. |
| DocCategory |
DBTYPE_STR | DBTYPE_BYREF |
Dokumentart wie Memo, Zeitplan oder leeres Dokument. |
| DocCharCount |
DBTYPE_I4 |
Anzahl der Zeichen im Dokument. |
| DocComments |
DBTYPE_WSTR | DBTYPE_BYREF |
Kommentare über das Dokument. |
| DocCompany |
DBTYPE_STR | DBTYPE_BYREF |
Name des Unternehmens, für das das Dokument geschrieben wurde. |
| DocCreatedTm |
VT_FILETIME |
Datum, an dem das Dokument erstellt wurde. |
| DocEditTime |
VT_FILETIME |
Zeit, die insgesamt zum Bearbeiten des Dokuments benötigt
wurde. |
| DocHiddenCount |
DBTYPE_14 |
Anzahl der verborgenen Folien in einem Microsoft® PowerPoint-Dokument. |
| DocKeywords |
DBTYPE_WSTR | DBTYPE_BYREF |
Schlüsselwörter des Dokuments. |
| DocLastAuthor |
DBTYPE_WSTR | DBTYPE_BYREF |
Benutzer, der das Dokument zuletzt bearbeitet hat. |
| DocLastPrinted |
VT_FILETIME |
Zeitangabe, wann das Dokument zuletzt gedruckt wurde. |
| DocLastSavedTm |
VT_FILETIME |
Zeitangabe, wann das Dokument zuletzt gespeichert wurde. |
| DocLineCount |
DBTYPE_14 |
Anzahl der Zeilen in einem Dokument. |
| DocManager |
DBTYPE_STR | DBTYPE_BYREF |
Name des Managers des Verfassers eines Dokuments. |
| DocNoteCount |
DBTYPE_14 |
Anzahl der Seiten mit Anmerkungen in einem PowerPoint-Dokument. |
| DocPageCount |
DBTYPE_I4 |
Anzahl der Seiten im Dokument. |
| DocParaCount |
DBTYPE_14 |
Anzahl der Absätze in einem Dokument. |
| DocPartTitles |
DBTYPE_STR | DBTYPE_VECTOR |
Namen von Teilen eines Dokuments. Bei Excel gelten beispielsweise die Namen von
Arbeitsmappen als Titel von Teilen, bei PowerPoint sind dies Folientitel und bei Word für
Windows die Namen der Dokumente im Zentraldokument. |
| DocPresentationTarget |
DBTYPE_STR|DBTYPE_BYREF |
Zielformat (35 mm, Drucker, Video usw.) für eine Präsentation in PowerPoint. |
| DocRevNumber |
DBTYPE_WSTR | DBTYPE_BYREF |
Aktuelle Versionsnummer des Dokuments. |
| DocSlideCount |
DBTYPE_14 |
Anzahl der Folien in einem PowerPoint-Dokument. |
| DocSubject |
DBTYPE_WSTR | DBTYPE_BYREF |
Thema des Dokuments. |
| DocTemplate |
DBTYPE_WSTR | DBTYPE_BYREF |
Name der Vorlage für das Dokument. |
| DocTitle |
DBTYPE_WSTR | DBTYPE_BYREF |
Titel des Dokuments. |
| DocWordCount |
DBTYPE_I4 |
Anzahl der Wörter im Dokument. |
| FileIndex |
DBTYPE_I8 |
Eindeutige ID der Datei. |
| FileName |
DBTYPE_WSTR | DBTYPE_BYREF |
Dateiname. |
| HitCount |
DBTYPE_I4 |
Anzahl der Treffer (Wörter, die mit der Abfrage
übereinstimmen) in einer Datei. |
| HtmlHRef |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML HREF. Kann zwar abgefragt, aber nicht
abgerufen werden. |
| HtmlHeading1 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H1-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| HtmlHeading2 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H2-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| HtmlHeading3 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H3-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| HtmlHeading4 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H4-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| HtmlHeading5 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H5-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| HtmlHeading6 |
DBTYPE_WSTR | DBTYPE_BYREF |
Text aus HTML-Dokument im H6-Stil. Kann zwar abgefragt,
aber nicht abgerufen werden. |
| Img_Alt |
DBTYPE_WSTR | DBTYPE_BYREF |
Alternativer Text für <IMG>-Marken. Kann zwar
abgefragt, aber nicht abgerufen werden. |
| Path |
DBTYPE_WSTR | DBTYPE_BYREF |
Vollständiger physischer Pfad der Datei, einschließlich
Dateinamen. |
| Rank |
DBTYPE_I4 |
Rang der Zeile. Reicht von 0 bis 1000. Je größer die Zahl,
desto besser die Übereinstimmung. |
| RankVector |
DBTYPE_I4 | DBTYPE_VECTOR |
Ränge der einzelnen Komponenten einer Vektorabfrage. |
| ShortFileName |
DBTYPE_WSTR | DBTYPE_BYREF |
Kurzer (8.3) Dateiname. |
| Size |
DBTYPE_I8 |
Dateigröße in Byte. |
| USN |
DBTYPE_I8 |
Aktualisierungssequenznummer. Nur bei NTFS-Laufwerken. |
| VPath |
DBTYPE_WSTR | DBTYPE_BYREF |
Vollständiger virtueller Pfad der Datei, einschließlich
Dateinamen. Gibt es mehrere mögliche Pfade, wird die beste Übereinstimmung für diese
Abfrage ausgewählt. |
| WorkId |
DBTYPE_I4 |
Interne ID für die Datei. Wird von Index Server verwendet. |
| Write |
VT_FILETIME |
Zeitangabe des letzten Schreibzugriffs auf eine Datei. |
Definieren neuer Eigenschaftsnamen
Wenn Sie Eigenschaften definieren möchten, die nicht in der vorherigen Liste
vorkommen, müssen Sie sie in einem [Names]-Abschnitt in der .idq-Datei speichern. Wenn
Sie diese Eigenschaften in einer Einschränkung, Sortierfestlegung oder als abgerufene
Spalte verwenden möchten, müssen Sie sie in der .idq-Datei definieren, indem Sie
folgendes Format verwenden:
[Names]
#Eigenschaften, die sich nicht in der Standardliste
Eigenschaftsname ( Datentyp) = GUID ["Name"
| propid]
In der Syntax steht "Name" für den Eigenschaftsnamen ("Verkauf"
im nachfolgenden Beispiel), und propid steht für die in hexadezimalen Zahlen
angegebene Eigenschafts-ID. Beachten Sie, dass Sie den Aliasnamen in Anführungszeichen
setzen müssen, die Eigenschafts-ID jedoch ohne Anführungszeichen verwendet wird.
Sie möchten beispielsweise als Eigenschaftsnamen eine HTML-Metamarke definieren, die
Beutzer als Suchkriterium verwenden können. Die zu definierende Eigenschaft ist Verkauf.
So definieren Sie die Eigenschaft Verkauf
- Fügen Sie in der .idq-Datei im Abschnitt [Names] folgende Zeile hinzu:
MetaBeschreibung(DBTYPE_WSTR) = d1b5d3f0-c0b3-11cf-9a92-00a0c908dbf1
"Verkauf"
Die Angabe für den GUID wird über den Registrierungsparameter MetaTagClsid
festgelegt, der sich unter folgendem Pfad befindet:
HKEY_LOCAL_MACHINE
\SYSTEM
\CurrentControlSet
\Control
\HtmlFilter
\MetaTagClsid
- Legen Sie anschließend die Meta-Beschreibung für die HTML-Dateien fest, in denen die
Marke enthalten sein soll.
Geben Sie zum Beispiel an, dass Sie alle Dateien mit Verkaufsprognosen suchen möchten:
In Datei1.htm:
<META NAME="Verkauf" CONTENT="Prognosen für 1998">
In Datei2.htm:
<META NAME=" Verkauf" CONTENT=" Prognosen für 1999">
In Datei3.htm:
<META NAME="Verkauf" CONTENT="Vekauf für 1997">
Anmerkung Stellen Sie sicher, dass die META
NAME-Marken zwischen die HTML-Marken <head> und </head> am Anfang der Datei
gesetzt werden.
Sie können auch nach allen Dateien suchen, die Verkaufsprognosen enthalten. Geben Sie
folgende Abfrage aus:
@metabeschreibung prognosen
Diese Abfrage gibt alle Dateien zurück, in denen im CONTENT-Feld das Wort Prognosen
enthalten ist. In diesem Beispiel werden somit Datei1.htm und .htm
zurückgegeben.
Wenn Sie jedoch nach Verkäufen pro Jahr suchen möchten, um zum Beispiel eine Liste
mit den Verkäufen im Jahr 1997 zu erhalten, geben Sie folgende Abfrage aus:
@metabeschreibung 1997
Die Datei 3.htm wird zurückgegeben.
|
|