W
wyszukiwaniu można używać terminów prostych, czyli pojedynczy wyrazów
oraz fraz, czyli wyrażeń złożonych z kilku słów ujętych w cudzysłów np.
"Uniwersytet Mikołaja Kopernika". W przypadku użycia
cudzysłowu wyszukiwane będą tylko te dokumenty, które zawierają całą frazę.
Terminy wyszukiwawcze można łączyć za pomocą operatorów logicznych. Można też
używać tzw. znaków maskujących, które
zastępują dowolne litery i cyfry oraz ich ciągi, wyszukiwać terminy podobne, znajdujące się w pewnej odległości od siebie lub określać priorytet wyszukiwanych terminów.
Operatory logiczne
Wyszukiwanie rozmyte
Wyszukiwanie rozmyte (fuzzy search) znajduje zastosowanie w wypadku terminów
prostych podobnych do siebie np. Copernicus, Copernikus, Kopernikus.
Dokumenty zawierające te terminy można wyszukać dodając znak tyldy do terminu: copernicus~.
Stopień poszukiwanego podobieństwa, można określić współczynnikiem, który
zmienia się w zakresie od 0 (brak podobieństwa) do 1 (terminy identyczne).
Domyślnie współczynnik podobieństwa ustawiony jest na wartość 0.5. Aby ją
zmienić, do wyszukiwanego terminu należy dodać znak tyldy wraz z wyraźnie
określonym współczynnikiem, np. kopernik~0.4.
Wyszukiwanie wg sąsiedztwa
Możliwe jest również określenie w jakiej odległości ma się znajdować jednen z
wyszukiwanych terminów od innego (tzw. proximity search). Jeśli np. pamiętamy,
że dokumencie w niewielkiej odległości od siebie pojawiały się wyrażenia Choral-buch
oraz Westpreussen, możemy użyć następującego zapytania: "Choral-buch
Westpreussen"~6.
Określanie ważności terminu
Można określić priorytet wyszukiwanego terminu przez dodanie znaku ^ wraz z
liczbą (większą niż 1). Np. zapytanie stempowski^4 grydzewski zwróci
dokumenty, w których występują oba nazwiska, ale na początku listy znajdą się
te, w których częściej pojawia się nazwisko oznaczone wyższym priorytetem.
Domyślny priorytet wyszukiwania wynosi 1.
Łączenie zapytań
Wyrażenia w zapytaniach złożonych można grupować za pomocą nawiasów. Zabieg
taki pozwala nadać rozbudowanym zapytaniom zamierzony, jednoznaczny sens,
podobnie jak to się dzieje w działaniach arytmetycznych. Najpierw przetwarzane
są wyrażenia cząstkowe wewnątrz nawiasów, a następnie większe całości.
Zapytanie o kształcie: "De revolutionibus orbium coelestium" AND
(Copernicus OR Kopernik) spowoduje wyszukanie dokumentów, w ktorych
występuje tytuł dzieła Kopernika oraz jego nazwisko przynajmniej w jednej z
dwóch form.
Znaki specjalne
Ze zrozumiałych względów znaki służące do budowania zapytań złożonych (+ -
&& || ! ( ) { } [ ] ^ " ~ * ? : \) są traktowane podczas
wyszukiwania inaczej niż pozostałe: pełnią rolę elementów składni zapytania, a
nie cząstek wyszukiwanego wyrażenia. Aby objąć je procesem wyszukiwania należy
umieścić przed nimi tzw. znak ucieczki \. Np. w celu wyszukania frazy
"(2 + 2)*2" należy wpisać "\( 2 \+ 2 \) \* 2"
Źródło opisu
Pełny opis sposobu formułowania zapytań (strona w języku angielskim): Jakarta
Lucene Query Parser Syntax.