Tuesday, May 5, 2009

wyszukiwanie w google- porady



Fotolia

Google.com – zaawansowane wyszukiwanie
autorem artykułu jest Kamil Michalak

Larry Page i Sergey Brin, dwaj doktoranci Uniwersytetu Stanforda uzyskali sławę dzięki swojemu tworowi, jakim jest wyszukiwarka Google. Obecnie chyba każdy użytkownik internetu zna ten produkt i zapewne nie raz z niego korzystał. Co jednak jest kluczem do ogromnego sukcesu tej wyszukiwarki? Odpowiedź może się wydawać oczywista – niezwykle skuteczny mechanizm generowania i prezentacji wyników. Większość ludzi wciąż zapomina o jednym, aczkolwiek bardzo ważnym fakcie. Mam tu na myśli system zadawania pytań. Jest to niezwykle istotny element Googli, dający nam naprawdę duże pole manewru w precyzowaniu treści oraz rodzaju zasobów, jakie chcemy odnaleźć.
Wielu z nas zetknęło się z problemem wyszukiwania informacji na konkretnych stronach internetowych. Wszystko jest w porządku, jeżeli tylko mamy do dyspozycji wbudowaną wyszukiwarkę. Sytuacja ulega drastycznej zmianie, jeżeli jej funkcjonalność nie jest zadowalająca, lub brakuje jej w ogóle. Nie zostajemy jednak skazani na mozolne przeszukiwanie zasobów internetowych. Rozwiązaniem staje się wspomniany wcześniej system zapytań Google.
Podstawowa metoda wyszukiwania przeszukuje strony internetowe zwracając wyniki zawierające w swojej treści podane przez nas słowa kluczowe, bez względu na to, czy znajdują się one obok siebie, są rozrzucone po całym dokumencie, czy też może plik zawiera tylko jedno ze słów-kluczy. Sposobem na zmianę sposobu wyszukiwania jest ujęcie wyszukiwanej frazy w cudzysłów ” ”. Taki zabieg sprawi, że Google będzie szukać całego łańcucha znaków zawartego pomiędzy znakami ” i ”.
Skoro już jesteśmy przy wyszukiwaniu zwrotów, warto wspomnieć o możliwości zastąpienia wyrazu w danym ciągu przy pomocy znaku „*”. Często jest on kojarzony ze znanymi z języków programowania wyrażeniami regularnymi (regular expression), gdzie znak ten zastępuje dowolny ciąg znaków. W naszym przypadku symbol ten ma podobne znaczenie. Znak „*” pozwala nam na zastąpienie jednego wyrazu w wyszukiwanej przez nas frazie. Defektem staje się jednak brak możliwości zastąpienia znakiem gwiazdki fragmentu wyrazu. Możliwe zatem jest wyszukiwanie:
frazy ”* Linux” Gdybyśmy jednak spróbowali wyszukać np. „Fedora Linux” użycie zwrotu ”Fed* Linux” nie przyniesie pożądanych skutków.
Kolejnym, chyba dość ważnym faktem jest brak rozróżniania przez Google wielkości liter. Tak więc nie ma znaczenia czy szukamy „cioci jadzi”, „Cioci Jadzi” czy „CiOcI jAdZi”.
Wyszukiwarka z Mountain View została również w możliwość ignorowania niektórych słów, które mogą zostać zawarte we frazach przeszukiwania. Należą do nich „i” (w zasadzie „I” - ang. „ja”), „a”, „of”, „the”. Słowa te są zazwyczaj pomijane ze względu na ich znikome znaczenia, oraz bardzo częste występowanie w języku angielskim. Dla osób, które odczuwają jednak straszną potrzebę używania tych słów dodam, że będą one uwzględniane podczas przeszukiwania jeżeli poprzedzimy je znakiem „+”.
To byłoby na tyle, jeżeli chodzi o słowo wstępu. Zajmijmy się teraz czymś bardziej konkretnym. Mam tu na myśli logikę Boolowską. Nie będę się zagłębiał w jej szczegóły, lecz wspomnę jedynie, że dopuszcza ona używanie trzech działań logicznych sumy logicznej (OR), iloczynu, (AND) oraz negacji (NOT). Do czego nam to potrzebne? Sprawa jest prosta, jeżeli nie ustawimy sami jednego z operatorów logicznych, wyszukiwarka użyje jako domyślnego działania iloczynu logicznego – AND. Słwo „and” z języka angielskiego oznacza tyle, co polskie „i”. Tak więc Google będzie starać się odnaleźć dokumenty zawierające wszystkie podane przez nas słowa kluczowe. Obrazując to przykładem, jeżeli podany przez nas zbiór słów ma postać
ala ma kota
to mechanizm wyszukujący potraktuje to jak gdybyśmy wpisali
ala AND ma AND kota .
Tak więc łatwo się domyślić, że w przypadku, kiedy zależy nam na wynikach zawierających tylko jeden z kluczy powinniśmy zasygnalizować to operatorem OR.
Ważnym jest, aby nie mylić operatorów „OR” oraz „+”! Znak plusa wymusza włączenie poprzedzonego nim słowa do wyszukiwania, nie jest operatorem logicznej sumy. Działanie „OR” ma natomiast swój symbol zastępczy w postaci pionowej linii - „|”, czyli
ala OR ma OR kota
i
ala | ma | kota
dadzą nam takie same wyniki.
Negacja jest działaniem, dzięki któremu mamy możliwość wykluczenia z naszych poszukiwań określonych słów. Używamy jej przez podanie znaku „-” przed wyrazem, który ma zostać pominięty. Na przykład szukając informacji o Chucku Norrisie, kiedy chcemy pominąć wyniki związane z jeszcze niedawno popularnymi dowcipami o nim nasza fraza będzie wyglądać tak:
Chuck Norris -dowcipy
Zawsze należy pamiętać o tym, że mamy możliwość korzystania z operatorów logicznych, a także ich mieszania. Nie musimy się ograniczać do tylko jednego operatora w wyszukiwanej frazie.
Nie wiele osób zdaje sobie z tego zapewne sprawę, że Google ma pewne ograniczenie co do fraz wyszukiwania. Chodzi tutaj dokładnie o limit 10 słów. Jak wiadomo można dokonać pewnego uogólnienia, że każde słowo kluczowe jest brane pod uwagę podczas przeszukiwania zasobów Internetu. Twórcy wyszukiwarki chcieli, aby ich twór działał szybko i sprawnie. Można się domyśleć, że to założenie mogłoby legnąć w gruzach, gdyby przyszło komuś do głowy zadać pytanie składające się na przykład z tysiąca słów. Wyszukanie tak dużej ilości kluczy mogłoby nadmiernie obciążyć system wyszukiwawczy, dlatego też postanowiono ustalić maksymalną długość zapytań do 10 słów. Każdy kolejny klucz jest pomijany (obcinany) przez wyszukiwarkę i nie jest brany pod uwagę.
Następnym krokiem naprzód w poznaniu działania Googli jest zaznajomienie się ze zbiorem (dość pokaźnym) elementów specjalnych zapytań. Są to specjalne parametry „mówiące” wyszukiwarce jakie elementy stron ma przeszukać, jakiej stronie dokładnie się przyjrzeć, jakiego typu danych oczekujemy i wiele innych. Ogólny schemat specjalnych elementów zapytań jest następujący:
znacznik: wartość
Należy zwrócić tutaj uwagę na fakt, iż każdy z tych znaczników zakończony jest znakiem dwukropka, po nim zaś mamy wartość dla zadanego parametru.

Poniżej umieściłem opisy kilku z najczęściej używanych znaczników specjalnych.

site:
pozwala nam na ograniczenie wyników wyszukiwania do konkretnej strony
bądź domeny, np.
site: pollub.pl
site: gov
intext:
powoduje ograniczenie zakresu wyszukiwania wyłącznie do treści zawartej
w dokumencie , nie uwzględniając przy tym adresów URL, hiperłączy.
Bardzo często wykorzystywane w połączeniu z przełącznikiem site: w
celu przeszukiwania treści konkretnych stron, np.
site: chomikuj.pl intext:”Mistrz i Małgorzata”
intitle:
wyszukuje wszystkie słowa zapytania w tytule strony.
inurl:
ograniczenie zakreu wyszukiwania do adresów URL stron w sieci web.
Dość przydatne, jeżeli nie znamy pełnego adresu strony, bądź szukamy
jakiejś specyficznej domeny.
inanchor:
czyli „Janie przeszukaj opisy hiperłączy i przynieś mi wyniki”. Idealny sposób
do przeszukiwania menu zorganizowanego w postaci prostych odnośników, np.
zwierzę1
zwierzę2
zwierzę3
kot
zwierzę4
zwierzę5
zwierzę6
i szukamy kotka w tym gąszczu.
link:
coś dla megalomanów, możemy sprawdzić ile stron zawiera odnośniki do
naszego portalu, czy innego webowego tworu. Znacznik ogranicza wyniki wyszukiwania
do stron zawierających łącza do zadanej strony.
cache:
znacznik sygnalizuje, że szukamy kopii strony sporządzonej przez Google.
Ten element specjalny bywa zbawieniem w przypadku, gdy strona, której
szukamy przepadła gdzieś w sieci.

filetype:
klucz zwracający nam wyniki zawierające określny typ pliku, obiekt
porządania wielu piratów komputerowych oraz dobre narzędzie do wyszukiwania
dokumentów, zwłaszcza w formacie pdf.
related:
wyszukaj powiązane strony, np. related:youtube.com zwróci w wyniko
Google Video, MySpace i kilka innych.
daterange:
zwraca jako wyniki srtony skatalogowane w określonym przedziale
czasowym. Składnia nie jest zbyt trudna, ma ona postać
daterange:data_początkowa-data_końcowa.
O atak padaczki i nerwicę może natomiast przyprawić system określania
daty wykorzystujący ...kalendarz juliański. Co oznacza, że musimy policzyć
ilość dni jaka upłunęła od 1 stycznia 4713 r p.n.e. Osobiście nigdy nie
znalazłem na tyle ważnego zastosowania tego ogranicznika, aby bawić się w takie
przeliczanie.
Jak więc widać, wyszukiwarka Google daje nam rozbudowane narzędzie do wyszukiwania interesującej nas treści w rozległej sieci Internetu. Jako użytkownicy musimy tylko nauczyć się dobrze z tego dobrodziejstwa korzystać. To jednak jest możliwe tylko dzięki naszym szarym komórkom i chęci nauki.

--
K. Michalak


Artykuł pochodzi z serwisu www.Artelis.pl

My Blog List

  • Premier Szydło do opozycji: „Kiedy rozmawiamy o problemach ludzi, to nie chcecie tego słuchać”. - Premier Szydło do opozycji: „Kiedy rozmawiamy o problemach ludzi, to nie chcecie tego słuchać”. Na każdy problem chcecie zrobić fundusz, Zrobiliście już ...
  • profesjonalne zdjęcia - Jak robić profesjonalne zdjęcia? W dzisiejszych czasach mamy szeroki wachlarz fotograficznych aparatów od cyfrowych po lustrzanki cyfrowe a obsługa ich ju...
  • laptop piszczy - Komputer nie włącza się, piszczy? Sprawdź sygnały POST Autor: *Michał Kaszta* Komputery nie zawsze zechcą z nami współpracować. Zdarza się, że wyczerpani ...
  • ładowarki - Przenośne ładowarki do telefonów, do czego służą? Autor: *Andrzej Bastian* Jak się Tobie wydaje, co jest najsłabszą stroną obecnych telefonów komórkowych...
  • Dell Computers - Dell is not the number computer selling company 2 in the world by accident. Their offering could be summed up as solid performers and durable laptops, pric...
  • HTML - Tworzenie stron internetowych - jak zacząć? Autor: *Amadeusz Nowicki* Postanowiłem napisać ten artykuł, dla osób, które dopiero wchodzą w temat tworzenia...
  • Biznes internetowy - Obecność w Internecie jest niezbędna do podejmowania pracy w biznesie internetowym. Nawet jeśli nie masz własnej strony i działasz poprzez inne strony (jak...
  • Euro nabiera sił - sprzedaż istniejących nieruchomości w USA (wysoka zmienność). Jak również o tej godzinie przedstawione zostaną dane dotyczące zaufania konsumentów (strefa ...

więcej o it