Як шукати інформацію в інтернет



Як знайти потрібну інформацію? Коли ви вже були на сайті, і знаєте конкретну адресу, питань немає. Але якщо її місцезнаходження невідоме?
Існують два способи.
Перший: ви знаєте, де інформація може з'явитися. Наприклад, чекаючи появи новин, ви можете навідатися на сайт novosti.com.ua, або портал новин www.newsukr.net , якщо новини стосуються нашої країни або світу.
Для здійснення такого пошуку існують каталоги Інтернет-ресурсів. Вони мають ієрархічну структуру, верхній рівень якої утворюють 10-15 найзагальніших предметних або тематичних категорій. Ці категорії підрозділяються на рубрики, які у свою чергу можуть мати ще більш дрібне ділення.
Приклади каталогів:
https://meta.ua/reestr.asp - каталог українських ресурсів на МЕТА
https://top100.rambler.ru - каталог Тор100 на Rambler
https://yandex.ru - каталог Yandex
https://dir.bigli.ru - каталог Біглі
https://www.lib.kherson.ua/ukr-links.htm - каталог Інтернет-ресурсів ХОУНБ ім. О.Гончара.
Але якщо ви знаєте тільки що вам потрібно, та не знаєте де це може знаходитися?
На цей другий випадок існують пошукові машини, або "пошукачі". Пошукова машина регулярно, щодня, 24 години на добу обходить всі адреси Інтернет, проглядає сторінки і вносить їх до своєї бази. Цей процес називається індексацією. Пошукач обходить всі відомі йому сайти, сам шукає нові і включає їх в свій "шляховий лист".
Приклади пошукових систем:
Google (www.google.ru)
META (www.meta.ua)
Rambler (www.rambler.ru)
Апорт (www.aport.ru)
Яндекс (www.yandex.ru)
Практика показує, що зараз ефективно і правильно використовувати пошукові системи вміють не більше 3% осіб. В основному люди занадто покладаються на їх ні в якому разі недосконалі можливості і в результаті на запит з 1-2 слів отримують абсолютно не потрібну для себе інформацію.
Чому так відбувається? Річ у тому, що сучасні пошукові системи Інтернет не володіють штучним інтелектом, як думає багато хто, більш того, всі вони побудовані на принципах 50-річної давності, закладених австрійським ученим Ципфом, коли розмови про штучний інтелект могли зустрічатися в основному у фантастичних творах. Переважна більшість доступних користувачам пошукових систем уміють шукати лише за ключовими словами, які вводять користувачі і нічого більш. Якщо ви вважаєте, що така система сама "подумає" за вас і знайде саме те, що вам треба, то в більшості випадків чекає гірке розчарування. Покладатися тут можна тільки на себе, але ніяк не на бездумну залізку.

Для ефективного пошуку інформації в Інтернет за допомогою пошукової машини пропонуємо Вам деякі практичні поради (представлені правила найбільш загальні; всі відмінності, що стосуються якогось конкретного пошукача завжди можна знайти в розділі "Допомога"):
1. Перш за все визначиться з метою вашого пошуку. (і мовою запиту: рос., укр, англ. та ін.). При цьому потрібно концентруватися не тільки на самій меті, але і на тому, що може їй супроводити (ключові слова, спеціальні терміни, дієслова і так далі). Увага! Кількість україномовних сторінок в мережі Інтернет значно нижча, ніж російськомовних і тим більш англійських. Тому далі деякі приклади наводитимуться рос. мовою.
2. Як вибрати пошукову систему? На сьогоднішній день пошукових машин існує декілька десятків. Найпопулярнішими для пошуку російською мовою є Яндекс (www.yandex.ru) і Google (www.google.ru). Українську мову підтримують всі російськомовні системи. Крім того існує українська пошукова система МЕТА (meta.ua), але база її трохи обмежена. Для пошуку на іноземних мовах використовують Google (більше 30-ти мов), який має зручну настройку, де можна задати: "Шукати сторінки тільки такими мовами".
Іноді для пошуку якоїсь найсвіжішої інформації, можливо, потрібно буде використовувати декілька пошукових машин (так званий метапошук).
Пошукові машини розрізняються не тільки підтримуваними мовами. Різниця в способах індексування дає різні результати при пошуку. По одному і тому ж запиту "Яндекс" видає результат - 110534 сторінок, Google - 54500 сторінок, Апорт - 784, Рамблер -240069.
Google початково володів мінімалістичним дизайном, не переобтяженим додатковою інформацією. Якщо ви хочете використовувати такий же спартанський стиль в Яндексі, то вам сюди: www.ya.ru, на Рамблері: www.r0.ru.
3. Для простого пошуку зайдіть на будь-який з сайтів пошукачів і в рядок пошуку введіть необхідну фразу. Рядок знаходиться посередині екрану.
Наприклад: Вам необхідно знайти розклад потягів що проходять через Київ. Як загальний запит можна так і спробувати "запитати" пошукову систему: "розклад всіх потягів що проходять через київ" (лапки не потрібні). Регістр - тобто рядкові букви або прописні - значення не має. І натисніть на клавіатурі клавішу "Введення" або кнопку пошуку поряд з рядком.
Проте, по такому запиту, наприклад, Яндекс, знаходить лише розклади поїздів, що проходять через Самару, Тернопіль, але Києва серед результатів пошуку не видно. Це у жодному випадку не означає, що цієї інформації в базі пошукової системи немає, просто запит був сформульований не дуже вдало.
Річ у тому, що будь-яка пошукова система прагне знайти сторінки, на яких знаходиться максимальна кількість слів з вашого запиту, більш того, якщо ці слова ще слідують одне за одним, то такі сторінки будуть виведені першими. Тобто, наприклад, якщо в тексті сторінки зустрічається фраза "розклад всіх потягів, що проходять через Самару", то за відсутності такої ж фрази "розклад всіх потягів, що проходять через Київ" система визначить, що вони мають 5 спільних слів, тобто з великою вірогідністю сторінка, що містить цю фразу вам підійде, хоча це і не так. Тому потрібно такий запит скоректувати, прибравши всі слова-паразити і залишивши тільки слова, які точно характеризують вашу потребу. У нашому випадку словами-паразитами є слова "всіх, що проходять, через", які можуть зустрічатися на яких завгодно сторінках. Задавши скоректований запит "розклад потягів київ", ми отримаємо в точності те, що шукали.
4. Пошукова машина сама розташовує результати пошуку по релевантності, тобто по якнайкращій відповідності запиту. Це означає, що найпершими будуть розташовані посилання на документи, в яких слова, що шукаються, знаходяться поряд одне з одним, ближче до початку сторінки або в заголовках. Результати пошуку виводяться посторінково. Кількість посилань на одній сторінці автоматично для більшості пошукачів дорівнює 20, але це число можна змінити в настроюваннях. Зовсім не обов'язково проглядати всі виведені посилання, краще змінити або скоректувати запит.
5. Іноді необхідно не прибирати зайві слова, а навпаки деталізувати запит, якщо слова, задані для пошуку, дуже загальні. А результати настільки схожі, що легко вибрати потрібне з десятків або сотень сторінок не представляється можливим?
Наприклад, пошук по слову "фантастика" дасть тисячі абсолютно різноманітних документів. "Російська фантастика" звузить круг пошуку. "Російська фантастика письменник Лук'яненко" напевно буде точним.
6. В більшості випадків просто скоректувати запит недостатньо. Необхідно використовувати оператори мови запитів пошукової системи, яку ви використовуєте. Ці оператори не тільки істотно полегшать вам життя, але і допоможуть знаходити таку інформацію, яку за допомогою простих запитів знайти абсолютно неможливо.
Оператори, спільні для всіх пошукових систем.
6.1. Оператор строгої відповідності, як правило, в сучасних пошукових системах це лапки "". Поєднання слів, які ви вкажете в лапках, враховуватиметься системою як єдине ціле, тобто таким чином ви задаєте порядок слідування слів одне за одним. Наприклад, за запитом комп'ютерні журнали ви можете отримати в результатах пошуку сторінки із словами, що згадуються відособлено, тобто на одній сторінці може бути слово комп'ютерні, на іншій - журнали і т. д. Конструкція ж "комп'ютерні журнали" в лапках примушує пошукову систему відкинути всі зайві сторінки і показувати лише ті, на яких ці два слова йдуть одне за одним.
6.2. Оператор обов'язкової наявності слова "+" (плюс або "&", або AND) і оператор обов'язкової відсутності слова "-" (мінус або NOT). Наприклад, якщо ви хочете знайти сайт журналу ЧИП, достатньо до запиту "комп'ютерні журнали" додати + чип: "комп'ютерні журнали" + чип. Якщо ж потрібно вивести всі журнали, окрім Чипа, потрібно ввести: "комп'ютерні журнали" - чип.
Увага! Достатньо часто буває корисно, щоб необхідні ключові слова були присутні в межах одного документа. Для цього необхідно використовувати оператор логічного "І" AND. Проте, у всіх пошукових системах це ж можна зробити, поставивши звичайний пропуск (Space). Наприклад, запити: комп'ютерні журнали і комп'ютерні AND журнали, як правило, дадуть один і той же результат.
6.3. Оператор логічного "АБО", у якості якого використовується логічний оператор OR (знак "|") дозволяє знайти хоч би одне слово із запиту. Наприклад, за допомогою запиту: комп'ютерні OR журнали можна знайти документи, в яких зустрічається або слово комп'ютерні, або слово журнали.
6.4. Складні запити за допомогою логічних операторів можна здійснювати, використовуючи круглі дужки: обласні AND (архіви OR бібліотеки); (бібліотеки OR архіви) + (обласні OR міські). Дужки задають певний порядок ключових слів і виконання їх операторів.
6.5. Пошук без урахування морфології. Щоб зафіксувати словоформу без розгляду машиною її морфологічних варіацій в рядку запиту перед терміном ставиться знак "!". Наприклад: !інформація !база !даних
6.6. Усікання (пошук по частині ключового слова). Як правило, для цієї мети вживаються знаки: "*" (позначає довільну частину слова) і "?" (позначення будь-якого символу). Запит Комп'ютер* дасть результати: "Комп'ютер","комп'ютерра", "Комп'ютерники" і т. д. Запит: к?мпанія - результат: кампанія або компанія.
6.7. Регістр букв: сучасні системи розрізняють слова, набрані прописними і рядковими буквами. Якщо ключові слова починаються з великої літери або повністю введені великими літерами, то ці ж слова написані рядковими буквами, знайдені не будуть. При введенні ключових слів рядковими буквами область пошуку розширюється, тому що ключові слова шукаються незалежно від регістра.
Увага! З мовами запитів конкретної пошукової системи можна завжди ознайомитися в її розділі допомоги. При цьому потрібно відзначити, що багато хто з них володіє власними додатковими операторами, які можуть допомогти досвідченим користувачам.
7. Розширений пошук, або пошук з умовами різного ступеня складності. Зайдіть в режим розширеного пошуку по посиланню, розташованому праворуч від рядка пошуку, яке так і називається, - "Розширений пошук" (у Яндекса це може бути тільки знак "плюс"). Ви опинитесь на сторінці з декількома додатковими кнопками і підменю, які представляють широкі можливості для деталізації запиту, введення додаткових параметрів пошуку, фільтрів і т. д. (без знання мови запитів і його операторів).
Наприклад, можна задати умову точної відповідності фрази, без урахування словоформ. У Яндекса ця умова називається "употреблены в тексте: точно так, как в запросе", в Рамблері (www.rambler.ru) "Искать слова запроса: точную фразу", в Google (www.google.ru) "Знайти результати що містять точну фразу" і т. д.
8. Складнішим (і від того менш використовуваним) є Представлення необхідного документа як образа.
8.1. Пошук можна істотно спростити, уявивши собі образ сторінки, що містить потрібну інформацію. Річ у тому, що існують загальноприйняті правила, яким підкоряються практично всі сторінки мережі. Основне і головне правило, яке потрібно завжди пам'ятати, полягає в тому, що заголовок кожної сторінки стисло і точно характеризує її вміст. Ви будете здивовані, але відшукати, наприклад, яку-небудь книгу в електронному вигляді дуже просто. Звичайно, можна спробувати її знайти, просто задавши в пошуковій системі прізвище автора і назву і врешті-решт цю книгу знайти, але так ви ризикуєте витратити силу-силенну часу на проглядання абсолютно не потрібних для вас сторінок із згадкою даної книги або автора, але без її електронної копії.
Хоча можна відшукувати потрібну інформацію прямо в заголовках сторінок, минувши інший їх зміст.
Простий приклад - вам потрібно знайти, припустимо, книгу М.Булгакова "Мастер и Маргарита". Спершу складаємо образ потрібної нам сторінки - швидше за все, в її заголовку можуть знаходитися і прізвище автора, і назва твору. Далі потрібно з'ясувати, як включити розширені можливості пошуку по заголовку в пошуковій системі, яку ми використовуватимемо. Наприклад, в Яндексі для пошуку по заголовках потрібно використовувати конструкцію $title( ), таким чином, наш запит може виглядати як: $title(булгаков "мастер и маргарита"). Результат перевершує всі очікування - перші 7 посилань, які вивів Яндекс в результатах пошуку, містять те, що нам потрібне.
Для пошуку по заголовках у Google використовується абсолютно інша конструкція - allintitle.
8.2. Але не тільки заголовки корисні при пошуку потрібної інформації. Неоціниму допомогу може тут надати і текст посилань. Адже будь-який сайт має строго певну структуру, тобто якісь посилання, які ведуть на його сторінки або сторінки інших сайтів. Кожне таке посилання має власний опис, за значенням сумісне, а часто і більш інформативне, ніж заголовок самої сторінки, на яку вона веде. Адже і в текстах посилань теж можна шукати, та ще й як!
Наприклад, ми хочемо знайти в Мережі якийсь файл, наприклад, викачати останню версію універсального музичного програвача winamp. Спробуємо створити образ сторінки, яку потрібно знайти. Оскільки програма ця відома, то, ймовірно, існує немало сайтів, на яких є посилання на сторінку, де можна викачати останню версію winamp. Якщо спробувати пошукати в тексті цих посилань, швидше за все одною з перших в результатах пошуку з'явиться потрібна нам сторінка, оскільки решта всіх посилань веде саме на неї. Для пошуку в описах посилань в Google використовується оператор allinanchor, отже, запит можна сформулювати приблизно так: allinanchor: winamp download. Для того, щоб упевнитися у вірності приведених міркувань, можна замість winamp поставити яку-небудь іншу програму - якщо в Мережі на неї є хоч одне посилання, система виведе її першою.
Увага! Текст посилань представлений тільки латинськими символами, більш того англійськими словами. Тому, якщо ми шукаємо книги - пишемо: books, посилання - links і т. д.
Вдалого пошуку, і ми бажаємо вам, щоб ви були завжди в курсі того, що вам потрібно знати!