T.サーチエンジンのこと

 サーチエンジンはインターネットのユーザ−が、自分が必要とするホームページを見つける際に使う最も基本的なツールで、分野を限定せず多量の情報を収集し、収集した情報をデータベース化し、それらの情報を文字列で検索できるというものです。

 サーチエンジンには、大きく分けてディレクトリ型ロボット型の2種類のサービスがあります。


1. ディレクトリ検索型

 ディレクトリ型は、収集した情報をカテゴリ別に分類してデータベース化し、検索を行うもので、「Yahoo!」に代表されます。

 ディレクトリ型では、Web上のページの情報を選別収録し、その収録した情報を階層構造(ディレクトリ)で分類し、その階層をトップレベルから下位にたどるのが基本的な検索方法です。しかし、ディレクトリ型の大きな特徴として、分類分けなどの作業を全て人手で行っているということが挙げられます。このため、そのデータ量はロボット型と比べると必然的に少なくなり、求めるページにたどり着けないこともあります。一方、人間が索引や要約を作成しているため、その信頼度が高く、検索時のノイズがロボット型に比べ少ないと言えます。


 <代表されるサーチエンジン>
   ● YAHOO!JAPAN(ヤフージャパン)
       http://www.yahoo.co.jp/


2. ロボット検索型

 ロボット型はWWW探索プログラムを用いて、世界のWWW上の情報を定期的に収集からその情報の索引作成など、データベースの作成に係るまでの作業を自動的に行っています。また、ページの内容をそのまま検索対象とする全文検索が可能となっています。DEC社の「Alta Vista」やNTTの「goo」などに代表されます。

 ロボット型は情報の収集から索引作成までの一連の処理をコンピュータ・プログラムによって自動的に行いますので、ディレクトリ型に比べて情報量が格段に多いのが特徴です。しかし、索引や要約の作成を自動的に行っているために、情報の品質や分野を整理できず、1つのキーワードに対し何万ものサイトがヒットするなど、目的のサイトにたどり着くのに時間が掛かるというデメリットがあります。また、エンジンごとに検索の仕方が異なる部分もあり、十分に使いこなすには慣れと習熟を求められます。


 ●ロボット型の収集の流れ

 Index.html が登録されていると仮定します。

まず、検索ロボットはIndex.html からリンクしているページを辿って、B.htmlC.html を収集します。

B.html からリンクしているD.html も収集します。同じようにC.html からリンクしているE.html も収集対象になります。


 <代表されるサーチエンジン>
   ● Google(グーグル)
       http://www.google.co.jp/



 

ディレクトリ型

ロボット型

登録情報量

ロボット型に比べると少ない

多い

使いやすさ

比較的簡単

使いこなすにはある程度のテクニックが必要

ホームページの説明

やかりやすい

わかりにくい

使いやすさや検索結果に一長一短がありますので、必要に応じて両者を使い分けてください。

 

3. ディレクトリ・ロボット併用検索型

 ディレクトリ型とロボット型の二つの特性を併せ持っています。

 例えば、ディレクトリ型の代表の「Yahoo!」では、キーワードが入力されると、まず「カテゴリ検索」、次に「サイト検索」、最後に「ページ検索」をしてその結果を表示しますが、この「ページ検索」は「goo」を借用しています。

 「infoseek」、「LYCOS」、「Excite」などはロボット型のエンジンと言われていますが、「Yahoo!」と同様な登録サイトのカテゴリを持っています。

 ロボット型のひとつである「goo」では、「Yahoo!」のカテゴリが検索されることがあります。

 「Alta Vista」はカテゴリを持っていますが、日本のサイトはほとんど登録されていません。

U.ホームページ検索術

1. サーチエンジンへのアプローチ

 キーワードの選択

 「キーワード」とは、単語単位の言葉のことですが、英語サイトのサーチエンジンの検索時には、英語は単語毎に分けられてしまい、そのままでは「句」という単位として認識されません。例えば「key word」は、このままだと、2語の単語として検索されますので、「”key word”」のように、引用符でそれらの語を囲む必要があります。それについては、フレーズ検索の項目で説明します。

 例:酒類の販売免許についての法律は「酒税法」であることを見つける場合のキーワード例

キーワード例   

2. フレーズ検索について

 「フレーズ検索」とは2つ以上の単語を1つの単語として検索する方法です。

 フレーズを引用符 [] で囲むことでフレーズ検索ができます。

例として挙げますと

  山口市 広報課 と検索すると 「山口市 または 広報課」と検索されますが、

”山口市 広報課”

    と引用符[]で囲むと「山口市広報課」で検索することができます。

3.Boolean(ブーリアン)検索について

 Boolean(ブーリアン)検索とは,複数のキーワードをANDORNOTといった半角の記号を使った演算式で検索する技法を指します。

 AND, OR, NOTを使った検索結果(件数)の間には、論理的に次の関係があります。

  ●AND検索複数のキーワードを全て含むWebページを検索します。

           A  and  B  =  B  and  A

  ●OR検索 複数のキーワードのうち一つでも含むWebページを検索します。

           A  or  B   =  B  or  A

  ●NOT検索あるキーワードを含み、特定のキーワードを含まないWebページを検索できます。

           A  not  B ,  B  not  A

                                                     A , B はキーワードを示します

例として幾つかの例を挙げます。

@インターネットの入門的ページを探しているけれどセミナー関係のページばかり出てきて困る場合

検索式 : インターネット AND (入門OR 初心者) NOT セミナー

上記のような検索式を使用すると、セミナーという単語を含まないページが表示されます。

Aチョコレートかイチゴを使った、ケーキ以外の料理のレシピを手に入れたい場合

検索式 : ( チョコレート OR イチゴ ) AND レシピ AND NOTケーキ

使用する際の注意点:ブーリアン記号(ANDORNOT)は半角で入力し、キーワードとブーリアン記号の間は、スペースで区切るようにして下さい。

Yahoo! JAPAN  http://www.yahoo.co.jp/

・人のてによって情報が厳選されているので、信頼度が高く、悪質なページが現れません。

・「キーワード検索」「カテゴリ検索」という2つの検索方法が可能です。

・最近ではキーワードがヒットしなければ自動的にgooで検索するようにもなっています。

Google  http://www.google.co.jp/

・現在、検索エンジンの中で最大のURLデータベースを擁しており、人気急上昇中のサーチエンジン。

・検索結果に関連した情報を示す「GoogleScout」機能や、集めたすべてのデータを「キャッシュ」として保存し、アクセスすることが可能な機能があります。

・他のページからのリンク数にもとづいてページの優先順位を決める機能もあり、これによってリンクの数が多ければ多いほど、検索結果における順位が高くなるわけです。

goo  http://www.goo.ne.jp/

・世界最大規模のロボット系サーチエンジン。

・ページのヒット数はサーチエンジンの中で1.2を争うが、余計なページも多い。

・更新日付やページのドメイン名、ファイルの種類や拡張子など、多様な条件を指定して検索できるのが特徴。URLにリンクしているWebページを検索することも可能です。

Excite  http://www.excite.co.jp/

・検索したページに類似するページを発見する機能「more like this」があります。

インフォシーク http://www.infoseek.co.jp//

・自然文検索と豊富な条件指定が可能。

・単語だけでなく,文章を入力する検索もできます。

LYCOS  http://www.lycos.co.jp/

・画像、音声データをさがすならここ。

フレッシュアイ http://www.fresheye.com/

・その日の「フレッシュ」な情報が手に入る。

NTT DIRECTORY http://navi.ocn.ne.jp/

・ページの人気度が分かるディレクトリー型検索エンジン。

ワイズナット http://www.wisenut.com/

・ページのリンクとそのページのテキストを調べ、それらを比較した後、もっとも関連性の高いものを最初に表示してくれます。

ティーオマ http://www.teoma.com/

・データベースを検索してキーワードと一致するページを探し、その検索結果をトピック別に分類する。さらに、そのトピックを扱うサイトのうちでもっとも人気の高いサイトを検索してくれます。

Alta Vista http://www.altavista.com/

・主に外国関連の情報検索に適応した世界最強のサーチエンジン。(日本のサイトも検索可能)

Hunting BOX http://www02.so-net.ne.jp/~k-manabe/comp/misc/HuntingBox/

・一回の操作で、各種検索エンジンを一度に検索できるメタサーチです。検索エンジンごとによるAND, OR, NOTなど記述の違いを吸収し、同じインタフェースで検索できます。

山口大学附属図書館