検索エンジンの基本的な仕組みを理解する

検索エンジンの基本的な仕組みを理解する
http://minnano-seo.com/essence/post1873/

ちょっと、バナー?の字が嫌いだが、簡単なサマリー。

---
クローリング
クローラーがインターネット上にあるWebページを取得しにいく。
リンクをたどってリンク先のページを取得するのが原則であるが、ウェブマスターツールから登録されたサイトや、sitemap.xmlなどから取得する場合もある。

インデキシング
クローラーが取得したデータを、インデクサに蓄積する。
インデックスとは索引のことである。
巨大なデータの中から、要求に応じて瞬時に必要なデータを提供するためには、索引に相当する仕組みが必須である。
検索エンジンというシステムは超巨大データのインデックスそのものであるといえる。

クエリ実行
ユーザーが検索エンジンのWeb画面を介して検索結果の要求をする。
ちなみにクエリとは大規模なデータを扱うシステムに対して、データの取得や加工を要求することを一般的には指す。
つまり検索エンジンに対してクエリするとは、検索結果データの取得の要求をすることを示しているのである。

データ問い合わせ
クエリの依頼を受け付けたサーチャーが、インデクサに対して該当するデータを要求する。

データ引渡し
インデクサに蓄積されたデータの中から、必要なデータをサーチャーに対して引き渡す。

検索結果表示
引き渡されたデータをアルゴリズムにもとづいて並べ替えを行い検索結果として表示する。
検索エンジンの利便性のほぼ全てを決定するものは、どのページがどれだけ重要かという順位付け(スコアリングという)の良し悪しにかかっている。
そのために検索エンジンにおいて、アルゴリズムはスコアリングの部分のみを指すようになったのだと思われる。

robots.txtの動作は①の部分についてコントロールする。
クローリングを禁止することができる。
noindexを指定すると①によって取得されたページが②の時点でインデックスされない。
しかし、クローリングは行われるため、noindexが指定されているページ中のリンク先はインデックスされる。

robots.txtによってクローリングを禁止しても、noindexによってインデックスを禁止しても結果的に検索結果には表示されないのは一緒である。
しかし、検索エンジンの動作はまったく異なるといったことが理解できるのだ。

この動作を理解しておかないと、robots.txtクローラーのアクセスを禁止したページ内にcanonicalを指定してしまう。といった誤用が生じる。
robots.txtでクローリングを禁止されたページに、canonicalを指定しても検索エンジンは見ることができないから意味がないのである。
---

SEOに興味はないが、実際のクエリが無いとよくわからんな、なまず!

乳酸菌、ビフィズス菌酪酸菌などの生菌製剤の種類と特徴
http://medical.nikkeibp.co.jp/leaf/mem/pub/di/column/tessoku/201211/527816.html

「フェーカリス菌、アシドフィルス菌などは小腸に生息するのに対し、ビフィズス菌は主に大腸に生息します。酸に弱いことが指摘されていますが、食後の服用であれば生菌のまま腸まで届くとされています。」

ビフィズス菌(ラックビー微粒N、ビオフェルミン錠剤他)
酪酸菌(ミヤBM
「 耐性乳酸菌のように人為的に耐性を付加したのではなく、芽胞形成による抗菌薬への耐性効果があります。ただし、殺菌作用の強い抗菌薬ではこの効果は発揮できないともいわれます。この場合には、芽胞で存在し抗菌薬の濃度が下がると発芽して、整腸作用が復活する可能性が示唆されています。(YAKUGAKU ZASSHI. 2012;132(7):849-53.)」

ほー。

「整腸作用のメカニズムの一つとして、悪玉菌の増殖抑制があります。これは、整腸作用を持つ菌により、乳酸菌、酢酸、酪酸などの酸が産生されることになり、腸管内pHが下がり、これが酸性条件で成長抑制される悪玉菌の増殖抑制に働きます。」

pHというのはなかなかの武器ということ。