この記事の概要を簡単まとめ!
- 検索エンジンで最も価値の高いGoogle
- Google検索の上位に乗ることはサイトステータスとして重要な項目
- 検索上位にするために「工作」する悪質まとめサイト/キュレーションサイトの存在
- 指定サイトをGoogle検索の結果から除外するアドオン”uBlacklist”
- 指定URL除外のほかマッチパターンと正規表現が利用可能
- 動作は「結果を非表示」にしているだけである
- 中身の薄いサイトに邪魔されることはもう終わり
新年、いかがお過ごしだろうか。私はいつも通りだ。年末だからとかで書かずに休むことは、私には似合わなかった。書いていないと、何か落ち着かない。このことから、私は一種の職業病のような状態になっているようだ。まあ、それも生き方というものであろう。
さて、新年一発目、しかし新年だからと言って特別なことは書く気がない。私の書きたいことを書くのがこのリンクス岐部のブログだ。ところで最近気になったことと言えば、まとめサイト/キュレーションサイト/アヘリ8サイトが検索結果に出てきてうざいことである。オリジナルコンテンツのオの字もないようなサイトが検索上位となり、多くのネットユーザーに不快を与えるあのクソサイト群である。URLを見るだけでもアレルギー反応が出るくらいだ。それらは往々にしてGoogle検索に対して最適化されていることが多く、世界の99%はおそらくGoogleを検索エンジンとして使用しているであろう、それらユーザーを誘導する目的で対策されていることが多く、それを行う奴は人間の屑の極みである。そしてGoogleは機械的な順位付けをしている以上、条件に一致さえしていれば上位に居座り続けるのだから、尚更タチが悪い。
だがブラウザのアドオンとは偉大である。それら害悪なサイトを直接指定して除外するわけではないが、アドオンのオプションから設定することでGoogleの検索結果から除外してくれるアドオンが有志によって開発されているのである。そのアドオンの名はuBlacklist。アフィカスのURLさえあれば、どんなアフィカスサイトも検索結果から除外できる優秀なアドオンである。読み終わったら今すぐにでも入れるといい。
ひとっ飛びできる目次
Googleと世界のウェブサイト
検索エンジンで最も価値の高いGoogle
早速だが、これを読んでいるそこの貴方は、検索エンジンは何を使っているだろうか。Yahoo!, Google, Bing, DuckDuckGo, Ecosia, Excite, Startpage.com, Yandex, その他少数勢力も含めれば数は意外にも多い。だが多くの人は、Googleを使うことであろう。その次にYahoo!, 楽天といった感じに続く。一部のマニアック派は、DuckDuckGo, Yandexを使用しているのを確認できる。なお個人的感想として、Yahoo!はインターネット老害が多い気がする。
GABAGAFAを考えれば、実質的にIT社会を支配する企業の1つであるGoogleの検索エンジンを多くの人が使っている時点で、検索エンジンとしては相当の完成度であることが伺える。その完成度の高さから、一部のブラウザがGoogleの検索エンジンを採用している。その代表例はYahoo!であり、2000年5月からGoogleの検索エンジンを使用していた。その後アメリカYahoo!が自社検索エンジン(YST)を開発したが継続を断念し、検索エンジンの変更をすることになった。アメリカはBingを採用するも、Yahoo! JAPANはGoogleに差し戻した。そして現在に至るまで、Yahoo!の検索エンジンはGoogleの検索エンジンを使用していることになる1)参照:Yahoo! JAPAN#検索エンジン – Wikipedia ただし、あくまでも検索エンジンが同じだけであり、検索結果はYahoo!の関連サービスの結果が通常の検索結果の間に入るなど、手が加えられている。ただ、勝手に間に関連サービスの結果を入れられるのは正直ごちゃごちゃしすぎて見にくいので嫌いである。。Yahoo!なのに結局Googleの支配下にいるようで、皮肉である。
iPhone/スマートフォンもブラウザは当然ある。iPhoneは標準ブラウザとしてSafariがあるが、これは検索エンジンは指定の中から1つを選択して使用する形となっている。この中にGoogleが入っている。それ以外のスマートフォン、大多数となるAndroidはGoogleが主体となって開発しているため、標準は必然的にGoogle検索またはChromeになる。その場合、検索エンジンは必ずGoogleになる。このことを考えると、Googleの検索エンジンが世界シェア1位であることは大袈裟ではないであろう。
Google検索の上位に乗ることはサイトステータスとして重要な項目
ここからは検索エンジンをGoogleに固定する。つまり普通のGoogleアプリやChromeで検索した場合を考える。検索エンジンを使用しているだけのYahoo!などは考えない。殆どの人はブラウザで検索する際、暇つぶしも兼ねているであろう、大抵は上位のものだけしか見ないことが多い。結果の最後まで読むことは、相当暇な場合に限られる。もっとも、全部読んだところで半分くらいは同じような内容のページが多いが。
これを考えたとき、検索上位に出てくるということは、そのサイトが見られる可能性を高くするということでもある。したがって、ページの内容を充実させることは勿論のこと、不特定多数のユーザーが入力し検索する際、入力した「特定のキーワード」に反応するようにキーワード選定をサイトやページに行うのが一般的である。所謂SEO対策の一部だ。意味や方法に関しては検索してもらうとして、キーワード選定は個人・組織問わずサイト保有者の99.9%が必ずやることである。これを考えなくていいのは、所謂「チラ裏」か4と6の間chくらいだ。
検索上位にするために「工作」する悪質サイトの存在
検索上位にするためには、中身とSEO対策が必要であることは言うまでもない。その方法についてはここでは語らない。だが時に検索上位に、中身の伴わないサイトが上がってくることがある。SEO対策だけガチで、しかし中身は空同然かどこかのサイトをパクっているか誰でも知っていることを大袈裟にしたとか、「その程度のもの」しかないものが多々見受けられる。
それらの中でも顕著なのが、広告収入および成果報酬を目的とした、アヘリ8アフィリエイトばかりで広告が異常に多いサイトが過剰なSEO対策の結果検索上位に出現し、多くのユーザーを不快にさせる上に時間を浪費させ、それでいてサイト所有者は楽してあぶく銭稼ぎをするサイトである。これらは所謂まとめサイト・キュレーションサイトと呼ばれていることが多い。
これらは往々にして、低俗なサーフェスウェブの暗部である4と6の間chのスレの一部を切り取ったのを張り付けただけであるとか、オワコンTwitterやFacebookなどのSNSにある他者の投稿を(実質)無断転載してそれを貼るだけといった、オリジナルコンテンツのオの字もないようなサイトが殆どである。自分の意見も書かないで何が面白い。
サイトには必ずサイト名が存在する。先に挙げたクソサイト群も例外ではなく、それらのサイト名は「速報」「まとめ」「ちゃんねる」といった名称が入りやすい。個別の名称を挙げるのはアレルギー反応が出てしまうのでやらないが、これらはまとめて「アフィカスサイト」と軽蔑されている。前述のGoogle検索結果汚染や中身の薄っぺらさを考えれば、そう軽蔑されても何も文句は言えないであろう。しかしGoogleは機械的に順位を決定する以上、いくらGoogleにスパムサイト報告(ウェブスパム)をしたところで別の内容や別のサイトを作って汚染を続けるので、結局いたちごっこである。私達自身で対策するしかないのが現状である。
指定サイトのGoogle検索結果除外アドオン”uBlacklist”
そんなアフィカスサイトを嫌っている全ユーザーに朗報である。Google検索の結果からそれら低質なサイトを除外するアドオンが存在する。正確には、そのサイトのURLをアドオンに登録することで検索結果から除外するアドオンである。これはマッチパターンや正規表現も利用でき、サブドメインで別サイト展開しているアフィカスサイトもまとめて除外することができるのである。そのアドオン名は”uBlacklist“である。アンチアフィカスサイトユーザーは勿論、見たくないサイトを積極的に排除したい人の強い味方である。
uBlacklistの概要
uBlacklistは、個人の開発者”iorate”によって開発された、Google検索の結果から指定したページを除外するアドオンである。機能は至ってシンプルで、しかしGoogle検索に対し確実な効果を発揮する優秀なアドオンである。なお、アドオンに’u’の名称がついているものの、uBlock Origin等のアドオンとは一切関係ない。なお、このアドオンはChromeは前提として、Edge, Firefoxでのアドオンの存在を確認している。OperaとSafariは相変わらず保有していないので不明である。
uBlacklistの構造は単純で、基本は検索結果から除外したいサイトのURLを入力すればいいだけである。入力して保存すれば、次の検索から有効になる。また、除外したいURLを入力するとき、マッチパターンか正規表現を同時に利用できる。特にマッチパターンは重要で、これを使わないと完璧な除外が行えないのである。
また、このアドオンの基本除外対象はGoogleであるが、Google以外の検索エンジンでも除外可能である。これはBing, DuckDuckGo, Ecosia, Startpage.comの4つに対応している。また、検索結果からすぐブロックできるリンク、ダイアログ、ブロック数のON/OFFの切替ができる。ブロックするリンクについては、間違えて押してしまう場合はOFFにした方がいいだろう。
uBlacklistは、同期と購読がある。同期はクラウド経由で行われ、GoogleかDropboxを使用する。ドライブに同期データ(非表示にしたサイトのURLデータ)をアップロードして、複数端末間でブラックリスト同期ができるようだ。ただしこれはおそらく、uBlacklistアドオンが追加されているブラウザでなければ使えないものと思われる。そのため同期はあまり使い物にはならないであろう。購読は、ブラックリストの定期的なダウンロードである。指定したURL(特にテキストファイル)から定期的にダウンロードされ、それがuBlacklistに反映されるようになっている。ただ、ブラックリストが書かれたテキストファイルを置いているURLは知らないので使えてないが、もしこれが使えれば自分で追加せずとも除外されるということである。最後に、設定ページを掲載する。

基本:URLを入力して除外する
ここからは使い方を解説していく。まずは普通の使い方である。uBlacklistのオプションにアクセスし、「一般」枠のテキストエディタ内に、検索結果から除外したいURLを入力して保存すればOKである。これは次回以降の検索結果で有効になる。また、現在の検索結果についても再読み込みすることで有効になる。
この項ではテストで検索結果から除外することができるのを試すため、その試験用のURLとしてexample.comの後継であるとされるInternet Assigned Numbers Authority(IANA)2)インターネットに関連する識別子を管理する機能。組織名そのものを示すこともある。IPアドレス・ドメイン名・ポート番号・プロトコル等の割り当て及び管理を行うものである。1988年に南カリフォルニア大学情報科学研究所(USC ISI)のジョン・ポステル教授を中心として設立され、当初は大学や全米科学財団(NSF)の援助を受けながら運営されていた。1998年、国際的非営利組織ICANNが設立されると、2000年にICANNに引き継がれた。結果IANAはICANNの下部組織となった。2016年からはICANNの子会社であるPublic Technical Identifiers(PTI)がその機能を担っている。 参照:Internet Assigned Numbers Authority – Wikipedia, IANA(Internet Assigned Number Authority)とは – IT用語辞典 e-WordsのURLで試すことにする。example.comを使用しないのは、階層がないためである。これは後の解説で重要な項目となる。
まずはIANAのトップページ(iana.org)を対象に、そのURLをuBlacklistに入れてGoogle検索の結果から除外されるかどうかを確認する。確認のため、URLを入れていない段階での結果と比較する。その結果は以下の通りである。

これを見ると、そのURLに完全一致するものだけが検索結果から除外されていることがわかる。テストではIANAのトップページのURLを入力していたが、IANAは下層ページも存在する。そのページについては、検索結果から除外されていないことがわかる。例えば、iana.org/domainや/whoisは結果にそのまま残ってしまっている。そのため、単にURLを入力しただけでは、そのサイトの下層ページについては結果から除外されないことがわかる。
応用:マッチパターンか正規表現でサイト全体をブロック
先の方法では、完全一致したURLしか結果を表示させない効果しかなかった。これではページ単体しかブロックできず、いちいちURLを手入力する手間がある。この手のアドオンはよく、マッチパターンや正規表現をサポートしておらず、URL単位で管理しなければいけないことも多い。もっともそれを必要とするアドオンは使用していないので果たしてどうなのかは不明だが。
uBlacklistでは、マッチパターンと正規表現の両方をサポートしている。これらの詳しい解説はリンク先を参照してもらうとして、これを使用することでいちいち個別に書くことなく、サイト全体を結果から除外するのに役立つのである。特に、uBlacklistではマッチパターンを使用して除外する方法が有効である。
先の方法では、IANAのトップページしか結果から除外することができなかったことがわかっている。ここで、全てのURLは<scheme>://<host><path>で構成されている。これに従えば、先のURLの設定は<scheme>=https, <host>=www.iana.org, <path>=/である。<path>についてはroot(トップ)のみの指定のため、この場合は(https://)www.iana.org/というトップページ「だけ」を除外対象としているということになる。そのため、/以下のURLは対象外となって除外されなかったのである。
ここで、”*”が登場する。”*”は一般にワイルドカードを意味する特殊文字3)このワイルドカードは「任意の文字列が0個以上連続する」の意味を持つ。後に文字列がなくてもOKになる。であり、これを<path>の部分に当てはめると、<path>=/*となる。これにより、https://www.iana.org/*となり、トップページも含めた下層のページも除外対象とすることができるのである。また、<scheme>にもワイルドカードは使用でき、まれにhttpのURL(滅多にない)があるので、*//:www.iana/org/*とすればほぼ確実にサイトの除外が可能になる。
さて、解説した通りに動作するかテストする。今回もIANAには実験台になってもらうが、やり方は先と同じである。敢えて手順を説明することはないので結果を掲載する。その結果については以下の通りである。

今度はしっかり、サイト全体を検索結果から除外できていることが確認できる。前回のテストでは下層ページは確かに残っていたが、今回のテストはそれも消えているので、違いは明白である。このことから、通常はマッチパターンを用いて検索結果から除外する必要があることがわかる。そうしないと、十分に効果を発揮しないということである。逆にこれができれば、uBlacklistを使いこなしていると言えるであろう。
もっと簡単:検索結果から直接ブロックできる
ここまで直接手入力でブロックすることについて書いてきたが、uBlacklistは優秀だった。検索結果から直接ブロックすることできるのである。uBlacklistはデフォルトで、検索結果のページリンクのURLの右に「このサイトをブロックする」というリンクが表示されるようになっている。これをクリックすれば、手順にして最短2クリックでサイト単位でブロック可能である。
これのやり方は簡単である。結果から除外したいページの「このサイトをブロックする」をクリックし、出てくるダイアログ内の「ブロック」をクリックするだけである。たったこれだけでブロックでき、しかもこの方法はデフォルトがサイト全体のブログで、即時反映してくれる。つまり、ブロックしたいサイト全体が検索結果からすぐ消えるのである。これはテキストエディタに手入力するよりも圧倒的に楽で使いやすいのである。その手順と結果は以下の通りである。

マッチパターンや正規表現は、大抵はコマンドラインのように手入力するのが殆どだが、この方法においてuBlacklistはデフォルトでサイト全体をブロックするようにできているので、マッチパターンや正規表現の面倒な学習は全く必要ない。アドオンを入れさえすれば、目障りだと思ったサイトはその場で手軽に検索結果から除外することが簡単に可能になる。また、この方法で除外したサイトは一番下に追加されるので、間違えてブロックしてしまった場合でも探して削除は簡単だ。正直、先に解説したことが霞んでしまうくらいの優秀さである。
補足:動作はあくまで「非表示」にしているだけ
uBlacklistは、指定したサイトを結果から除外する。それはこれまで散々言ってきたことなのでわかることだが、このアドオンはGoogle検索のアルゴリズムにアクセスしているとか、そのようなことは一切行われていない。もし行っていたら、このアドオンは即刻排除されている。
ではどうやっているのかというと、実は除外した結果についても検索結果としては出ているのだが、それを「非表示にする」ことで、除外したように見えるということである。検索結果の1ページは通常10個の結果が掲載されるが、それが10個未満になっていることがその証拠である。また丁寧に、ブロックしているサイトが結果にヒットすると、件数の横にブロックされていることを知らせる内容と、それを表示するリンクが出現する。次がその画像である。

赤枠内(www.iana.org)のサイトをブロックしても、非表示になっただけなのは新しく結果が補充されるわけではないのと、上に非表示になっていること・それらを表示する旨のリンクがあることからわかる。また、開発者ツールで見ても、該当部分のHTMLが削除されていない(存在する)ことを考えれば、確実である。
しかし、見た目には見たくないサイトが結果として現れないようになっているので、それでも十分効果があるというものである。また、ブロックの解除についても先程、オプションからテキストエディタの一番下に追加されたものを削除することでできるとしたが、非表示になっている結果を展開して「このサイトのブロックを解除する」をクリックして「ブロックを解除」をクリックすれば、ブロックしたときと同じ手順によってブロックを解除できる。またも先ほどの解説が霞んでしまった。が、手軽にブロックしてブロック解除もできるので、先の面倒な手入力は全くしなくていいことになり、楽に使えることであろう。
なお、もう1つ補足説明だが、uBlacklistは(Google)検索結果について作用するものであり、サイトへのアクセスをアドオンによって制御しているわけではない。したがって、URLを直接入力したりブックマークでアクセスしようとすれば、普通にアクセスすることが可能である。サイトへのアクセスそのものをしたくない場合は、別のアドオンを使用する必要があるので注意すること。
以上で、uBlacklistの解説は終了である。同期や購読については、説明する必要がないと判断したため省略する。
中身の薄いサイトに邪魔されることはもう終わり
ここまで、主要ブラウザのアドオン”uBlacklist”について、その概要と機能、実際に使用した結果を掲載してきた。インターネットは理論上全世界と繋がっており(所謂”暗部”も含める)、ブラウザで検索すれば様々なサイトが結果として返ってくる。そこから様々なサイトへ飛び、人々はインターネット上で情報・売買・交流、その他様々なことを行うのである。
基本的にサイトを作成するのは人間である。そして作成する人によって、サイトの中身は異なる。殆どの場合、サイトは利用者=閲覧者のために作られる。いわばユーザーフレンドリーを目指すものだ。だが時に、人間とは醜い存在である、ユーザーフレンドリーを全く考えずに、ただ収益のためにあらゆる場所に広告やアヘリ8アフィリエイトをするサイトも存在する。それは往々にして「中身のないサイト」であることが殆どであり、或いはどこかの他サイトやSNSの情報を無断転載したパクり・著作権侵害サイトであることも少なくない。このようなサイトは単純に不快になるだけでなく、閲覧者の時間を無駄に奪う最悪なサイトである。
だが、今回紹介したuBlacklistを使えば、それら中身のないサイトを実質的に排除して、Google検索に静かな平穏を取り戻し、閲覧者は時間の節約とストレス軽減を実現できる。導入はアドオンなので簡単、そしてブロック/ブロック解除の方法は2クリックで簡単に行える。誰でも簡単にできるこのアドオンで、快適な検索ライフ(?)を送れるであろうuBlackilist, 今すぐ入れておいても損は全くないのである。
なお、アフィカスサイト、キュレーションサイト、その他悪質・低質サイトのリストについては、ここでまとめられているので参考にするといい。正直、なんJもあまり好きではないが。
以上、検索結果から削除!uBlacklistのススメと使い方であった。それでは、次回の記事で会おう。アフィカスにバァーイ!
リンクス岐部(LINKS-KIBE) at 15:18 Jan. 5th, 2021
スポンサーリンク
脚注
本文へ1 | 参照:Yahoo! JAPAN#検索エンジン – Wikipedia ただし、あくまでも検索エンジンが同じだけであり、検索結果はYahoo!の関連サービスの結果が通常の検索結果の間に入るなど、手が加えられている。ただ、勝手に間に関連サービスの結果を入れられるのは正直ごちゃごちゃしすぎて見にくいので嫌いである。 |
---|---|
本文へ2 | インターネットに関連する識別子を管理する機能。組織名そのものを示すこともある。IPアドレス・ドメイン名・ポート番号・プロトコル等の割り当て及び管理を行うものである。1988年に南カリフォルニア大学情報科学研究所(USC ISI)のジョン・ポステル教授を中心として設立され、当初は大学や全米科学財団(NSF)の援助を受けながら運営されていた。1998年、国際的非営利組織ICANNが設立されると、2000年にICANNに引き継がれた。結果IANAはICANNの下部組織となった。2016年からはICANNの子会社であるPublic Technical Identifiers(PTI)がその機能を担っている。 参照:Internet Assigned Numbers Authority – Wikipedia, IANA(Internet Assigned Number Authority)とは – IT用語辞典 e-Words |
本文へ3 | このワイルドカードは「任意の文字列が0個以上連続する」の意味を持つ。後に文字列がなくてもOKになる。 |