どうする?常時SSL化対応の混在コンテンツチェック

株式会社ミツエーBPOコンサル 取締役 山下

Webサイトの常時SSL化対応については、当社のコラムや他のブログで触れられているので、対応のメリットなどはそれらのコンテンツをご覧いただければと思いますが、実際に常時SSL化の対応を進めるにあたって、企業のWeb担当者たちの頭を悩ませることの1つが混在コンテンツ(Mixed content)のチェックと解消ではないでしょうか。

混在コンテンツとは

混在コンテンツとは、HTTPSのページに含まれるHTTPで配信されたコンテンツを指します。 混在コンテンツがあると、そのHTTPコンテンツが攻撃者に盗聴されたり、改ざんされてユーザーが危険にさらされる可能性があるため、ブラウザ側で混在コンテンツの読み込みや実行をブロックしたり、アドレスバーに警告を表示します。

例えばGoogle Chromeの場合、通常はアドレスバーの先頭には鍵アイコンと「保護された通信」というメッセージが表示されていますが、閲覧しているページの中で読み込まれている画像のパスが「http://」始まりで書かれているとアイコンやメッセージが表示されず、バツ印がついた縦のアイコンが表示されてしまいます。

混在コンテンツのエラーをなくすには

混在コンテンツのエラーをなくす対応として、サイト全体を検索し、httpをhttpsに置換してよいものは置換するという一般的な対応はもちろんするにしても、自分たちが認識していない混在コンテンツエラーが発生していないか調査したいというケースはどうしてもあると思います。

ところがこの混在コンテンツが生じるページの把握は単調な作業ではあるものの、数千ページもあるような大規模サイトですと大変な工数になります。例えば3000ページのWebサイトを調査するのに、どのくらいの時間がかかるか計算してみましょう。 作業手順は、URLのリストを用意して、そのURLを1つずつブラウザにコピペしてブラウザに表示し、開発者ツールで混在コンテンツのエラーが出ていないか確認してExcelに結果を記録するのが一連の流れです。一般的なスペックのPCでこの作業を行うと、1ページあたり15秒くらいかかります。

それが仮に3000ページあると45000秒、つまり12.5時間かかります。休憩したりほかの仕事が割り込んだりということを考えると、かなり集中力がある方であっても2日、いろいろなタスクと並行しながら作業を進めるようなケースだと3日~5日はかかってしまうでしょう。 さらに、テスト環境と本番環境で2回チェックを回したいとなると、上記の倍の時間が調査に費やされることになります。普通に考えて人間が対応するのはあまり現実的ではありません。そこでロボットの出番です。

ロボットによる混在コンテンツチェック

ロボットはまさにこのような単純作業を大量に繰り返すというタイプの業務を一番得意とします。 当社の事例ですと、10000ページ以上のWebサイトのチェックを行ったことがありますが、ロボットの特徴である24時間稼働できるというメリットを生かし、調査開始から3営業日目には調査を完了し、報告書を提出することができました。

常時SSL化対応の混在コンテンツチェック作業をRPAで行うことは、ロボットの単純作業の繰り返しが得意という特性をうまく生かしつつ、人間はロボットからの調査結果を受け取り、どういうエラーが発生しているのか分類を行い対策を考えるという人間にしかできない業務に集中できるという好事例の1つだと思います。

もし常時SSL化対応の混在コンテンツチェック作業について、同様のお悩みをお持ちの方がいらっしゃいましたら当社にご相談ください。

関連記事