MozCon 2020セッションレポート:SEOのための便利な機械学習ワークフロー

2020.10.26

Share

MozConとは、SEOに関連したツールやコンサルティングサービスを提供する米Mozが開催している、デジタルマーケティングのカンファレンスです。毎年7月頃に米国シアトルで開催されていましたが、今年は新型コロナウイルスの影響で「MozCon Virtual」として7月14〜15日にオンラインで開催されました。

本記事では、米MozのSenior SEO ScientistであるBritney Muller氏(以下、ミューラー氏)の「SEOのための便利な機械学習ワークフロー」についてのセッションをレポートします。このセッションでは、Google やFacebookなどが提供する機械学習モデルを活用し、SEOの分析を効率的にする手法が具体的に紹介されました。

36510612096_01

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)
(図1:Accessible Machine Learning Workflows for SEOsと題してセッションを行った米Mozのミューラー氏)

↓MozCon2020セッションレポートの他記事はこちら↓

MozCon2020 セッションレポート:危機的な状況下で検索キーワードやターゲットの動きを把握する

MozCon2020セッションレポート:ソートリーダーシップとSEO:3つの重要要素と検索順位の戦略

MozCon 2020セッションレポート:顧客を探すための科学

MozCon 2020セッションレポート:コンテンツエンジンの設計:アイデアから創造、流通へ

MozCon 2020セッションレポート:顧客のためのBeyond Marketingの方法:繁栄するブランドエコシステムの価値

機械学習を業務に取り入れることについて

ミューラー氏はセッションの最初に、自宅で見つけた鳥の巣のこと、鳥には異なる母鳥の巣に卵を産んで育ててもらう托卵をする種がいることについて紹介しました。ミューラー氏は、SEOに関する分析を機械学習に任せることは托卵に似ていて、業務の効率化につながると述べました。

また、機械学習やプログラミングに苦手意識を持つ人が多いことにも触れ、このセッションの内容はShift+Enterキーを押すことができるのであれば、非常に簡単なものであると繰り返し強調しました。実際にプログラミング未経験のミューラー氏の父親も、セッションで説明される内容よりも複雑な処理を実行できたと述べています。

機械学習でできること

ミューラー氏は、このセッションで紹介するGoogle Colaboratory(以下、Colabと表記)を使えば、下記のようなさまざまな処理ができるようになると紹介しています。

DeepDream

DeepDreamとは、Google社が発表したAIを活用した画像処理エンジンで、夢で見るような幻覚的な画像を生成できます。サンプルとして米Mozの創設者であるRand Fishkin氏と犬の画像をDeepDreamで処理した画像が紹介されました。

36510612096_02

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図2:DeepDreamで生成された画像の例)

3D human estimations

1枚の高解像度の全身写真から、3次元の姿勢を推定して描画することもできます。

36510612096_03

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図3:1枚の高解像度の全身写真から、3次元の姿勢を推定して描画した例)

AIが生成した顔画像の生成

AIを使って実在しない人の顔を生成することもできます。

36510612096_04

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図4:AIが生成した顔画像の例)

また、SEOに関わる業務としては下記を例に挙げ、セッションの後半で具体的な手順を説明しました。

・より効率的なキーワード分析の実現
・トラフィックや売り上げを時系列で予測
・Google のようにURLをエンティティやカテゴリでラベリングする
・より効率的な内部リンク最適化のための分析

機械学習を用いた分析で利用するソリューション

機械学習を用いた分析には、Google が提供するColabの利用が推奨されました。ミューラー氏は、Google がマイクロソフトのExcelをクラウドで管理できるスプレッドシートに変換したように、Colabは機械学習に関する分析で広く使われてきたJupyter ノートブックを便利にしたものに位置付けられると説明しています。

36510612096_05

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図5:Colabの画面イメージ)

 

一般的なAI プラットフォームと比較した場合のColabの利点として、基本的に無料※1でセットアップが不要なこと、GPU環境が無料なこと、MacとWindowsの違いによる動作の不一致がないことなどが挙げられました。ColabはGmailのアカウントを持っていれば誰でも利用することができます。また、Google ドライブと簡単に接続できるほか、Githubとも簡単に接続できる点もメリットとして紹介されました。

※1:無料版は一定の機能制限があり、制限をなくすには月額9.99ドルのColab Proにアップグレードが必要

36510612096_06

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図6:Colabと一般的なAI プラットフォームの比較)

 

ミューラー氏は他にも有料のソリューションとしてKaggleやDatabricks、Azure Notebooks、DOMINO、Amazon SageMakerなどが優れていると紹介し、ひとつだけではなく複数のソリューションを利用することも推奨しました。

 

Colabを使ったSEOのための分析

ミューラー氏は、Colabを使ったSEOに関する分析手法を5つ紹介しました。分析に使われたColabファイルは以下のURLで公開されているため、自分の環境で実行してみることもできます。

参考:GitHub - BritneyMuller/colab-notebooks

Google が提供するNatural Language APIを用いた手法

最初に紹介されたのは、Google が提供する機械学習モデルであるNatural Language APIを利用した手法です。Google が認識する方法と同じ方法で、非構造化テキストから構造や意味、エンティティを明らかにすることができます。Natural Language APIを使ってColabで分析するには、Google Cloud からAPIキーを入手してColabにアップロードする必要があります。ミューラー氏は、このAPIを使った分析の例をふたつ紹介しました。

例1)「who is the smartest SEO (SEOでもっとも優れた人は誰か)」に関する記事
この検索キーワードの強調スニペットには、セッションがおこなわれた2020年7月時点ではTom Crewe氏を紹介するページが表示されますが、以前はミューラー氏を紹介するページが表示されていました。

36510612096_07

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図7:セッションがおこなわれた時点の「who is the smartest SEO」の検索結果)

このケースを例に、「who is the smartest SEO」がテーマのページで異なる3人(Tom Crewe氏、Tim Brown氏、Britney Muller氏)を紹介するURLを対象に分析をおこないます。Natural Language APIを用いてエンティティを取得すると、次のようなデータが取得できます。

36510612096_08

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図8:対象としたURLのエンティティ取得結果)

このデータと実際の順位状況から、「who is the smartest SEO」という検索キーワードで競争力を高めるために重要そうなエンティティ(緑色)と重要度が低そうなエンティティ(赤色)を推測することができます。

36510612096_09

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図9:取得したエンティティを色分けした例)

 

ミューラー氏は、このキーワードでの上位争いは「silly game」(他愛無い遊び)であり自分にとって重要ではないものの、他の重要なキーワードではGoogle が認識するエンティティを把握することは価値があると述べています。

Colabのサンプル:Extract Entities from URLs (via Google's NLP API)

 

例2)レンタカー会社のWebページ内テキスト
このAPIのデモ機能でもGoogle がどのようにテキストを認識しているか確認することができます。ふたつめの例では、レンタカー会社であるEnterprise Rent-A-Car社とHertz社それぞれのエリアページ内のテキストの認識結果を比較しています。

Enterprise Rent-A-Car社のページ内テキストを解析すると、99%の信頼度で「レンタカー&タクシーサービス」のカテゴリと判定していることがわかります。

36510612096_10

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図10:Enterprise Rent-A-Car社のページ内テキストの解析結果)

 

一方、Hertz社のページ内テキストは「レンタカー&タクシーサービス」のカテゴリである信頼度は65%と判定されており、他の複数のカテゴリも表示されます。

36510612096_11

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図11:Hertz社のページ内テキストの解析結果)

ミューラー氏はこの結果について、エリアを含むキーワードでHertz社の順位があまりよくないことと関連している可能性があると述べました。Google がコンテンツをどのように認識しているか確認し、微調整することで改善できる場合があると説明しています。

参考:Cloud Natural Language | Google Cloud

FacebookのProphetを用いた時系列予測

次に紹介されたのは、Facebookが提供する時系列予測のオープンソースライブラリであるProphetを利用する手法です。過去の時系列データをインプットすることで一定期間の未来のデータを予測することができ、Webサイトへのトラフィックや売り上げなどあらゆるデータの予測に活用できます。

セッションでは、過去3年間の時系列データをインプットし、30日後までの数値を予測した結果が紹介されました。あわせて、予測期間は長くなればなるほど、精度が下がる点を認識しておく必要があることも述べられました。

36510612096_12

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図12:Prophetを用いて得られた値をプロットした例)

Colabのサンプル:Time-Series Forecasting (Traffic, Sales, etc.)

BARTモデルを用いたテキスト要約

テキストの要約もおこなうことができます。ミューラー氏はテキスト要約モデルのひとつであるBARTを利用した例を紹介しました。簡単に要約を作ることができるため、SEO担当者にとっては、meta descriptionの作成に役立つ可能性があると述べられています。

Colabのサンプル:Text Summarizer ※2
※2:サンプルは日本語非対応

より効率的なキーワード分析

ミューラー氏は、キーワード分析をより効率的にするための手法として、Google サーチコンソールの検索パフォーマンスで確認できるキーワードをColab上で分析する方法を紹介しました。Google サーチコンソールから抽出したデータをColabにアップロードし、フィルタリング可能なデータテーブルを作成すれば、柔軟な条件でのデータ抽出が可能になります。

例えば、ブランド名を含むキーワードのみを素早く収集することも可能になります。また、ブランド名のスペルミスも含めて抽出することもできます。この例では、データテーブルに「Branded」の列を追加し、「Moz」、「Rand」、「Rand」のスペルミス、「OSE」が含まれる場合を判定しています。

36510612096_13

参照元 MozCon『Accessible Machine Learning Workflows for SEOs』 (最終閲覧日:2020年10月27日)

(図13:ブランド名を含むキーワードの判定結果)

 

同じようにすればブランド名を含むキーワード以外にも、ツール名や取引に関わるキーワードでも同じように列を作成して簡単にフィルタリングをすることができます。これをエクセルでやろうとすると、スペルミスまで含めるには大量の条件式が必要になりますが、Colabでは1行で実行できることもメリットとして紹介されました。
Colabのサンプル:Keyword Research Made Easy!!!

より効率的な内部リンク分析

最後に、内部リンク分析をより効率的にする手法が紹介されました。インプットするのは、Screaming Frogで抽出した内部リンクデータです。ミューラー氏のColabのサンプルを利用すると、もっともアンカーテキストに利用されているキーワードや内部リンクが集まっているページ、内部リンクが少ないページ、孤立しているページなどを瞬時に確認することができるようになります。例えば、特定のキーワードを最適化しようとしている時に、そのキーワードがアンカーテキストに含まれるケースの確認に活用できます。
Colabのサンプル:Quick & Dirty Internal Link Analysis

まとめ

このセッションでは、「機械学習を業務に取り入れること」をテーマに、具体的な手法が細かく説明されました。プログラミングや機械学習に苦手意識を持つ人は多いですが、紹介されたサンプルを使うことで専門的な知識がなくても、分析を始めることができます。またGoogle の提供するColabなどのツールによって、機械学習を使った分析環境は誰にでも構築できるようになってきています。より重要な業務にリソースを使えるよう、機械学習や自動化をうまく活用する重要性が高まっています。

▼関連資料

SEOコンサルティングサービス

 

この記事の著者

増渕 佑美

2014年に株式会社アイレップに入社し、SEOコンサルタントとして従事。ソリューション部署に所属。通販や人材などデータベース型サイトを中心に経験を積んでおり、現在はメディアサイトのSEOも担当し幅を広げている。
好きなこと:散歩、パズル、動物の動画をみること

2014年に株式会社アイレップに入社し、SEOコンサルタント...

Share

一覧に戻る