朝日新聞デジタル様

マイクロサービスの品質維持・向上を目的にオブザーバビリティを採用 開発チームがサービスの不具合をアジャイルに発見・解決する体制を確立

利用用途

ニュースサイト、朝日新聞デジタルのユーザー体験とサービス品質の維持・向上を目的にNew Relicを導入。マイクロサービス化を進めるシステムのサービスレベル目標(SLO)達成度のリアルタイムな可視化と問題解決の迅速化に生かす。

New Relicの選定理由と成果

  • SLOの達成度を計測するのに必要なデータの収集と可視化を自動化
  • 多数のマイクロサービスの状態を可視化し、開発チームが問題の検知と対処を速やかに遂行できる体制を確立
  • 朝日新聞デジタルのシステムのみならず、そこに連携するすべてのシステム、サービスの状況も俯瞰してとらえられるように
  • 朝日新聞デジタルのサービス状況を全社的に共有し、サービス品質のさらなる向上に向けたコミュニケーションの活性化に活用

利用製品

  • New Relic APM
  • New Relic Browser
  • New Relic Infrastructure
  • New Relic Logs
  • New Relic Synthetics

 

 

 

 

株式会社朝日新聞社(以下、朝日新聞社)は今日、数々のオンラインメディアを運営している。その代表的な一つが、ニュースサイトの朝日新聞デジタル(通称、朝デジ)だ。同サイトの月間PVは1 億8,000万PV(2022年度実績)に上り、会員数は2021年末時点で406万人に達している。また、オンライン向けに編成されたニュースに加えて、新聞紙面をデジタル化してオンラインで閲覧できるサービスなども提供している。

そうした朝デジの事業をシステム面から支えているのが、朝デジ事業センターのカスタマーエクスペリエンス部だ。同部のミッションについて、アーキテクトの岡本 樹氏はこう話す。

「私たちの主たる役割は、朝デジのユーザー体験やサービス品質を維持・向上させることです。その役割を担う中で、システムの設計、開発、保守、運用管理に携わっています」

また、朝デジ事業センター ディレクターの金子 淳貴氏は次のような説明を加える。

「朝デジは、社会インフラとして機能しているニュースサイトです。システム上のトラブルによってニュースの配信がストップする、あるいはニュースが読めなくなるようなことはあってはなりません。ゆえに、システムを安定して稼働させ、そのサービス品質を高いレベルで保つことが、最も重要なミッションといえます」

そうしたミッションを担うために、同社が採用したのがNew Relicである。

New Relicは業界を代表するオブザーバビリティプラットフォームであり、デジタルサービスにおけるあらゆる重要指標の「観測」を可能にする。アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する機能は業界随一との評価を得ている。

朝日新聞 岡本様

朝デジ事業センター カスタマーエクスペリエンス部 アーキテクト、岡本 樹氏

朝日新聞社 金子様

朝デジ事業センター カスタマーエクスペリエンス部 ディレクター、金子 淳貴氏

システムのマイクロサービス化によりオブザーバビリティの実現が必須に

 

朝デジでは、ユーザー体験とサービス品質の維持・向上に向けて2019年からシステムの変革に着手している。その変革とは、アプリケーションの構造をモノリシック(一枚岩的)なアーキテクチャから、小さなソフトウェア部品(=マイクロサービス)を疎結合のかたちで組み合わせて全体を構成するマイクロサービスアーキテクチャへと段階的に移行させ、機能の追加・変更のスピードを高めていくことだ。

「旧来のモノリシックなアプリケーションは、長年にわたる運用を通じて機能追加が繰り返されてきたために肥大化し、機能の追加・変更に相当の手間とコストがかかるものになっていました。その問題を抜本的に解決する一手としてアプリケーションのマイクロサービス化に乗り出しました」(岡本氏)

アプリケーションのマイクロサービス化は順調に進み、マイクロサービスの数も増えていった。ただし、それに伴ってサービスの全体を俯瞰してとらえづらくなるといった問題が浮上したと岡本氏は明かす。

「朝デジにおけるマイクロサービスの開発は、アジャイル開発の体制を組む複数のチームで行っています。その体制下でサービスの数が増えていくと、各チームは他チームが開発したサービスについて、どのような処理を行っているのか、どういったサービス、あるいはシステムと連携しているかを把握するのが難しくなります。その中で、アプリケーションのマイクロサービス化を推し進め、サービスの数がどんどん増えていけば、いずれはサービスの全体を把握できている人が一人もいなくなることが予想されました。また、その結果として、システムに何らかの障害やパフォーマンスの低下が発生した際に、その原因を突き止めるのがきわめて困難になることが目に見えていたのです」(岡本氏)

こうした問題を解決すべく、岡本氏らはマイクロサービスの状態を観測し、可視化できるオブザーバビリティソリューションの導入を決断した。それがNew Relicの採用につながったという。

SLO達成度の可視化に最適なソリューションとしてNew Relicを選択

オブザーバビリティソリューションの導入を決めた朝デジでは、同ソリューションを提供する製品の選定に着手した。その際、製品選定における基準の1つにしたのは、朝デジがGoogleの『The Art of SLOs』を使って独自に定めた「サービスレベル目標(SLO)」の達成度を正確に計測できるかどうかだ。言い換えれば、SLOの達成度を表す数々の指標「サービスレベル指標(SLI)」をデータとして収集する能力に優れているかどうかを、製品評価の重要な項目として定めたのである。

また、システム導入の簡単さや可視化されたデータの見やすさ、多様なシステムの観測を可能にする「OpenTelemetry」のサポートなども製品選定の基準とした。朝デジでは、これらの基準をもとに、いくつかの製品を導入検討の土俵に上げてPoC(概念検証)を実施。その結果として選んだのがNew Relicだったという。

「PoCを通じて、New RelicはSLIの収集とSLOの達成度を可視化するのに適した製品であることが確認できました。実際、同製品を使うことで、システム全体の状態やサービスレベルがリアルタイムに、かつ正確に計測できるのはもとより、SLOの達成度をSLIを使って分かりやすく、かつ簡単に可視化できます。そのことは、New Relicを選ぶ決め手の1つとなりました」と岡本氏は語り、こうも続ける。

「New Relicのダッシュボードやサービスマップは非常に見やすく扱いも簡単で、その活用を通じて開発チームは、システムの障害やパフォーマンス低下の原因をすぐに突き止めることができます。これならば、SLOの達成に資する監視と運用の体制が構築できると確信しました」

一方、金子氏はNew RelicにおけるOpenTelemetryのサポートを高く評価したという。

「朝デジのシステムは、他部署のシステムやサービスと連携しており、CDNも活用しています。朝デジのサービス品質を維持するうえでは、それらのシステム、サービス、ネットワークの状態も俯瞰してとらえられるようにすることが大切です。ゆえに、オブザーバビリティの製品には、OpenTelemetryなどのオープンな技術を通じて、多種多様なシステム、サービス、ネットワークからデータが取得できる機能を強く求めました。New Relicはその要件もしっかりと満たしていたということです」(金子氏)

このほか、New Relicの導入が簡単でシステムの観測がすぐに行えるようになる点や、製品サポートのレベルの高さ、さらには朝日新聞社内の他部署でもNew Relicを使用していたことなども採用の決定に大きく作用したと岡本氏は明かす。

New Relicによる見える化でSLO達成率99.99%を維持

朝デジでは現在、SLIとして定めた値をもとにNew Relicによるアラートを設定。サービスレベルの低下が認められた際にはNew Relicと連携するインシデント管理ツールを介して関係各所にアラートを通知し、問題原因がマイクロサービス(ないしは、アプリケーション)にある場合には、開発チームによる問題原因の特定と解決のアクション(スプリントの遂行)が即座にとれる体制を敷いている。この体制により、朝デジのサービス品質が高いレベルで維持されるようになったと岡本氏は明かす。

「New Relicの導入以前は、例えば、朝デジアプリの検索システムにおいて、タイムアウトエラーに遭遇するユーザーが毎月100名程度出ていました。それが現在は、タイムアウトエラーに遭遇するユーザーはほとんどいなくなっているほか、SLOの達成率として99.99%が維持できています。これは、New Relicによって問題の検知・対処のアクションが漏れなく迅速にとれるようになったことの成果です」(岡本氏)

また、New Relicによる可視化の幅広さ、能力の高さを評価する声も多いという。その点について金子氏は次のように話す。

「朝デジではマイクロサービスの実行環境としてサーバレスコンピューティングを実現するAWS(Amazon Web Services)の『Lambda』を用いていますが、New Relicの導入によって複数のLambda環境を跨いだかたちでマイクロサービスの動きをトレースできるようなり、システムの状態をより詳細にとらえられるようなりました。それだけでも、サービス品質の維持・向上に向けた意義ある改善といえます」(金子氏)

一方、New Relicでシステムの外形監視を行っている朝デジ事業センター カスタマーエクスペリエンス部の高橋 裕幸氏は、New Relicを次のように評価する。

「New Relicを使った外形監視は手間がかからないうえに、収集されるデータが多角的で分析もしやすく、システムのユーザー体験を良好に保つうえで非常に有用であると感じています」

さらに、朝デジ事業センター カスタマーエクスペリエンス部で課金システムやIT基盤の運用管理を担当している川上 和真氏は、New Relicの導入効果についてこう述べる。

「課金システムを含めて、朝デジのシステムを支えるコンテナは97、ECサーバは31台です。そのうちNew Relicで観測できているのはコンテナ43、EC2サーバは29台に上ります。New Relicの導入でそれらすべての稼働状況が一目で確認できるようになり、IT基盤の監視と運用管理のストレスが大きく減っています」

朝日新聞社 高橋様

朝デジ事業センター カスタマーエクスペリエンス部、高橋 裕幸氏

朝日新聞社 川上様

朝デジ事業センター カスタマーエクスペリエンス部、川上 和真氏

ダッシュボードを全社で共有しサービスレベルのさらなる向上に生かす

朝デジでは、New Relicのダッシュボードを、カスタマーエクスペリエンス部内のエンジニアだけではなく、朝日新聞社の全社員で共有する取り組みも推進している。2023年7月時点ですでに、朝デジ事業に関係する約400名がNew Relicのダッシュボードを使い、朝デジのサービス状況をとらえているという。

「朝デジは、当社の全社員がステークホルダーであるといえます。ですので、New Relicのダッシュボードをすべての社員と共有することを目指して、そのユーザーのすそ野を押し広げています。これにより、New Relicで可視化した、誰にとってもわかりやすいデータを軸にしながら、さまざまなスペシャリティ、知見、視点を持った人たちと活発にコミュニケートし、サービスレベルのさらなる向上に役立てていきたいと考えています。また、そのような情報共有が実現可能になったことは、New Relicを採用した大きな効果であり、意義であると見ています」(岡本氏)