「SREの知識地図」という書籍を共著しました
はじめに
#SRG(Service Reliability Group)は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。
2025年の振り返り
今年は、本業では、横断SRE組織(SRG)の責任者だけでなく、サイバーエージェントグループ全体の技術経営(CTO統括室)や所属するメディア&IP管轄全体のEM領域をアップデートするためにEM室を立ち上げ、室長としてEM領域の改善を行うなど、昨年よりも職務が広がった1年でした。SRGとしては、戦略的なブランディング向上を掲げ1年間で約60本のブログ執筆と約20件の社内外での登壇を行いました。
また、エンジニアとAIエージェントが協働する、革新的な開発組織の進化を推進するために今年の8月に立ち上げた専門組織「AIドリブン推進室」のボードメンバーとして、サイバーエージェントグループ全体のAI活用も推進しています。EM室やAIドリブン推進室で取り組んでいることについては、また別の機会があればブログや登壇などで共有出来ればと思います。
本業以外では、昨年に引き続き SRE NEXT 2025 にコアスタッフとして参加しました。昨年は、Co-Chairをやっていたこともあり登壇する余裕がなかったのですが、今年はスポンサーセッションではありますが、「サイバーエージェントグループのSRE10年の歩みとAI時代の生存戦略」というタイトルで登壇させていただきました。
また、10年以上にわたりサービスや組織へのSRE推進に取り組んできた経験を元に「SREの知識地図」という書籍を共著者の1人として執筆しました。SNSなどでも、多数のポジティブな評判を頂けており、筆者の1人としてとても嬉しく思います。
本記事では、「SREの知識地図」で担当した8章「SREの組織構造」を書く上で、考えていたことや書けなかったことについて、少しだけ書きたいと思います。
SREの知識地図:8章「SREの組織構造」
SREの知識地図の8章「SREの組織構造」は、 SREの実践を推進していく上で重要なSREの組織構造について書いている章です。8章の構成としては、下記になります。
- 8.1 SREにおける組織構造の重要性
- 8.1.1 組織的なサポートが欠如した環境でSREチームが直面した課題
- 8.1.2 コンウェイの法則と逆コンウェイ戦略
- 8.1.3 SREにおける組織構造の重要性のまとめ
- 8.2 SREの組織構造を考えるヒント
- 8.2.1 チームトポロジー
- 8.2.2 SREのチームトポロジーにおける位置づけ
- 8.2.3 SREとチームトポロジー
- 8.2.4 SREの組織構造を考えるヒントのまとめ
- 8.3 SREの組織パターン
- 8.3.1 3つの組織パターン
- 8.3.2 SRE組織の配置
- 8.3.3 SREの組織パターンのまとめ
- 8.4 SREの実装モデルとパターン
- 8.4.1 3つのSREの実装モデル
- 8.4.2 埋め込み型
- 8.4.3 中央集中型
- 8.4.4 ハイブリッド型
- 8.4.5 SREの実装モデルとパターンのまとめ
- 8.5 SREの実装モデルとパターンの選び方
- 8.5.1 SREが必要となるパターンを整理する
- 8.5.2 組織にあったSREの実装モデルとパターンを選択する
- 8.5.3 SREの実装モデルとパターンの選び方のまとめ
- 8.6 まとめ
執筆する上で考えていたこと
最初に今回の書籍で組織の話を書いて欲しいという話をいただいた時に、今回の書籍が日本語が原著となる初めてのSREに関する書籍ということもあり、出来る限りオライリーから発売されているSRE本(SRE サイトリライアビリティエンジニアリング や SREをはじめよう など)に書かれている内容をまとめるのではなく、自身がSREの組織設計に長年取り組んできたからこそ感じて来たことやプラクティスを組み込んだ形で再設計しようと思って書きました。そういった背景もあり、何度も書き直すことになり、とても書くのに苦労した章でした。レビューしていただいた皆様には本当に深く感謝しています。
書籍の中で説明している3つの組織パターンと3つのSREの実装モデルについては、自身の経験を元にまとめたものになります。
3つの組織パターン
- プロダクト専任パターン:SRE チームが単一プロダクトを専任で担当
- プロダクト横断パターン:SRE チームが複数プロダクトを担当
- 会社横断パターン:SRE チームが複数の会社やプロダクトを担当

3つのSREの実装モデル
- 埋め込み型:組織内の専門的な役割(この場合はサイト信頼性エンジニ ア)が、ほかのチームに直接参加し、一体となって活動するモデル
- Product SRE と Embedded SRE
- 中央集中型:SRE のチームや機能が組織内で集中管理され、統一的な 視点とアプローチで信頼性の向上に取り組むモデル
- SRE Center of Practice とPlatform SRE
- ハイブリッド型:埋め込み型と中央集中型の両方の特性を組み合わせた モデル

3つの組織パターンと3つのSREの実装モデルの詳細については、是非書籍を買っていただければと思います。また、書籍の中で読者の組織の課題やニーズに適したSRE の実装モデルとパターンを選択するための助けになればと、SRE の実装パターン選択ツリーも公開しているので、ぜひ活用していただけると幸いです。8.5.3 SREの実装モデルとパターンの選び方のまとめ の節でも触れていますが、必ずしも書いてある通りに組織設計しても上手くいかないこともあるので、その時は変化を恐れずに、自分の組織にあった実装モデルやパターンへカスタマイズすることも検討してください。また必ずしも専任のSREが必要でないということも忘れないでください。
書けなかったこと
執筆期限もあり、今回の書籍では書くことができなかった話を少し出来ればと思います。多くの人の予想を超えるスピードで、AI技術は進化していっています。SREの実践を推進していくのと同じように、AI活用を推進していく上でも、組織構造はとても重要になります。今回の書籍では書くことができませんでしたが、AI時代のSREの組織がどう変化していくかは、気になる人もいるかも知れません。実際に、SRGでもAI活用を推進しており、SRE領域だけでなくアウトプットの強化やマネジメントなど幅広くAI技術の活用が広がっていっています。また、SRGとして事業やサービスに対してもインフラやSRE領域だけでなくAI活用の支援なども行なっています。
単純なAI活用や支援だけでなく、SRGとしては、AI SREやAI SREチーム化を目指しており、2026年末までに、AI SREチームが機能している状況に達することを目標に進めています。そのためには、中央集中型の実装パターンの一つである SRE Center of Practice が非常に重要になってくると考えています。

終わりに
最近、AI時代においてSREは今後も必要なのかという話をよく聞きます。背景としては、AI技術の進化によって生成AIの品質が上がったことによるものだと思いますが、個人的にはSREのニーズは今後もあると考えています。ただし、組織の規模にもよりますが、横断SREとしての責務の範囲やアプローチ、注力すべき技術領域は変わる可能性があると考えています。この辺の話は、また別の機会で話せればと思います。興味がある人は、飲みかイベントにでも誘ってください。
改めてとなりますが、今回のAdvent Calendarによって、弊社グループの取り組みを多くの人に知ってもらえると嬉しいです。私個人としても、楽しみです。
SRGにご興味ありましたらぜひこちらからご連絡ください。
