About
English follows Japanese.
基本情報と連絡先
key | value |
---|---|
Name | Takeshi Kondo |
take.she12[at]gmail.com |
職務要約
Software Engineer として 9年+, うち Site Reliability Engineer として 5年+、Engineering Manager としての経験が 2年+ あります。直近は開発部の部長として100名規模の開発組織のマネジメントを行っています。
On-Premise 環境でのハード・ネットワーク・ストレージの知識および Cloud 利用、それらを Software で制御する IaC や Container Orchestration 領域に強みがあります。
SRE として、Web Service の信頼性担保のためのObservability やIncident Response / Management の経験があります。SLI/SLO を100名規模の開発組織に導入し、Engineering だけでなく Culture として組織を推進する力があります。
Individual Contributor として、SRE / Platform Engineering 領域の Lead を担うことができます。そのために必要なツールや自動化のための Software Programming を行うことができます。
また、オンボーディングプロセスの導入および推進や、技術コミュニティの運営、カンファレンスの運営等、技術外での Culture Making 活動およびコミュニティ活動の実績と知見があります。
最大15名のマネジメント、3チームのマネジメントの経験があります。自身がメンバーとして在籍したことがないチームにおいても実施することができます。
直近は開発部長として、100名規模の開発組織全体の組織課題の解決、技術戦略の策定・実行、Engineering Manager のキャリア構築支援や育成を行っています。
職務経歴
株式会社リクルート (Oct. 2021 ~ Present)
Director of Engineering, StudySapuri K12 (Oct. 2023 ~ current)
スタディサプリ小中高のプロダクト開発部部長を担当。
組織開発
100名以上のエンジニア組織・エンジニアの課題解決、採用、育成を行っています。
以下のアウトプットも参照ください。
技術戦略
スタディサプリ小中高を構成する Frontend / Backend / Platform の技術戦略を、事業・プロダクト戦略に Align する形で策定・実行しています。
以下のアウトプットも参照ください。
プロダクト開発
プロダクト開発の責任者として、プロダクトロードマップの達成に責任を持っています。以下のプロダクトを担当しています。
Engineering Manager, Site Reliability / Web Application Development (Oct. 2022 ~ Sep. 2023)
SRE として国内に展開するスタディサプリ と海外に展開する Quipper の信頼性に関わる業務に従事。
加えて、スタディサプリ新中学講座の開発チームのマネジメントに従事。
担当したチームの活動として以下のアウトプットもご覧ください。
Engineering Manager, Site Reliability (Oct. 2021 ~ Sep. 2022)
SRE として国内に展開するスタディサプリ と海外に展開する Quipper の信頼性に関わる業務に従事。
- SRE Team のマネージャとして、プロダクトの信頼性と開発体験を担保するためチームのマネジメントを行いました。以下のアウトプットも参照ください。
Quipper Limited (Jun. 2018 ~ Sep. 2021)
Lead Software Engineer, Site Reliability (Jun. 2020 ~ Sep. 2021)
SRE として国内に展開するスタディサプリ と海外に展開する Quipper の信頼性に関わる業務に従事。
SRE Team の Lead Engineer としてTeam および開発組織の Lead
5-7名規模の SRE Team の Lead Engineer として、Team Member の業務遂行のための障壁を取り除き、Individual Contributor として成果を出しました。
Service の Alert Policy の再定義
Alert Policy もなく、都度反応しており、Noise となっていた状態から、Sevirity を定義、全166 のアラートを見直しました。
詳細は Alerting Strategy for Self-Contained Team をご覧ください。
Argo Rollouts を用いた Progressive Delivery(Canary Release) の実現
Progressive Delivery の実践として、Kubernetes Native で導入が用意な Argo Rollouts を用い、Rails Upgrade などリスクの高い変更を段階的にリリースできる基盤作りに貢献しました。
Application Platform を Self-Hosted Kubernetes から Amazon EKS への移行
AWS 上に Self-Host していた Kubernetes Cluster を Amazon EKS へ移行しました。
詳細は Self-Hosted Cluster から EKS への移行と Platform の Production Readiness をご覧ください。
また、Cluster Upgrade に対しても ALB Weighted Target Groups を用いた Canary Reelase の仕組みを実現しました。
詳細は ALB Weighted Target Groups による EKS Cluster の Canary Switching をご覧ください。
ドメイン固有データを利用した Scheduled Scaling
「定期テスト」という一斉にアクセスが発生するイベントに対して、サービスダウンを回避するために Kubernetes HPA External Metrics を利用した Scheduled Scaling を実現しました。
詳細は Kubernetes HPA External Metrics を利用した Scheduled-Scaling をご覧ください。
以下の登壇資料でも解説しています。
Software Engineer, Site Reliability (Jun 2018 ~ Jun 2020)
SRE として国内に展開するスタディサプリ と海外に展開する Quipper の信頼性に関わる業務に従事。
Microservices に転換する上での Production Readiness に関わるプロセス整備
組織の拡大を見越して、Monolith Application から Microservice Architecture に移行した後の、Production Readiness を担保するプロセスおよびカルチャーを作りました。具体的には以下のようなことを Lead しました。
- Service の Owner を決める・定義できる仕組み作り
- 新規サービス作成時のDesign Doc Review および Productoon Readiness Checklist の立ち上げ・メンテナンス
- Cloud Infrastructure (Microservice が利用する RDS) を開発者が Self-Service で作成できる仕組み作り
SLI/SLO を計測、定義する文化を開発チームに導入
SRE の Core Concept である SLI/SLO を組織に導入しました。
詳細は SRE NEXT 2020 で「SLO Review」というタイトルで登壇しました #srenext をご覧ください。
富士通株式会社 (Apl,2014 - Jun,2018)
Software Engineer
Public Cloud IaaS K5
- MariaDB Garela Cluster の停止時間を最小限にしながらの Major Version Upgrade 手法の提案
- OpenStack IaaS コンポーネント(Nova, Cinder, Glance, Keystone, and Heat) のバグ修正
- IaaS コンポーネントの無停止保守を行うツール開発
- OpenStack の CI/CD 環境の構築およびチームへの導入支援
ServerView Resource Orchestrator
- ストレージコンポーネントの開発および修正
学歴
- 九州工業大学 情報工学部 情報システム専攻 修了(Mar. 2014)
資格
- 2020 Apl. HashiCorp Certified: Terraform Associate
- 2020 Jan. Site Reliability Engineering: Measuring and Managing Reliability
- 2015 Jun. 情報セキュリティスペシャリスト
- 2014 Dec. ネットワークスペシャリスト
Senior Engineering Manager / Director at Recruit Co., Ltd. (Oct, 2021~), formaerly Quipper (Jul,2018〜).
I have six years of experience as a software engineer. Of that, I have two years of experience as a Site Reliability Engineer. Most recently, I has managed a 100-person development organization as the head of the development department.
I’m good at implementing the necessary technologies and processes for organizations. I recently introduced a central theme, SLI/SLO, to both Japanese and global products and promoted it to a situation where developers can handle it themselves.
As a team and project lead, I can find a problem correctly and take the team forward through communication and facilitation.
I completed technical projects with a high degree of uncertainty and impact, such as migrating a Kubernetes Cluster from self-hosted to EKS and OS upgrades for Reverse Proxy.
I can communicate and discuss in English. As an SRE, I have introduced new technologies and processes to global product teams and supported their development productivity.
Career
Recruit Co., Ltd. (Oct, 2021~)
Senior Engineering Manager / Director, StudySapuri K12 (Oct. 2023 ~ current)
Senior Engineering Manager / Director, StudySapuri K12 (Oct 2023 ~ current)
Organizational Development
We solve problems, hire, and train over 100 engineering organizations and engineers.
Technology Strategy
I am in charge of developing and executing the technology strategy for the Frontend, Backend, and Platform that make up StudySapuri K-12 in a way that is aligned with the business and product strategy.
Please refer to the following outputs.
Product Development
As the head of product development, I am responsible for achieving the product roadmap. I am responsible for the following products.
- StudySapuri New Elementary School Course
- StudySapuri Junior High School Course
- StudySapuri High School and University Entrance Exam Courses
- StudySapuri for TEACHERS
Engineering Manager, Site Reliability / Web Application Development (Oct. 2022 ~ Sep. 2023)
As an SRE, he is responsible for the reliability of StudySapuri in Japan and Quipper overseas.
In addition, he manages the development team of StudySapuri New Chugaku Course.
Engineering Manager, Site Reliability (Oct. 2021 ~ Sep. 2022)
As an SRE, he is responsible for the reliability of StudySapuri in Japan and Quipper overseas.
- As manager of the SRE Team, I managed the team to ensure product reliability and development experience. See also the following outputs.
Quipper Limited (Jun,2018〜)
Lead Software Engineer, Site Reliability (Jun,2020〜)
- Responsible of site reliability for studysapuri.jp and quipper.com
- Lead SRE Team / Project
- Define an alert policy and implement it in the service team
- Introduce Progressive Delivery
- Migrate application platform to AWS EKS
Software Engineer, Site Reliability for Global Product (Jun 2018 ~ Jun 2020)
- Responsible for site reliability for quipper.com
- Build an SLO review culture for all product teams.
- Improve Circuit Breaker by introducing Envoy proxy
- Manage Cloud Infrastructure with Code (Kubernetes manifest, Terraform DSL, Ansible Playbook, Nginx configuration, and CircleCI)
- Build a standardized system for Microservices (Readiness Check, SLO, RDS self-service, Define service owner)
- Improve site performance with Nginx Cache or CDN
Fujitsu Limited (Apl,2014 - Jun,2018)
Software Engineer
- Public Cloud IaaS K5
- Upgrade MariaDB Garela Cluster without an extended downtime
- Bugfix and failure handling of IaaS configured with OpenStack (Nova, Cinder, Glance, Keystone, and Heat)
- Tool development for deploying without downtime (Capistrano)
- Introduction and Enlightenment of CI/CD (GitLab-ci and OpenStack/Tempest))
- ServerView Resource Orchestrator
- Resource Orchestrator is IaaS management software from Ruby on Rails
- Enhance a new feature and Bug Fix
Education
- Mar 2014 Master of Engineering in Information Technology