タグ

SREに関するyouko03のブックマーク (11)

  • これからはじめる 実践SRE / SLO の監視をやってみよう

    SRE がアツいですね。 昨年は以前に増して SRE 関連のイベントも増え、SRE 人材への注目も更に高まっていると感じた 1 年でした。私も Google Cloud の Customer Engineer として、お客様へ SRE のお話をする機会が増えてきています。 ご存知の通り、SRE は Google から生まれた運用プラクティス、またはそのロール自体を指す言葉です。 詳細は無料で読むことができる書籍を御覧ください。 “Site Reliability Engineering” 及び “The Site Reliability Workbook” (右上の右2つ)は HTML 形式 なので、Google Chrome で右クリックして 翻訳を選択するという簡単な手順で日語でも読むことができます。(書籍がよい方は日語版も購入できます。) 今回のテーマは SLO (Service

    これからはじめる 実践SRE / SLO の監視をやってみよう
  • はじめの一歩を踏み出したい方へ~SREというロールを担うためにやったこと、学びや反省 / Let's start the first step to the SRE

    はじめの一歩を踏み出したい方へ~SREというロールを担うためにやったこと、学びや反省 / Let's start the first step to the SRE

    はじめの一歩を踏み出したい方へ~SREというロールを担うためにやったこと、学びや反省 / Let's start the first step to the SRE
    youko03
    youko03 2023/03/05
  • 横断的なSRE推進と成熟度評価

    [RSJ24] Object Retrieval in Large-Scale Indoor Environments Using Dense Text with a Multi-Modal Large Language Model

    横断的なSRE推進と成熟度評価
  • ソフトウェア開発ライフサイクルに SRE という文化を Enabling していくためのアプローチ - freee Developers Hub

    こんにちは。freee の Enabling SRE チームに所属している nkgw (Twitter) です。 freee Developers Advent Calendar 2022 の 15 日目の記事となります。 普段は、エンジニアリングマネージャーをしつつ、新規プロダクトのリリースサポートとか、envoy の機能である external authorization の実装などをやってました。 以前 SRE チームのマネジャー 河村より 2022: freee SRE Journey - これまでの振り返りとこれから という記事にて今までの SRE チームの遍歴及び簡単な今後について書いていただきました。 記事では freee の SRE の Rebuild として、どのようにプロダクトチームと一緒に SRE の Enabling(有効化) を進めていくのか、プロダクトチームが

    ソフトウェア開発ライフサイクルに SRE という文化を Enabling していくためのアプローチ - freee Developers Hub
    youko03
    youko03 2023/02/13
  • クラウドが好きな大学生が読んで良さげだった本を紹介する - Qiita

    前提 大学1年の終わり頃にプログラミング学習を始めて、ちょうど3年弱くらい経ちました。 数え切れないほどの技術書を読んできましたが、その中でも「これはよかったような気がする!」という書籍を載せておきます。 選出の観点は「面白さ」「わかりやすさ」「その知識が役に立ったか」の3つの観点から総合的に評価しています。 また、原則翻訳されたものがあればそちらを掲載しています。 ところが、僕はO'Reillyのサブスクを契約しているため、ほとんどのO'Reillyの書籍を原文で読んでいます。 そのため、翻訳の精度などについて評価することはできない点をご了承ください。 ※ リンクはアフィリエイトリンクではないので、気にせずご覧ください。 ネットワーク 3分間ネットワーク ネットワークのプロトコルとか以前の最低限の仕組みをトーク形式でわかりやすく話してくれている書籍です。 大学の授業とかを受ける前にこの

    クラウドが好きな大学生が読んで良さげだった本を紹介する - Qiita
  • https://newrelic.com/sites/default/files/2021-10/SRE_NTTDocomo_NewRelic.pdf

  • DevOpsとSREの違いとは?

    ビズリーチのSREチームでJenkinsおじさんとマネジメントを担当している阪です。もう先月の話になりますが、サンフランシスコで開催されたGoogle Cloud Next ‘18に参加してきました。今回はその場で何度も聞いた class SRE implements DevOps という考え方を紹介させて頂きます。DevOpsとSREの関係性を理解する上で大変参考になりました。 DevOps、SREという単語が使われるようになって時間が経ちましたが、若干のバズワード感も否めず私自身混乱していました。そのような中でSREの草分け的存在であるGoogleが新たに class SRE implements DevOps というメッセージを発信し始めました。これは「SREはDevOpsというinterfaceの実装である」という意味で、いわゆるプログラミング言語の抽象化機能であるinterfa

    DevOpsとSREの違いとは?
    youko03
    youko03 2022/06/25
    “DevOpsはあくまで思想=interfaceであり、SREはその実装である”
  • 設定だけで Ruby アプリを高速化する

    新年あけましておめでとうございます。 @rosylilly です。 この前 SRE 養成講座の体験授業配信 をしたんですが、その時にハンズオンの一環で Ruby 製アプリケーションをいじって高速化してみる。という内容を実施しました。 コンセプトとしては、『ちゃんと設定ファイルを書くだけでも高速化する』という感じです。作業としてはアプリケーションをいじらずに、設定だけいじって高速化する、ということなんですが、結局何がどれくらい効くのか、というのを事前に参考値レベルで弾いておかないとぶっつけ番になっちゃうな、ということで何がどれくらい効くのかを試してからにしようということで、事前に調査したときのベンチテストと何を変えたかの記録になります。 ベンチマークの前準備 今回はほぼ何もしない Sinatra アプリケーションを作って、その性能差から測ります。ということで用意した性能測定用何もしない S

    設定だけで Ruby アプリを高速化する
  • SRE 養成講座「BURST」体験講習会配信 #burst_sre

    今回は 株式会社テックコンシリエ 様 のSRE養成講座 BURST の体験講習会に参加します! エンジニアVTuber 3名、果たしてパフォーマンスを改善するこごはできるのか!? #burst_sre ■BURST について --- ITインフラにおけるクラウド活用が一般的になりつつある近年、インフラにおける日々の運用業務において、WEBエンジニアに求められる役割が大きく変わろうとしています。その結果、Google発で登場した『SRE(=サイト・リライアビリティ・エンジニア)』、つまり、Webサイトやサービスの信頼性向上に必要となる各種業務をスピーディに行い、価値向上に貢献できるWEBエンジニアのニーズが非常に高まっています。 こうした時代背景から、LINE株式会社が企画・運営するWebサービスのチューニングバトルイベント、ISUCON※(Iikanjini SpeedUp Con

    SRE 養成講座「BURST」体験講習会配信 #burst_sre
    youko03
    youko03 2022/06/22
  • SRE Classroom: The Art of SLOs - Google

    The Art of SLOsは、GoogleのCustomer Reliability Engineeringチームによって開発されたワークショップです。このワークショップの目的は、Googleがサービスの信頼性を計測する方法 サービスレベル指標(SLI) とサービスレベル目標 (SLO)を参加者に紹介し、実際にこれらの計測方法を作成することを体験してもらうことです。これらは重要で土台となる概念です。サービスの信頼性を客観的に測定する方法があれば、サービスの信頼性について有意義な会話をすることがはるかに簡単になります。 ワークショップの理論編では、開発チームと運用チームの間でしばしば生じる組織的な緊張を、サービスの望ましい信頼性を表す目標値を設定することで解決する方法を学びます。また、SLOとエラーバジェットを使って、データ駆動で、客観的、かつユーザー重視の方法でサービスの信頼性を測定・

  • SRE の基本(2021 年版): SLI、SLA、SLO の比較 | Google Cloud 公式ブログ

    ※この投稿は米国時間 2021 年 5 月 8 日に、Google Cloud blog に投稿されたものの抄訳です。 アプリケーションの可用性を確保するために重要なのは、サービスレベルの指標を確立してモニタリングすることです。これは、サイト信頼性エンジニアリング(SRE)チームが Google Cloud で毎日実施している内容です。SRE 原則の最終目標はサービスを改善し、さらにユーザー エクスペリエンスを向上させることです。 SRE の概念は、指標がビジネスの目標と密接に結び付いたものであるべきだという考えから始まりました。ビジネスレベルの SLA に加えて、SRE の計画と実践に SLO や SLI も使用します。 サイト信頼性エンジニアリングの用語を定義するこうしたツールは、単なる便利な抽象概念ではありません。これらのツールがなければ、システムの信頼性、可用性、有用性は評価できま

    SRE の基本(2021 年版): SLI、SLA、SLO の比較 | Google Cloud 公式ブログ
  • 1