Intro 어느덧 시간이 흘러서 2023년의 3분기가 지나갔습니다. 항상 있었던 일을 기록하고 회고를 해야겠다고 생각만 했었지, 블로그에 글로 남기는 일은 정말 오랜만인 것 같습니다. 링크드인으로 연결 된 안수빈님 블로그의 3분기 회고글을 받고 영감을 얻어 저 또한 굵직한 일들이 많았던 23년 3분기를 회고하고 정리해야겠다는 생각에 이렇게 글을 써...
🏢 첫번째 퇴사, 첫번째 이직
Intro 언제 어디서나 매번 느끼는 것이지만 시간은 정말 빠른 것 같습니다. 벌써 제가 첫번째 회사를 퇴사한지 1달이 지났습니다. 저는 카카오엔터프라이즈라는 회사에 2020년 6월 인턴으로 입사하였으며, 10월부터 정규직으로 근무하였습니다. 음성 시스템 파트, ML 플랫폼 파트, 검색 클라우드 시스템 파트 등의 여러 팀에서 근무를 하였으며 202...
[SRE] Ch18. Software Engineering in SRE
결론 : SRE 는 단순 Operation 을 하는 포지션이 아니라 Software Engineering 에 많은 부분 기여를 하고 있으며, 이러한 역량과 작업은 매우 중요하다. 구글에서는 어떤식으로 SRE 의 Software Engineering 이 이루어지고 있는지 엿볼 수 있는 장 SRE 조직의 소프트웨어 엔지니어링 역량이 중요한 이유 ...
[SRE] Ch17. Testing for Reliability
결론 : 테스트는 엔지니어들이 자신의 제품의 신뢰성을 향상시킬 수 있는 가장 적절한 투자 수단이다. 테스트의 종류는 굉장히 여러가지가 있는데, 신뢰성을 올리기 위해서 대략적으로 테스트의 종류와 중요도에 대해서 설명하고 있다. 테스트는 어떤 변경 사항이 일어났을 때 특정 부분에서 동일한 결과를 기대할 수 있다는 것을 보여주기 위한 메커니즘이다...
[SRE] Ch17. Testing for Reliability
결론 : 테스트는 엔지니어들이 자신의 제품의 신뢰성을 향상시킬 수 있는 가장 적절한 투자 수단이다. 테스트의 종류는 굉장히 여러가지가 있는데, 신뢰성을 올리기 위해서 대략적으로 테스트의 종류와 중요도에 대해서 설명하고 있다. 테스트는 어떤 변경 사항이 일어났을 때 특정 부분에서 동일한 결과를 기대할 수 있다는 것을 보여주기 위한 메커니즘이다...
[SRE] Ch12. Effective TroubleShooting
[SRE] 12. Effective Troubleshooting 굉장히 흥미로웠던 장 중 하나였음. 구글에서는 실제로 Production 환경에서 어떤 식으로 트러블 슈팅을 하는지에 대해서 알 수 있었고, 추후 운영 업무에서 도움이 될 수 있는 부분이 많았음. 처음에 나오듯이 Trouble shooting 이라는 것은 필수적인 기술이지만, 설명...
[SRE] Ch11. Being On-Call
플랫폼을 운영하면서 완전 Hardware 이슈를 제외하고 전반적인 운영업무를 진행했었다. 온콜을 정해서 운영하진 않았지만, 암묵적인 온콜이었다. 조금의 경험을 하고 구글의 SRE 가 어떤식으로 On-Call 에 대응하는지를 읽으니 아주 재미있었다. 이 책을 읽으면서 배워야 하는 부분은, 구글은 이렇게 하는구나 정도로 시야를 넓힐 수 있는 부분에 집...
[SRE] Ch10. Practical Alerting from Time-Series Data
[SRE] Ch10. Practical Alerting from Time-Series Data 구글에서 발전시켜온 보그몬 이라는 모니터링 시스템을 소개하는 챕터. 시계열 데이터를 기반으로 시스템을 모니터링하는 방법과 어떤식으로 발전되어 왔는지에 대한 이야기가 나와있다. 시계열 데이터를 통한 모니터링이 무엇인지 잘 파악하지 못했었는데, 프로메테우스...
[SRE] Ch09. Simplicity
Keep It Simple Stupid 역시 심플한게 근본이고 최고이다. 뭐든지 심플하게 생각하고 심플하게 만들어야 한다. 소프트웨어에서는 이런 철학이 더 더 강조되어야 하고 더욱 중요하게 생각해야한다고 느낄 수 있었던 장이었다. SRE의 임무를 한 문장으로 표현하면, 시스템의 신속함과 안정성 사이의 균형을 유지하는 것 이다. 시스템의 ...
[SRE] Ch08. Release Engineering
릴리즈 엔지니어링이라는 용어와 포지션이 있다는 것이 신기했다. 내가 아주 큰 규모의 프로젝트를 해보지 못해서 그런지는 모르겠지만, 일반적으로 SWE(Software Engineer) 가 SRE 업무는 물론 릴리즈 엔지니어링 까지 함께 해왔던 것 같다. 사실 SRE 업무는 DevOps에 가깝기 때문에 조금 거리가 있겠지만, 릴리즈 정도는 SWE가 했...