1. Preemptive VM Instanceが買えない場合がある
2. Default Node PoolにInstanceが想定より多く居座る問題と、Pod作成時の注意点
- あるノードが突然killされても大丈夫なようにpod内のアプリケーションを作成する
- あるノードが突然killされても大丈夫なようにpodを配置する(SPOFを無くす)
- どの順番でpodが起動しても問題ないように設定をする
- 突然Nodeがkillされても負荷等に問題が無いようにある程度余裕を持ってリソースを割り当てる
3. resource requests と resource limits の設定
- 設定ファイルの合計要求リソースがノードの合計リソースを下回っていてもデプロイできない場合がある
- 実際は1core 1000mcpuが割り当てられるわけではない
- Pod AutoScalerの設定
4. 不良のnodeを引き当ててしまう
5. 常にproduction環境を再構築できるようにしておく