Thay mirror disk của rootvg
Giả sử server có 2 disk vật lý là hdisk0 và hdisk1, trong đó OS (rootvg) chạy trên hdisk0, bản mirror của OS trên hdisk1.
Như vậy disk bị failed ở đây là hdisk1. Đây là trường hợp đơn giản nhất liên quan tới rootvg, vì OS đang chạy trên hdisk0 và hệ thống vẫn an toàn. Các bước thực hiện như sau:
1./ Xác nhận lại tình trạng của mirror hdisk1:
#lspv hdisk1
#lsvg -p rootvg
--> Output của 2 lệnh này sẽ thấy "PV STATE" không ở active, nó có thể có giá trị là missing hoặc failed.
2./ Xử lý dump device:
Mục đích của việc này nhằm xác nhận dump devices đang nằm trên hdisk1 hay ko. Check dump devcies bằng lệnh:
#sysdumpdev -l
Trong output của lệnh này cần chú ý tới "primary", thường (và mặc định) nó có giá trị là /dev/lg_dumplv. Cần phải kiềm tra xem /dev/lg_dumplv có đang nằm ở hdisk1 hay không bằng lệnh:
#lslv -p lg_dumplv
Nếu Output có hdisk1 thì chứng tỏ lg_dumplv hiện đăng được lưu ở hdisk1, cần phải chuyển nó sang hdisk0 trước khi thực hiện thay disk mới cho hdisk1 (Nếu không thì bỏ qua bước này).
Disable dump devices file bằng lệnh:
#sysdumpdev -Pp /dev/sysdumpnull
Migrate LP lg_dumplv từ hdisk1 sang hdisk0 bằng lệnh:
#migratepv -lv lg_dumplv hdisk1 hdisk0
Thường bước migrate này sẽ thành công, nếu không thể thì xóa lg_dumplv đi và tạo mới trên hdisk0:
#rmlv -f lg_dumplv
#mklv -lv lg_dumplv -type sysdump -size 1 rootvg hdisk0
Sau đó, enable lại dump device file bằng lệnh:
#sysdumpdev -Pp /dev/lg_dumplv
3./Unmirror hdisk1 ra khỏi rootvg:
#unmirrorvg rootvg hdisk1
#savebase -v (--> Lệnh này để lưu ODM)
Kiểm tra sau khi unmirrorvg:
#lspv -l hdisk1
Phải đảm bảo không còn LV nào trên hdisk1, nếu còn, phải thực hiện migratepv sang hdisk0:
#migratepv -l <LV_name> hdisk1 hdisk0
4./ Remove hdisk1 khỏi Volume Group và cấu hình hệ thống:
#reducevg rootvg hdisk1 (-->Có thể phải cần đến -d option)
#rmdev -dl hdisk1 (--> đối khi cần thêm option -Rdl nếu cần recursive)
5./ Thay disk vật lý mới:
#diag --> Task Selection --> Hot Plug Task --> SCSI Hot Plug Manager --> Replace/Remove a Device --> Thay disk
Sau khi thay xong, cần phải scan lại để server nhận disk mới, thường thì nó vẫn nhận là hdisk1 và check lại disk:
#cfgmgr hoặc #cfgmgr -v
#lspv hoặc #lsdev -Cc disk
Ngoài ra, còn có thể kiểm tra thêm thuộc tính của disk mới xem có tương đồng với hdisk0 hiện tại hay không:
#lsattr -El hdisk1
6./ Extend rootvg và thực hiện mirror lại cho hdisk1
#extendvg rootvg hdisk1 (-->có thể sẽ cần -f option nếu cần force)
#mirrorvg rootvg hdisk1 (-->có thể sẽ cần -m option)
Quá trình mirror có thể mất vài phút tới vài giờ (phụ thuộc vào dung lượng của disk). Kiểm tra bằng lệnh:
#lsvg -p rootvg (-->hdisk1 có state ở Acitve)
#lsvg -l rootvg (-->Kết thúc khi STALE PVs: 0)
7./ Cấu hình boot cho rootvg:
Cấu hình boot image trên cả 2 disk bằng lệnh:
#bosboot -ad /dev/hdisk0
#bosboot -ad /dev/hdisk1
Cấu hình thứ tự boot OS bằng lệnh:
#bootlist -m normal hdisk0 hdisk1
Kiểm tra lại bootlist bằng lệnh:
#bootlist -o -m normal
Output phải đảm bảo LV hd5 phải xuất hiện ở cả hdisk0 và hdisk1.
Tới đây là kết thúc quá trình thay disk, còn bước chuyển dump devices từ hdisk0 sang hdisk1 như ở mục số 2 là optional.
✅ Tìm process đang chiếm dụng nhiều tài nguyên như RAM, CPU
✅ Vòng lặp for trong command daily
✅ Tìm interface bị down trong etherchannel
✅ Xóa bỏ hoàn toàn cấu hình của interface network
✅ Tản mạn đôi chút về PVID của disk
✅ NVMe và SAS Disk, cách chuyển pdisk sang hdisk với chuẩn SAS
✅ Bỏ qua bước yêu cầu đổi mật khẩu của user khi login
✅ Thay đổi MTU cho interface từ 1500 lên 9000

