VCS installation script 不認識 e1000g 網路卡

Discovering NICs on node1 .................................discovered e1000g0 e1000g1 e1000g2 e1000g3 e1000g4 e1000g5

Enter the NIC for the first private heartbeat link on node1: [b,?] e1000g1
e1000g1 is not a valid NIC name
Enter the NIC for the first private heartbeat link on node1: [b,?] e1000g1
e1000g1 is not a valid NIC name

好吧,只好安裝完在自己手動設定 heartbeat 了
修改 /etc/llttab 自己手動加上
link e1000g1 /dev/e1000g:1 - ether - -

2008.04.15 補
Veritas Cluster Server 5.0+e805061 fix for the e1000g NICs on Solaris

VCS with Solaris 8 Zone

畢竟 Solaris 8 zone in Solaris 10 (S8MA) 這玩意兒出來的 VCS Zone support 晚,所以目前 VCS 文件中寫到的 zone,並沒有特別說明是哪種 zone。
現在看來,當然指的都是 Solaris 10 native zone

由文件中看來,zone agent 對 local zone 的動作很單純,online 就是 zoneadm boot,offline 就是 zoneadm halt,對 Solaris 8 Zone 的 online/offline 應該沒什麼問題,但是其他要進去 local zone monitor 的 agent 呢?

在安裝 VCS 或建立 Solaris 10 native zone 時
有部份 VRTS 檔案是會自動從 global zone 複製到 native zone 的
就像 pkgadd or patchadd 時,若不加 -G 參數(Global only)
預設是會 apply 到所有的 running native zone
這兒我看來最重要的是那些 VCS agent 了
因為 global/local zone 都是 solaris 10 沒問題
但在 Solaris 8 zone 就有問題了...

check engin_A.log :
2008/01/13 18:56:16 VCS INFO V-16-2-13001 (node-2) Resource(ora8): Output of the completed operation (online) sh: /opt/VRTSvcs/bin/Oracle/online: not found
2008/01/13 19:33:35 VCS INFO V-16-2-13001 (node-2) Resource(ora8): Output of the completed operation (offline) sh: /opt/VRTSvcs/bin/Oracle/offline: not found

為什麼 not found ?原來是去用 local zone 中的 agent 了
因為不是 native zone,所以安裝時(pkgadd)不會複製這些檔案
導致 agent 無法正確的 monitor zone 中的 AP
我的偷吃步就是看有哪些 VRTS 檔案會被安裝到 native zone 中
就照樣複製這些檔案到 Solaris 8 zone 中

VCS WARNING V-16-1-52529 Login Incorrect, Invalid username/password
Agnet 在 global/local zone 中怎麼溝通?這兒需要設定一個 cluster user 讓他有 Group Administor 權限就ok了

在 native zone 中沒有這些問題,安裝時都會自動設好
但在 p2v zone 中,我們只好手動來把這些設定做完了

ok! It works !!

我習慣用 TeraTerm,只有在要用 ssh 時才會去開 putty
最近才知道 TeraTerm 終於有 ssh version 2 的版本了~ Happy!
UTF-8 TeraTerm Pro with TTSSH2
設定 ssh tunnel 等等我覺得還算蠻方便的

因為有些東西沒有 GUI 設定起來還真麻煩,只好想法子讓這些工具可以透過 ssh 穿過公司防火牆,來連接內部網路的主機了

公司內部網路 192.168.x.x,防火牆僅讓一台主機的 ssh port 可通過,於是乎只能拿這台當作橋樑了
用 ssh 連上這台主機後,設定 ttssh 的 SSH Forwarding:
Local port 11123 to Remote 192.168.x.111 port 23
Local port 11380 to Remote 192.168.x.113 port 80
Local port 14141 to Remote 192.168.x.115 port 14141
Local port 2148 to Remote 192.168.x.115 port 2148
按下 ok 後馬上生效

可以 telnet localhost 11123,就是連上 192.168.x.111
可以 http://localhost:11380,就是連上http://192.168.x.113
打開 VCS Java Console 連 localhost,就是連上 192.168.x.115 的 VCS GUI
打開 VxVM VEA 連 localhost,就是連上192.168.x.115 的 VxVM GUI 啦

2010.4.11 補充
1.設定 ttssh Port Forwarding
ssh: Local port 12322 to Remote 192.168.x.123 port 22
2. ssh localhost:12322 以 ssh 登入 192.168.x.123
3. echo $DISPLAY 確認是否為 localhost:10.0
4. 打開 xmanager 或 xwin32 等 X Server 軟體
5. 執行 xterm 看是否有開啟 X 視窗

[轉載] Two-node Cluster How-To Guide

健忘做個筆記,Sun Cluster 3.2 還沒裝過... :(

VxVM DMP Tunning

All DMP 5.0 tuning can be done online as long as all tuning is performed using the vxdmpadm set-tune command. The set of tunables that can be configured online in DMP 5.0 MP1 are:

# vxdmpadm gettune all
Tunable Current Value Default Value
------------------------------ -------------
dmp_failed_io_threshold 57600 57600
dmp_retry_count 5 5
dmp_pathswitch_blks_shift 11 11
dmp_queue_depth 32 32
dmp_cache_open on on
dmp_daemon_count 10 10
dmp_scsi_timeout 30 30
dmp_delayq_interval 15 15
dmp_path_age 300 300
dmp_stat_interval 1 1
dmp_health_time 60 60
dmp_probe_idle_lun on on
dmp_log_level 1 1
dmp_retry_timeout 0 0
dmp_fast_recovery on on

Sun Cluster with Solaris 8 Migration Assistant

文中提到 Sun Cluster 3.1 的 Patch 120590-06 已加強對 zone 的支援,可監控 Solaris 8 zone 了,但 Sun Cluster 3.2 尚未支援,不過應該也快了
文中提到 Sun Cluster 3.1 的 Patch 120590-06 已加強對 zone 的支援,可監控 Solaris 8 zone 了,但 Sun Cluster 3.2 尚未支援,不過應該也快了
Patch Id: 120590-06
Keywords: sunwsczone
Summary: Sun Cluster 3.1/3.1_x86: HA for Solaris Containers
Date:  Oct/19/2007

Problem Description:
6604747 HA Container agent should support solaris8 zones on sparc
(from 120590-05)
6488338 HA Container agent should support BrandZ lx zones with Solaris 10 Update 4
6554262 validate() for sczbt should check ip-type=exclusive and then only allow SC_NETWORK=false

VCS 呢?下回分解

Solaris 10 x86 設定 Serial Console

sparc 機器還算熟,今天搞了台 x4100/x4200 x86 主機
小問題找了快半天去掉.... :(

sparc 主機要使用 serial port 在 obp 中設定 input-device/output-device ttya 即可
要使用螢幕鍵盤則設定 input-device=keyboard output-device=screen 即可
可在 ok mode 下 printenv/setenv 查看/設定 這些參數
或 OS 中執行 eeprom 來讀取或設定這些參數

x86 沒 obp 這玩意兒怎麼設定呢?
看起來是用 /boot/solaris/bootenv.rc 來假裝一下...
在 OS 中直接下 eeprom 'console=ttya' 或 eeprom 'console=text'
或直接去編輯 bootenv.rc 這個檔案
修改 setprop console 'ttya' 或 setprop console 'text'
這兩個改法都是一樣的效果,可以察看執行 eeprom 的輸出來確認
然後 init 6 重新開機

若設定 console ttya 則開機後,開始 load OS 時,螢幕就黑掉了
因為畫面都 redirect 到 serial port 去了
要再 telnet login 或由 serial port 登入 OS,設定 console=text 後,重開機