bconsoleに接続できない

almalinux9にbaculaの設定を行っている時
# bconsole
Connecting to Director localhost:9101
bconsole: message.c:1833-0 bsockcore.c:265 Unable to connect to Director daemon on localhost:9101. ERR=接続を拒否されました
でbacula-dirをリスタートしステイタスをチェック
# systemctl restart bacula-dir
# systemctl status bacula-dir
でactiveを確認。それではfirewall切ってみる
# systemctl stop firewalld
再度、bconsole。でも結果は同じ????

結論はmariadbの設定が間違っていた。
# systemctl status bacula-dir
でactiveだったが、それはrestart後すぐにチェックしたから。しばらくするとディレクターがmysqlに接続出来ないのでストップするが、チェックのタイミングが早すぎたので、少し遅れてstopしていたのに気が付かなかった。こんなこともあるんだ!!

カテゴリー: Baclua(バックアップ)に挑戦 | コメントする

nmcli 使い方

いつも忘れるので個人の防備録用、(でも設定ファイルの方がやりやすいのになー。特にKVMでクローンしたサブホストは固定のIPアドレスやホスト名がダブっているので、ログインしないと変更出来ない。設定ファイルならlosetupやkaprtxを使い簡単に変更出来るのに)
ブリッジの追加
# nmcli con add type bridge ifname br0
# nmcli con mod bridge-br0 bridge.stp no
固定IPにし、アドレス設定
# nmcli con mod bridge-br0 ipv4.method manual ipv4.address 192.168.xx.xx/24
ipv4.gateway 192.168.xx.xx
ipv4.dns 168.168.xx.xx +ipv4.dns 8.8.8.8
インターフェイスを割り当てる。インターフェースはenp2s0、ブリッジはbridge-br0の時
# nmcli con add type ethernet ifname enp2s0 master bridge-br0
で、rebootし設定の反映。
インターフェースの固定IPなどを変更した場合等はリブートせず、
# nmcli con down デバイス名(enp2s0など)
# nmcli con up デバイス名
で反映させられる

カテゴリー: Linux運用時のメモ | コメントする

ダブっている写真を消去する(linux)

ある時ファイルサーバーのファイルを見ると大量の複製している画像や動画があった。
これを消去しようとスクリプトを組もうとして調べるともっと簡単に出来ることが判った。
ダブっている画像や動画は*(1).JPG や*(1).MOVなので cd でそのdirectory にいって
# find -iname *(1).JPG
# find -iname *(1).MOV
で綺麗にダブっている分が消去された。因みに -iname はファイル名の指定で大文字と小文字をチェックしない指定

カテゴリー: Linux運用時のメモ | コメントする

1:pacemakerのインストール

物理的に違うkvmのサブホストを使用
ホスト名:smb3, IP: 192.168.4.63
ホスト名:smb4, IP: 192.168.4.64
仮想IP: 192.168.4.65
まずは https://www.server-world.info/query?os=CentOS_Stream_9&p=pacemaker&f=1を参考に進めていく。
# dnf –enablerepo=highavailability -y install pacemaker pcs
とインストールが終わった所で、何も設定せず対抗するサブホストにここを参考にしてサブホストにコピーする。さもないとhttps://www.kinryo.net/?p=3602のようにトラブル。
ホスト名で設定していくので
# gedit /etc/host
の最後に
192.168.4.63  smb3 smb3.inpac.jp
192.168.4.64  smb4 smb4.inpac.jp
を追記し保存。これを両ホストに設定
次に設定がダブっているので(IPやhostname)、https://www.kinryo.net/?p=2529を参考に変更してください。ただしUUIDの変更は出来なかったので、変更していない。/grub2/grub.cfgにあるUUIDを全部変更してもオリジナルのUUIDが見つからないと言われブート出来なかった!!そして再起動しておく
pcsdを起動して、パスワードの設定をする
# systemctl enable –now pcsd
# passwd hacluster
これを両方のサブホストで行う。

ここからはオリジナルのサブホストのsmb3での作業
# pcs host auth smb3 smb4
Username: hacluster
Password:
smb4: Authorized
smb3: Authorized

ユーザーを聞かれるので hacluster パスワードは設定した物。
# pcs cluster setup mycluster –force smb3 smb4
結果の表示は長いので省略(最後にCluster has been successfully set up.が表示される筈)。次にクラスターをスタートし
# pcs cluster start –all
smb3: Starting Cluster…
smb4: Starting Cluster…
起動後にスタートさせる
# pcs cluster enable –all
smb3: Cluster Enabled
smb4: Cluster Enabled
#
pcs status
Cluster name: mycluster

WARNINGS:
No stonith devices and stonith-enabled is not false

Status of pacemakerd: ‘Pacemaker is running’ (last updated 2023-10-23 19:53:50 +09:00)
Cluster Summary:
 * Stack: corosync
 * Current DC: smb4 (version 2.1.5-9.el9_2.3.alma.1-a3f44794f94) – partition with quorum
 * Last updated: Mon Oct 23 19:53:50 2023
 * Last change: Mon Oct 23 19:38:00 2023 by hacluster via crmd on smb4
 * 2 nodes configured
 * 0 resource instances configured

Node List:
 * Online: [ smb3 smb4 ]

Full List of Resources:
 * No resources

Daemon Status:
 corosync: active/enabled
 pacemaker: active/enabled
 pcsd: active/enabled
WARNINGが出ているので、https://www.kinryo.net/?p=3610を参考にして解除。corosync もチェックしておく。
# pcs status corosync
Membership information
———————-
  Nodeid  Votes Name
  1     1 smb3 (local)
  2     1 smb4

 


 

カテゴリー: DRBDに挑戦(almalinux9) | コメントする

pcs cluster start –all で片方のホストしか起動しない

drbdを使ってsambaのファイルサーバーの可用性を高め様とした時クラスターの設定が終わっているホストをコピーし設定を進めるとどうしても
# pcs cluster start –all
smb4: Starting Cluster…
smb3: Unable to connect to smb3, check if pcsd is running ……..
でも pcsd は起動している。この原因は結局分からなかった。なので再度サブホストのコピーからやり直し。
追記:後日ログを見ていたら/var/log/pacemaker/pacemaker.logに
pacemaker-schedulerd[5382] (pcmk__log_transition_summary) notice: Configuration errors found during scheduler processing, please run “crm_verify -L” to identify issues
があった。これが原因だと思われるが?さらに/var/log/messageに
pacemaker-controld[5383]: notice: State transition S_IDLE -> S_POLICY_ENGINE
pacemaker-schedulerd[5382]: error: Resource start-up disabled since no STONITH resources have been defined
pacemaker-schedulerd[5382]: error: Either configure some or disable STONITH with the stonith-enabled option
pacemaker-schedulerd[5382]: error: NOTE: Clusters with shared data need STONITH to ensure data integrity
pacemaker-schedulerd[5382]: notice: No fencing will be done until there are resources to manage
pacemaker-schedulerd[5382]: notice: Calculated transition 1, saving inputs in /var/lib/pacemaker/pengine/pe-input-97.bz2
pacemaker-schedulerd[5382]: notice: Configuration errors found during scheduler processing, please run “crm_verify -L” to identify issues
pacemaker-controld[5383]: notice: Transition 1 (Complete=0, Pending=0, Fired=0, Skipped=0, Incomplete=0, Source=/var/lib/pacemaker/pengine/pe-input-97.bz2): Complete
pacemaker-controld[5383]: notice: State transition S_TRANSITION_ENGINE -> S_IDLE
pacemakerd[5377]: notice: Caught ‘Terminated’ signal
があった。恥ずかしながらpacemaker.logがあるのに気がつかなっかった。

但し、オリジナルのホストのpcsの設定を削除しておく。
# pcs cluster –force stop
# pcs cluster destroy
詰まりせっかく設定した分を全消去しておく。またpcsdとDRBD起動関係を止めておく
# systemctl stop pcsd
# systemctl disable pcsd
# systemctl stop pcsd
# systemctl disable pcsd
ただし、/etc/hostの設定やは残っている、またpcsとpacemakerはインストールされているよ。

そしてやっと、ここを参考にしてサブホストにコピーする。
その際、vda1のUUID, 固定のIPアドレス、hostnameがダブっているので、https://www.kinryo.net/?p=2529を参考に変更してください。ただしUUIDの変更は出来なかったので、変更していない。次に念の為コピーしたサブホスト側でも(オリジナルのホストで消去しているのでやらなくてもいいと思うが)。ただしこの方法は/etc/fstabの設定が両ホストで同じでなければならない。違う時はvdaになる物意外外して置く事。
# pcs cluster –force stop
# pcs cluster destroy
でクラスターを削除しておく。
pcsdを起動して、パスワードの設定をする
# systemctl enable –now pcsd
# passwd hacluster
これを両方のサブホストで行う。

ここからはオリジナルのサブホストのsmb3での作業
# pcs host auth smb3 smb4
ユーザーを聞かれるので hacluster パスワードは設定した物。
# pcs cluster setup mycluster smb3 smb4
No addresses specified for host ‘smb3’, using ‘smb3’
No addresses specified for host ‘smb4’, using ‘smb4’
Destroying cluster on hosts: ‘smb3’, ‘smb4’…
smb3: Successfully destroyed cluster
smb4: Successfully destroyed cluster
Requesting remove ‘pcsd settings’ from ‘smb3’, ‘smb4’
smb3: successful removal of the file ‘pcsd settings’
smb4: successful removal of the file ‘pcsd settings’
Sending ‘corosync authkey’, ‘pacemaker authkey’ to ‘smb3’, ‘smb4’
smb3: successful distribution of the file ‘corosync authkey’
smb3: successful distribution of the file ‘pacemaker authkey’
smb4: successful distribution of the file ‘corosync authkey’
smb4: successful distribution of the file ‘pacemaker authkey’
Sending ‘corosync.conf’ to ‘smb3’, ‘smb4’
smb3: successful distribution of the file ‘corosync.conf’
smb4: successful distribution of the file ‘corosync.conf’
Cluster has been successfully set up.
# pcs cluster start –all
smb3: Starting Cluster…
smb4: Starting Cluster…
おー!!、両方のホストでクラスターがスタートした。
# pcs cluster enable –all
smb3: Cluster Enabled
smb4: Cluster Enabled
# pcs status
Cluster name: mycluster

WARNINGS:
No stonith devices and stonith-enabled is not false

Status of pacemakerd: ‘Pacemaker is running’ (last updated 2023-10-23 19:53:50 +09:00)
Cluster Summary:
 * Stack: corosync
 * Current DC: smb4 (version 2.1.5-9.el9_2.3.alma.1-a3f44794f94) – partition with quorum
 * Last updated: Mon Oct 23 19:53:50 2023
 * Last change: Mon Oct 23 19:38:00 2023 by hacluster via crmd on smb4
 * 2 nodes configured
 * 0 resource instances configured

Node List:
 * Online: [ smb3 smb4 ]

Full List of Resources:
 * No resources

Daemon Status:
 corosync: active/enabled
 pacemaker: active/enabled
 pcsd: active/enabled
WARNINGが出ているので、https://www.kinryo.net/?p=3610を参考にして解除

カテゴリー: DRBDに挑戦(almalinux9) | コメントする

rsyncのexclud-fromでの指定の色々

rsyncでexclude-fromファイルの中でexcludeしたいファイルの指定方法であまり正規化表現が指定できないので色々迷っていたが、https://futuremix.org/2011/02/rsyncが参考になった。ポイントは

-C(または–cvs-exclude) オプションを使うと CVS などバージョン管理システムの生成するファイルなどを自動的に除外してくれます。
これは CVS だけではなく、Subversion や .bak .exe などの拡張子を持つファイルも除外されます。具体的には
*~ #* .#* ,* _$* *$ *.old *.bak *.BAK *.orig *.rej .del-* *.a *.olb *.o
*.obj *.so *.exe *.Z *.elc *.ln core .svn/

正規表現はあまり使えませんが、[0-9] のような数値指定は可能です。
また * と ** も使用できます。** はディレクトリ区切りを超えてマッチします。この意味は **/.recycle/* とすると aaa/.recycle/* とも aaa/bbb/ccc/.recycle/* ともマッチするとのこと

なので私のexcludeファイルは(sambaのバックアップを取る時の指定)

/.Trash-0/
/lost+found/
/*/.recycle/
/**/cache/
/**/$RECYCLE.BIN/*

とした。

カテゴリー: Linux運用時のメモ | コメントする

CentOS 7 運用時の色んなメモ

apache 設定チェック : apachectl configtest
apache ロードされているmoduleを表示:httpd -M

postfix 設定チェック : postfix check
postfix 設定表示         : postconf   変更した部分のみの表示:postconf -n

dovecot設定表示        :doveconf -n
                                   問題無ければ、デフォルトと異なる設定だけが出力されます。
                                   設定項目名にミスがあれば、エラーが表示されます。
                                   但し、設定項目の内容のチェックまではされないようです。
                                  設定項目があっていれば、指定したファイルが存在しなくてもエラーにはなりません。

spamassasin 設定チェック : spamassassin –lint  (– は見にくいが: ハイフォンが二つ)

ddの進捗情報 :dd status=progress if=xxxx…… of=xxxx…..
ネットワーク越しのdd(ローカルからローカル):コピー元のホストで
dd status=progress if=/dev/Kvm/web4 | nc 192.168.xx.xx 12345
IPはコピーコピー先のIP、最後の数字はポートNoで両ホストで使用していないポートなら何でもいい。
コピー先のホストに移って
nc -l 12345 | dd of=/dev/Kvm/web5
ネットワーク越しのdd(リモートからローカル):ssh -p xxx username@ip or domain sudo dd status=progress  if=/dev/xxx…. |dd of=/dev/xxx….
defaultのポートなら -p xxxはいらない。dd を sudo でパスワードなしでやるには visudo で設定が必用(参照:https://qiita.com/RyodoTanaka/items/e9b15d579d17651650b7

rsync       : rsync -av –exclude-from=/root/exclude1 –password-file=/etc/rsync.passwd rsync://root@192.168.xx.xx/webdata /webdata
      dry-runは -n
      外からは:rsync -av -e ‘ssh -p xxx -i .ssh/id_rsa’ –exclude-from=/root/exclude1 –password-file=/etc/rsync.passwd rsync://root@グローバルIP/webdata /webdata

letsencrypt で cert file を更新したらDRBDのSECONDARYにも設定が必要
初めて行う時は /etc/rsyncd.conf に追記が必要
[letsencrypt]
path = /etc/letsencrypt
authusers = root
secrets file = /etc/rsyncd.secrets
read only =no
追記したらrsyncdを再起動して設定を有効にする。
# systemctl restart rsyncd
そしてコピー
# rsync -av –exclude-from=/root/exclude1 –password-file=/etc/rsyncd.passwd rsync://root@192.168.0.55/letsencrypt /test3
で /test3に出来た必要なファイルを /etc/letsencrypt にコピー
letsebcrypt でcertificatesで有効期限を表示
# certbot certificates
Saving debug log to /var/log/letsencrypt/letsencrypt.log
– – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –
Found the following certs:
Certificate Name: aarah.info-0001
Serial Number: 4dd777ec388a651d72423d6df2c9ae24460
Key Type: RSA
Domains: aarah.info inpac.jp inpactours.jp kinryo.net opengarden.info www.aarah.info www.inpac.jp www.inpactours.jp www.kinryo.net www.opengarden.info
Expiry Date: 2023-04-12 07:32:50+00:00 (VALID: 78 days)
Certificate Path: /etc/letsencrypt/live/aarah.info-0001/fullchain.pem
Private Key Path: /etc/letsencrypt/live/aarah.info-0001/privkey.pem
Certificate Name: kinryokai.net
Serial Number: 4040193692d1e64b9ec8639985a7943a43f
Key Type: RSA
Domains: kinryokai.net mail.kinryokai.net www.kinryokai.net
Expiry Date: 2023-04-12 07:33:20+00:00 (VALID: 78 days)
Certificate Path: /etc/letsencrypt/live/kinryokai.net/fullchain.pem
Private Key Path: /etc/letsencrypt/live/kinryokai.net/privkey.pem
Certificate Name: mail.kinryo.net
Serial Number: 32edf706664cd2ce65b156a10cbedd55168
Key Type: RSA
Domains: mail.kinryo.net
Expiry Date: 2023-03-21 08:17:31+00:00 (VALID: 56 days)
Certificate Path: /etc/letsencrypt/live/mail.kinryo.net/fullchain.pem
Private Key Path: /etc/letsencrypt/live/mail.kinryo.net/privkey.pem

vsftp 設定チェック :  vsftpd /etc/vsftpd/vsftpd.conf

ポート指定の疎通確認  :
LINUX:  nc -vz ドメイン(IP)ポート番号
Winows powershallから: test-netcpnnection IPアドレス -port ポート番号

ssh接続               :ssh -i 秘密鍵のパス リモートユーザー@リモートサーバーのホスト名

空ポートの確認 :ss -nat 又は-nau   # t=tcp, u=udp

virbr0の停止
    # virsh net-destroy default,   再起動後も止める:# virsh net-autostart default –disable
    Almalinux 8以上  # systemctl disable libvirtd 但し仮想化が動いていれば出来無いので上の行の様にして止める
 

mail.kinryokai.netだけのcertbot 更新  : certbot certonly –webroot -w /webdata/public/kinryokai -d  mail.kinryokai.net

bacula conf のチェック    https://www.kinryo.net/?p=2510

samba mount    mount.cifs //192.168.xx.xx/yyyy /zzz -o user=name

SSH経由でVNC(CentOS7)
  まずSSHで接続:# ssh -p ポート番号 ユーザ@IP かドメイン -L 12345(このポートは任意):IP かドメイン: サーバのVNCポート
  新しいターミナルを開け
  # vncviewer
  ウィンドウが開くので、localhost:12345

lvextend で領域を増やしたら(xfsの場合)
  sudo xfs_growfs マウントポイント(xfsはマウントしたまま出来る)で領域を増やす

ポートが空いているか調べる
  $ netstat -an |grep ポート番号
  このポートを閉じる時
  $ lsof -i:ポート番号     PIDの番号がいる
  $ kill PIDの番号

grep -A オプション
  直後の3行が表示され
  ABCD 検索した文字
  EFG
  HI
  JKL

php-fpm の再起動
       私はphp56とphp74をインストールしているので、
       # systemctl restart php56-php-fpm
       # systemctl restart php74-php-fpm

wordpressをブラウザからアップデート(FTP不使用)
  wp-config.php のdefine(‘WP_DEBUG’,false); の次に
  define(‘FS_METHOD’,’direct’); を追記

カテゴリー: Linux運用時のメモ | コメントする

NVMeをddでコピーしたらエラー

ルート領域に使っているNMVeを大きい容量のNMVeにddでコピーしたら下記のエラーが出た(注:ddでdisk毎コピーすると容量がオリジナルの容量になるが、以前はgpartedで容量を増やしていたが、今はpartedで、diskを見ると(p)容量がおかしいので、FIXするか聞いてくるので、fixと入れると本来のサイズにアップしてくれる)
# lvs -a -o +devices
WARNING: Couldn’t find device with uuid DMr0bx-8hT0-qAr0-Can8-IcVq-F4Zr-or5v0h.
WARNING: VG Data5 is missing PV DMr0bx-8hT0-qAr0-Can8-IcVq-F4Zr-or5v0h (last written to /dev/nvme0n1p6).
WARNING: Couldn’t find device with uuid ydBOpY-3v1F-l5KD-Hj73-C1Yw-LPoC-425E9H.
WARNING: VG SubHost5 is missing PV ydBOpY-3v1F-l5KD-Hj73-C1Yw-LPoC-425E9H (last written to [unknown]).
LV   VG   Attr LSize Pool Origin Data% Meta% Move Log Cpy%Sync Convert Devices
Backup Backup -wi——- 1.46t /dev/sdb6(0)
Download Data5 -wi——- 50.00g /dev/sda6(0)
以下省略
前にSSDで同じ事をしてもエラーにならなかったが、NVMeだからエラーになるの??
(注:/etc/lvm/lvm.confにある# use_devicesfile = 1はコメントを取り、use_devicesfile = 0でエラーが出ないようにしている)
なので、
# pvcreate –help  すると
前略
pvcreate PV …
  [ -f|–force ]
  [ -M|–metadatatype lvm2 ]
  [ -u|–uuid String ]
  [ -Z|–zero y|n ]
  [   –dataalignment Size[k|UNIT] ]
  [ –dataalignmentoffset Size[k|UNIT] ]
  [ –bootloaderareasize Size[m|UNIT] ]
  [ –labelsector Number ]
  [ –pvmetadatacopies 0|1|2 ]
  [ –metadatasize Size[m|UNIT] ]
  [ –metadataignore y|n ]
  [ –norestorefile ]
以下省略
pvcreate時にUUIDを指定できる見たいなので
# pvcreate -u ydBOpY-3v1F-l5KD-Hj73-C1Yw-LPoC-425E9H –norestorefile /dev/nvme0n1p6
Physical volume “/dev/nvme0n1p6” successfully created.
となったので
#
pvscan
PV /dev/sdb6 VG Backup lvm2 [<1.67 TiB / <207.73 GiB free]
PV /dev/sda6 VG Data5 lvm2 [<200.00 GiB / <10.00 GiB free]
以下省略
と無事エラーを消す事ができた。又、どう言う訳かlast written to [unknown]になっていたVG SubHost5も消えていた。
# lvscan
inactive ‘/dev/Backup/Backup’ [1.46 TiB] inherit
inactive ‘/dev/Data5/Mysql’ [5.00 GiB] inherit
以下省略
と全部inactiveになっていたので、
# vgchange -ay
をすると、LVが全部activeになった。
VG Data5 VG SubHost5 にあったファイルは要らないので問題ない
もし、必要なら、オリジナルのNVMeをUSBでアタッチし、ファイルをコピればいい

カテゴリー: Linux運用時のメモ | コメントする

またまた危険なメール

上の画像の①は差出人だが、今回は偽装されているので、amazon.co.jpから発信されて無い。②は本文の”ご注文の確認”にマウスを持って来ると表示される物だが、クリックするとここに飛ぶ。https://cxqxqxcg.shop/省略、cxqxqxcg.shopに飛ぶ、もちろんここはアマゾンじゃ無いので、絶対にクリックしてはいけない。
詳しくは触れないが、ヘッダーと呼ばれている部分を調べると、IPが183.253.225.254から117.18.0.204に送られ、そこから私に来ているが最初のIPは中国からで二番目は香港になっていた。

カテゴリー: 危険メールや手紙、IP | コメントする

複数のWEBサーバーの全てのリンクが突然切れた。

私はアパッチのバーチャルで複数のWEBを運営していますが、全てのWEBでどのメニューをクリックしても、URLは正しく表示されているが、表示されているページはホームぺージだ!!!
実はDRBDを使い2つのサーバーでプライマリーとセカンダリーを自動で切り替えている。そこで、セカンダリー側をプライマリーにしても同じ状態!!
原因は全く不明なのでがここで何が問題か考える。先ずはアパッチ, phpやデーターベースなどのサーバー側の問題。だけどこれは2台同時にいかれるのは考えにくい。そして各WEBのデーターはデフォルトからは変更をしていて、50GiBの領域を専用に割り当てている。これはDRBDが自動で同期するので、何かの問題でプライマリー側のデーターが問題になると、セカンダリーも同じデーターになる筈。なのでこれが原因と勘繰る。幸いbaculaで バックアップがあるので、仮にアタッチしたディスクにバックアップしている全てのWEBデーターをリストアする。そしてDRBDで動いているWEBサーバーで drbdadm down r0でdrbdをストップしておく。ここでリストアのデーターがある場所が/testと仮定し、WEBデータがある場所を/test2と仮定しコピーをする。
# cd /test
# cp -pr -f ./ /test2
アレー、上書きの確認が出る。このままでは何千回も確認が出るので止める。
これはエイリアスでalias cp=’cp -i’となっているからだ。なのでエイリアスを無効にする。これにはコマンドの前に\(バックスラッシュ)をつければいい。
# \cp -pr -f ./ /test2
やっとコピーが終わり、drbdを起動
# drbdadm up r0
Device ‘0’ is configured!
Command ‘drbdmeta 0 v08 /dev/vdc internal apply-al’ terminated with exit code 20
Device ‘1’ is configured!
Command ‘drbdmeta 1 v08 /dev/vdd internal apply-al’ terminated with exit code 20
とエラーが出る。
念の為、
# pcs status
Online: [ web3 ]      (抜粋)
OFFLINE: [ web4 ]

Full list of resources:

Resource Group: apachegroup
   vipcheck_res (ocf::myres:VIPcheck):       Started web3
   VirtualIP (ocf::heartbeat:IPaddr2):          Started web3
   FS_DRBD0 (ocf::heartbeat:Filesystem):   Started web3
   FS_DRBD1 (ocf::heartbeat:Filesystem):   Started web3
   HTTPD (ocf::heartbeat:apache):              Started web3
   MARIADB (systemd:mariadb):     Started web3
   POSTFIX (systemd:postfix):         Started web3
   dovecot (systemd:dovecot):         Started web3
Master/Slave Set: MS_DRBD0 [DRBD0]
   Masters: [ web3 ]
   Stopped: [ web4 ]

Failed Resource Actions:
* DRBD0_monitor_20000 on web3 ‘not running’ (7): call=40, status=complete, exitreason=”,
    last-rc-change=’Wed Sep 13 12:01:41 2023′, queued=0ms, exec=0ms
あれー、エラーは出ているもののdrbdも起動している。

このエラーはそのままにして、もう片方のサーバーを立ち上げて
# pcs status
とすると(抜粋)
Online: [ web3 web4 ]

Full list of resources:

Resource Group: apachegroup
   vipcheck_res (ocf::myres:VIPcheck):       Started web3
   VirtualIP (ocf::heartbeat:IPaddr2):          Started web3
   FS_DRBD0 (ocf::heartbeat:Filesystem):   Started web3
   FS_DRBD1 (ocf::heartbeat:Filesystem):   Started web3
   HTTPD (ocf::heartbeat:apache):              Started web3
   MARIADB (systemd:mariadb):         Started web3
   POSTFIX (systemd:postfix):             Started web3
   dovecot (systemd:dovecot):             Started web3
Master/Slave Set: MS_DRBD0 [DRBD0]
   Masters: [ web3 ]
   Slaves: [ web4 ]

Failed Resource Actions:
* DRBD0_monitor_20000 on web3 ‘not running’ (7): call=40, status=complete, exitreason=”,
     last-rc-change=’Wed Sep 13 12:01:41 2023′, queued=0ms, exec=0ms

Daemon Status:
    corosync: active/enabled
   pacemaker: active/enabled
   pcsd: active/enabled

エラーが出ているものの、初めに立ち上げたWEBが動いているようなので、WEBにアクセスすると無事元に戻っていた。
# cat /proc/drbd
0: cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r—–
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
1: cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r—–
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
disklessになっているので
# drbdadm attach r0
0: cs:Connected ro:Secondary/Primary ds:Negotiating/UpToDate C r—d-
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:12264
1: cs:Connected ro:Secondary/Primary ds:Negotiating/UpToDate C r—d-
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:120
何時迄もNegotiatingのままなので、drbdを再起動してみる
# systemctl restart drbd
# cat /proc/drbd
0: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown r—–
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:12264
1: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown r—–
ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:120
これでスプリットブレイン状態になったので、
# drbdadm — –discard-my-data connect r0

そして最初に起動したサーバーに戻って
出て行たエラーを消す
# pcs resource cleanup
そしてスプリットブレインを解消するため
# drbdadm connect r0
でもってcat /proc/drbdで見ると動機が始まった。

これでやっと正常になった。

カテゴリー: Linux運用時のメモ | コメントする