Project

General

Profile

Actions

Feature #572

closed

Heart beat separated from the watchdog

Added by Gomez Casanova Andres almost 14 years ago. Updated about 13 years ago.

Status:
Resolved
Priority:
Low
Assigned To:
Gomez Casanova Andres
Category:
Server side
Target version:
Start date:
05/06/2010
Due date:
% Done:

100%

Estimated time:

Description

Le heartbeat doit être dans TReqS, dans un autre thread qui va prendre le PID du lui même et le stocké dans la base de données.
De cette façon, les redémarrages manuels vont être enregistrés et ils vont être d'accord le watchdog.
Si TReqS est dans un boucle infini, on pourra savoir cette comportement, et éventuellement, le watchdog tuera TReqS et le redémarrera.

Le watchdog changera de fonctionnement, il ne va pas regardé le pid à partir de ps -ef, il va faire un select dans la base de données, on va dire, chaque 3 minutes et si le dernier heartbeat est très vieux, il va tuer TReqS s'il tourne, et il va le redémarrer.
De cette façon, Watchdog va regarder si TReqS ne tourne pas, ou si TReqS est locké.

Actions #1

Updated by Gomez Casanova Andres almost 14 years ago

initd, fonction start, il va écrire le fichier /var/lock/subsys/treqs.id en faisant un touch.
Après, il va démarrer TReqS
et après il va écrire el fichier /var/run/treqs.pid

Pour la partie stop, il va faire un killproc pour faire sortir treqs.
et après il va supprimer le fichier treqs.id

Le restart sera un appelle à stop et start.

Le status va regarder le pid du

Côté watchdog, la première chose est regarder si le fichier lock existe.
S'il existe, il va faire un init.d status pour connaître l'état de TReqS
En plus, il peux faire un query dans la base de données pour connaître le heart beat. Si le heartbeat est vieux, il va exécuter un restart.

Actions #2

Updated by Gomez Casanova Andres about 13 years ago

  • Category set to Server side
  • Assigned To set to Brinette Pierre-Emmanuel
  • Target version set to 1.5
  • % Done changed from 0 to 40

In the java version, the Watchdog writer is integrated in the main thread. This means that the application will write in the database the last heartbeat.
The script that checks the heartbeats does not exists (the current one has to be modified) and the start script has to be created.

Actions #3

Updated by Gomez Casanova Andres about 13 years ago

  • Assigned To changed from Brinette Pierre-Emmanuel to Gomez Casanova Andres
Actions #4

Updated by Gomez Casanova Andres about 13 years ago

  • % Done changed from 40 to 100
Actions #5

Updated by Gomez Casanova Andres about 13 years ago

  • Status changed from New to Resolved
Actions

Also available in: Atom PDF