Suivi des actions

suivi mis en place depuis décembre 2014

Pour référence : listes des actions GDB et MB

Tickets GGUS par VO (NGI-France, open states)

Actions LCG-France en cours

Date et Contexte de création (#) Sujet Action sur Status Suivi
LCGFR-Tech 2017-07-21 (20170721-01)
Perfsonar : passer à la version 4.0.0
chaque site
nouveau
-
LCGFR-Tech 2017-06-16 (20170616-02)
Perfsonar : demander un dashboard avec les sites FR
C. Biscarat (voir avec F Chollet)
nouveau
-
LCGFR-Tech 2017-06-16 (20170616-01)
efficacite des jobs de CMS faible (S. Gadrat - infos d'il y a un an environ : du au partitionnement + code multi-thread neuf) - se renseigner
C. Biscarat
en cours
- Tech de juillet : présentation de A. Sartirana, travail en cours d'une Task Force de CMS
- à suivre : voir en temps utile les conclusions de la Task Force (A. Sartirana)
LCGFR-Tech 2017-05-12 (20170512-01)
Mesh IPV6 pas à jour - difficile de faire des tests
C. Biscarat
nouveau
-
LCGFR-Tech 2017-04-28 (20170428-03)
que le premier site qui installe Singularity partage son expérience
Site
en cours
- Tech mai 2017 : pas de nouvelles
- Tech de juin : S. Gadrat (CMS CC) a comme projet de regarder Singularity, projet en stand-by au CC du a la facon dont les jobs sont lancés (prologue) ; le CC voudrait faire du Singularity et CMS ferait du Singularity par dessus - c'est possible avec Singularity ; SG nous fera un point en juillet
LCGFR-Tech 2017-04-28 (20170428-02)
CPU time delivered au CC pour ALICE - pb de plateau dans Monalisa
R. Vernet
(/)
Tech de mai 2017 : résolu
LCGFR-Tech 2017-04-28 (20170428-01)
monitoring de DPM : AS propose que les sites partagent leurs sondes et outils sur un wiki commun
C. Biscarat
nouveau
-
LCGFR-Tech 2017-03-17 (20170317-05)
si ARGUS est à maintenir, s'assurer que les sites s'en servent ; documenter les 2 solutions CREAM-CE : native JMB et script QUATTOR Guillaume
C. Biscarat
nouveau
-
LCGFR-Tech 2017-03-17 (20170317-04)
KIT a decommisionné FAX - est-ce un service à maintenir ? demander à ATLAS
C. Biscarat & L. Poggioli
(/)
- update réunion de avril (Luc Poggioli) : ATLAS opère toujours ~10% des transferts avec FAX, à priori pas de message comme quoi on décommisionne FAX. LP va se renseigner.
- update Tech de mai 2016 (L Duflot pour L Poggioli) : pour ATLAS FAX doit toujours être maintenu ; des discussions sur l'utilité de FAX dont le monitoring est toujours en erreur.
LCGFR-Tech 2017-03-17 (20170317-03)
ALICE monitore son réseau (Denis envoie URL), trouver les même URL pour ATLAS, CMS et LHCb et montrer ca en Journées LCG-France
C. Biscarat (ATLAS, LHCb), P. Hennion (CMS)
nouveau
-
LCGFR-Tech 2017-03-17 (20170317-02)
ou passent les data entre un site LHCone et un site non LHCOne ?
C. Biscarat
(/)
par le réseau généraliste
LCGFR-Tech 2017-03-17 (20170317-01)
nouvelle configuration des CPU CC à documenter
C. Biscarat
(/)
configuration linkée sur l'agenda du CoDir du 1er avril https://indico.in2p3.fr/event/14089/contribution/1/material/1/0.txt
LCGFR-Tech 2017-02-17 (20170217-01)
est-ce que le service ARGUS est toujours nécesaire sur les sites ?
C. Biscarat
(/)
CB a demandé en réunion FG Opérations : oui le service ARGUS est utile et pérenne. Le maintenir sur les sites.
LCGFR-Tech 2016-12-16 (20161216-04)
Réponse des sites FR au sondage WLCG "lightweight site", au 16-dec-2016, réponses de CPPM, IPHC, Subatech, LPSC
C. Biscarat
en cours
Récupération des sondages pour voir si des points communs d'actions à mener (16-dec-2016 : CB a le sondage de LPSC et Subatech)
LCGFR-Tech 2016-12-16 (20161216-03)
Rapports d'accounting WLCG de novembre montre un déficit de CPU au LAPP (87%)
C. Biscarat
en cours
CB veut regarder ça de plus prèt
update : rapport de décembre, LAPP fournit 94% de ses pledges
LCGFR-Tech 2016-12-16 (20161216-01)
Passage à la couche DOME de DPM (version 1.9.0) ; DOME nécessite la redirection gridftp qui ne marche pas pour des clients antérieurs à gfal2 - certaines VO pourraient encore utiliser des clients obsolètes pre-gfal2.
Sites
(/)
CPPM est passé à DOME, nous a fait un retour dans le LCGFR-Tech du 17 mars 2017.
LCGFR-Tech 2016-11-18 (20161118-02)
Prochaines Journées LCG-France : session pratique "HTCondor" - voir avec les personnes impliquées (sondage pour l'intérêt des participants)
C. Biscarat
en cours
CB en contact avec G. Philippon et A. Sartirana
LCGFR-Tech 2016-09-16 (20160916-05)
Routage IPV6 : les labos prioritaires sont 1- LAL, 2-LAPP, 3-CPPM ; le LLR demande à être ajouté
C. Biscarat
en cours
update 21-sep-2016 : CB a contacté cc-telecom, le LLR est ajouté sur la liste en position 4
http://lcg.in2p3.fr/wiki/index.php?title=IPV6#D.C3.A9ploiement_en_France
update 16-dec-2016 : routage au LAL fait (pas encore de Perfsonar double stack - reconfiguration du router nécéessaire)
LCGFR-Tech 2016-09-16 (20160916-02)
Voir avec DELL si on peut avoir des disk spares gratuits avec les prochains achats
C. Biscarat
nouveau

LCGFR-Tech 2016-09-16 (20160916-01)
Discussion choix et conf. du stockage : produire un document de résumé + questions ouvertes & page wiki avec les bonnes pratiques
J.-M. Barbet & C. Biscarat
en cours
update 18-nov-2016 : document produit par JMB, dans les mains de CB
LCGFR-Tech 2016-07-22 (20160722-03)
IPV6 - nouveau router au LPNHE à installer ; objectif : septembre 2016
C. Biscarat/cc-telecom
en cours
update 13-dec-2016 : routeur au LPNHE, en attente du choix d'un créneau pour l'installation
LCGFR-Tech 2016-06-17 (20160617-02)
Job Multi-coeur
E. Fede
nouveau
donner à Y. Patois ses paramètres de configuration maui.cfg
LCGFR-Tech 2016-04-15 (20160415-01)
Monitoring des transferts de données xRootD) - Chaque site vérifie sa configuration pour le monitoring xRootd.
Sites
en cours
Update 19-mai-2016 : F. Chollet suit ce point. CPPM : corrigé ; LPC : en cours ; CC : configuration spéciale
Il y a aussi peut être un effet qui s'ajoute pb de résolution à l'intérieur du domaine in2p3 pour lequel un ticket GGUS est ouvert
LCGFR-Tech 2015-12-05 (20151201-05)
JMB souhaiterait avoir des nouvelles de perfsonar et notamment des dashboards officiels qui doivent être consultés. CB organisera un point sur ce sujet à la prochaine réunion du groupe.
C. Biscarat
en cours
liens demandés au groupe "Perfsonar"
- 18-jan-2016 (infos de M. Babik "network & transfer metrics WG"): un seul dashborad en production : http://psmad.grid.iu.edu/maddash-webui/ (dashboard générique) et une instance de test http://maddash.aglt2.org/maddash-webui/; l groupe travaille avec les experiences pour avoir un dashboard WLCG-specific (plus facile pour les sites) ; aussi page du toolkit des sites.
- 15-avril-2016 (meeting LCG-FR Tech) : CB annonce que les liens ont été updatés sur la page web du WG, https://twiki.cern.ch/twiki/bin/view/LCG/NetworkTransferMetrics
LCGFR-Tech 2015-10-16 (201510176-04)
Le groupe se pose la question de savoir si les updates des VO ID card sont bien reçus par les sites. C. Biscarat se propose de faire un test avec la VO LPSC.
C. Biscarat
nouveau

LCGFR-Tech 2015-02-20 (20150220-03)
Efficacité des tâches de calcul ALICE à l'IRFU
J.-M. Barbet F. Schaer/S. Ferry/R. Vernet
en cours
l'efficacité des tâches ALICE à l'IRFU est environ deux fois plus petite que les autres sites en France, c'est un problème à l'étape de validation. J.-M. Barbet verra cela directement avec les experts ALICE au workshop de Turin.
- update (20-mars-2015) : cf. présentation de JM au LCG-FR Tech du 20 mars 2015
- update (17 avril 2015) : Frédéric Schaer - HTCondor+ARC-CE force une limite à 2Go de RAM, ALICE veut plus.
- update (LCGFR-Tech 18 sept. 2015) : S. Ferry, l'efficacité IRFU doit être au même niveau que les autres sites maintenant - vérifier MonaLisa toutefois;
- update CB 16-oct-2015 : l'efficacité est effectivement bien remontée (cf. http://alimonitor.cern.ch/reports/index.jsp) et elle est à 73% pour le mois de septembre 2015 contre 41% en janvier 2015. A suivre sur les mois qui viennent.
- update CB 1-dec-2015 : l'efficacité de réussite des jobs est toujours plus bassse que les autres sites : elle est de 61% en novembre.
- update CB 15-jan-2016 : CB a contacté le resp. calcul de ALICE (Renaud Vernet) pour faire ce suivi et comprendre pourquoi ce taux est plus faible à l'IRFU.
- update CB 27-jan-2017 : efficacité encore plus basse, de 39% (le CREAM a une efficacité de 74%), montré en réunion LCG-FR Tech ; baisse d'efficacité dûe à la campagne actuelle de jobs de ALICE avec bcp de mémoire ?
- update avril 2017 : toujours pas de nouvelles

LCG-FR Tech - Actions passées passées (classées par themes)

efficacite_ALICEnov2015.png (30 KB) Biscarat Catherine, 12/01/2015 06:52 AM

nohup.out_lpsc-se-dpm-disk10.in2p3.fr_disk10-4_1_09-06-20-35-02.png (18.4 KB) Biscarat Catherine, 12/06/2015 01:31 PM