Derrière le rideau ... l'infrastructure du CRAIG
Landry Breuil <breuil@craig.fr>
Un parc de machines
Mais encore..
Par ordre chronologique...
- bonneville: NAS Thecus N7700, 7*1.5To (fin 2009)
- thruxton: DELL R610, 8Go RAM, 2*500Go + SAN 4To (fin 2009)
- scrambler (ex-polegeom3): DELL PE840, 8Go RAM, 4*2To (mi 2013)
- trophy & tiger: DELL R720xd, 64Go RAM, 2*1To + 5*2To (fin 2013)
- 5*NAS: NAS LaCIE 5Big, 5*3To ou 5*4To (fin 2013/courant 2014)
- rocket (ex-polegeom2): DELL PE840, 4Go RAM, 4*250Go (fin 2014)
Le réseau
- sur RENATER, en gigabit
- 2 machines en IP privées: bonneville et scrambler
- 5 IPs publiques
- thruxton.craig.fr
- rocket.craig.fr
- tiger.craig.fr
- trophy.craig.fr
- lb.craig.fr
Les services
- Flux WMS/WFS/WMTS des données de référence (mapserver/mapproxy)
- Site(s) web (drupal/postgresql)
- FTP pour les commandes de données
- IDS (georchestra)
- Catalogue de métadonnées (geonetwork)
- Flux WMS/WFS des données utilisateurs (geoserver)
- Visionneuse cartographique (mapfishapp)
- Proxy d'authentification
Les services internes
- mail @craig.fr (postfix)
- calendrier/annuaire (davical)
- stockage réseau (freenas)
- suivi de tickets (gitlab)
- base de connaissances (dokuwiki)
- sauvegardes (backuppc)
- j'en oublie..
Le stockage
- Stockage 'chaud'
- Thruxton: 3.6To (opendata, commandes...)
- Scrambler: 2To (administratif, données de projets...)
- Trophy/Tiger: 3To (flux, caches tuilés...)
- Rocket: 20Go (mails!)
- Stockage 'tiède': sauvegardes des postes/serveurs.. 2To
- Stockage 'froid' d'archivage
- NAS d'images brutes/orthos.. 40To?
- DD de livraisons de prestataires.. 20To?
- DVDs IGN.. des cartons
Les containers, késako?
Les containers au CRAIG
Migration
- Chantier commencé en 2014..
- D'une infrastructure mono-serveur..
- .. vers une architecture répartie avec équilibrage et tolérante aux pannes
- Services internes migrés fin 2014
- Flux WMS/WFS/WMTS de référence migrés octobre 2014
- Chantier en cours... l'IDS!
Equilibrage de charge
Est-ce qu'on peut appliquer le même principe à l'IDS ? Sachant qu'il y'a...
- Plusieurs bases de données (geonetwork, georchestra, cadastrapp)
- Du stockage local (geonetwork, geoserver)
- Un annuaire LDAP
- Plusieurs serveurs d'application Tomcat
- Un serveur web en frontal
Heureusement, beaucoup de ces composants supportent nativement un mode réparti..
et quand ce n'est pas prévu, il y'a toujours moyen de faire une synchronisation manuelle,
ou d'élire un serveur comme 'maître' et l'autre comme 'esclave'
Architecture de geOrchestra
Intégration dans des containers
Ajout de briques intermédiaires..
On duplique..
Et on active la réplication/équilibrage!
C'est pas un peu compliqué ?
- Synchronisation des configurations
- Suivi des connections dans l'ensemble
- Suivi des sessions utilisateurs
- Différencier ce qui modifie de la donnée/ce qui est en lecture
- Détection de panne et remontée d'alerte
- Gestion automatique de la reprise sur incident
Gestion de configuration
- Chef d'orchestre
- Centralisation de la configuration de tous les services
- Historisation
- Idempotence
/