Aller au contenu

[TUTO] Monitoring réseau (Telegraf + InfluxDB 1.8 + Grafana)


.Shad.

Messages recommandés

Bonjour @.Shad.

il y a une heure, .Shad. a dit :

Si tu ne modifies qu'un fichier conf, normalement un redémarrage du conteneur suffit.

Je pense que cela a permis de prendre en compte les manipulations que j'aie faites pour donner les droits d'accès à Télégraf (changement de propriétaire et ajout de l'ID du user dans le fichier docker.compose)

il y a une heure, .Shad. a dit :

Normalement c'est sensé marcher en mettant l'IP locale, mais certains ont eu le même problème que toi.
L'avantage de passer par l'IP interne c'est d'éviter les problèmes de changement d'IP (changement de box par exemple).

J'ai un routeur interne, donc quand je change de box c'est "transparent" pour mon réseau interne normalement.

Du coup, j'ai tenté de monitorer Docker, mais j'ai une erreur d'accès au fichier docker.sock, malgré que j'ai bien ajouté l'information dans mon fichier docker-compose

[inputs.docker] Error in plugin: Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get "http://%2Fvar%2Frun%2Fdocker.sock/v1.21/info": dial unix /var/run/docker.sock: connect: permission denied

Voici mon fichier docker-compose :

volumes:
         - /volume1/docker/telegraf/telegraf.conf:/etc/telegraf/telegraf.conf:ro
         - /var/run/docker.sock:/var/run/docker.sock:ro
         - /usr/share/snmp/mibs:/usr/share/snmp/mibs:ro
         - /etc/localtime:/etc/localtime:ro
         - /etc/TZ:/etc/timezone:ro

 

Encore merci pour ton aide et tes réponses

Faluorn

Lien vers le commentaire
Partager sur d’autres sites

@faluorn Si ton utilisateur telegraf a été ajouté au groupe docker, tu peux simplement te connecter en SSH et taper la commande suivante :

chown root:docker /var/run/docker.sock

Penser à ajouter sudo devant si pas connecté en root.

Normalement ça devrait fonctionner instantanément, si pas tu peux juste redémarrer le conteneur.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour  @.Shad.

Désolé pour ma réponse, j'ai été malade et laissé un peu tout cela de côté 😕

Ta commande a solutionné mon problème un énorme merci!!

Par contre, je n'arrive pas à trouver le dashboard Grafana de monitoring Docker que tu montres au début de ton tutoriel. Tu aurais la possibilité de le partager?

Encore merci pour toute l'aide apportée!

Faluorn

Lien vers le commentaire
Partager sur d’autres sites

Bonjour @Sky007FR

Nous sommes nombreux à nous être arrêté sur la version 1.20.4 car les versions plus récentes font bugger le monitoring. La ligne dont tu parles est commentée dans le fichier telegraf.conf que nous utilisons. Tu l'avais décommentée ?

Lien vers le commentaire
Partager sur d’autres sites

@Sky007FR

Bonjour,

Si tu es sous DSM7.x alors il vaut mieux pour toi de suivre la recommandation précédente de @Jeff777, mais si tu es sous DSM6.x, saches que le monitoring fonctionne très bien au moins jusqu'à la la version 1.21.4 de telegraf. En tous cas je n'ai aucun soucis avec celle-ci.

Il y a 5 heures, Sky007FR a dit :

Sinon j'avais une erreur de parsing du fichier de conf... qui n'aime pas le "d"

C'est étonnant car la valeur par défaut de ce paramètre est "0d" ???

Citation

  ## The logfile will be rotated after the time interval specified.  When set
  ## to 0 no time based rotation is performed.  Logs are rotated only when
  ## written to, if there is no log activity rotation may be delayed.
  # logfile_rotation_interval = "0d"

Cordialement

oracle7😉

Lien vers le commentaire
Partager sur d’autres sites

@Jeff777
Moi aussi j'avais un moment bloqué les updates en 1.20-2  mais je suis repassé en update automatique "latest" depuis. Mis à part ce bug de parsing rencontré avec la 1.22.0, le monitoring fonctionne parfaitement.

En effet, dans ma config j'ai décommenté les lignes qui concerne la rotation des logs :

logfile_rotation_interval = "7d"
logfile_rotation_max_size = "10MB"
logfile_rotation_max_archives = 10

Et ça fonctionnait parfaitement comme cela depuis longtemps. 

Voici l'erreur renvoyée dans le journal  avec la 1.22.0 :

[telegraf] Error running agent: Error loading config file /etc/telegraf/telegraf.conf: error parsing [agent]: line 83: (config.AgentConfig.LogfileRotationInterval) time: unknown unit "d" in duration "7d"


@oracle7
Je suis en DSM 6.2.4 car mon DS1812+ n'est pas compatible avec DSM 7.
Je confirme que le paramètre par défaut est bien "0d" et "7d" devrait aussi fonctionner...
J'ai essayé "7D", même souci. Du coup j'ai remplacé par "168h" et ça passe !

Lien vers le commentaire
Partager sur d’autres sites

@Sky007FR Pas eu de problème de mon côté avec les logs.

Sinon bonne nouvelle, la version 1.22.0 de Telegraf laisse maintenant le choix entre gosmi et snmptranslator pour parser les MIB. Par défaut, c'est snmptranslator, donc le binaire qui tolère les non conformités dans les MIB qui est activé, donc normalement vous n'aurez rien à faire lors de l'upgrade de l'image.

Je vous conseille de cependant de générer un nouveau fichier de configuration vierge à personnaliser, vous aurez ainsi quelque chose de plus à jour, surtout si vous avez toujours le même depuis la mise en place du tutoriel.

Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines après...
Le 24/03/2022 à 19:52, oracle7 a dit :

Si tu es sous DSM7.x alors il vaut mieux pour toi de suivre la recommandation précédente de @Jeff777, mais si tu es sous DSM6.x, saches que le monitoring fonctionne très bien au moins jusqu'à la la version 1.21.4 de telegraf. En tous cas je n'ai aucun soucis avec celle-ci.

Bonjour,

Pour info je suis en DSM7.1 je viens de mettre "telegraf latest" (soit 1.22.1) et mes dashboards fonctionnent.

Le log :

2022-04-12T08:02:10Z I! Using config file: /etc/telegraf/telegraf.conf

2022-04-12T08:02:13Z W! DeprecationWarning: Option "container_names" of plugin "inputs.docker" deprecated since version 1.4.0 and will be removed in 2.0.0: use 'container_name_include' instead

2022-04-12T08:02:13Z W! DeprecationWarning: Option "total" of plugin "inputs.docker" deprecated since version 1.18.0 and will be removed in 2.0.0: use 'total_include' instead

2022-04-12T08:02:13Z I! Starting Telegraf 1.22.1

2022-04-12T08:02:13Z I! Loaded inputs: cpu disk diskio docker kernel mem processes snmp (3x) swap system

2022-04-12T08:02:13Z I! Loaded aggregators:

2022-04-12T08:02:13Z I! Loaded processors:

2022-04-12T08:02:13Z I! Loaded outputs: influxdb

2022-04-12T08:02:13Z I! Tags enabled: host=telegraf

2022-04-12T08:02:13Z W! Deprecated inputs: 0 and 2 options

2022-04-12T08:02:13Z I! [agent] Config: Interval:20s, Quiet:false, Hostname:"telegraf", Flush Interval:20s

(pour l'instant freebox est resté sur telegraf 1.20.4 à voir) 

Modifié par Jeff777
Lien vers le commentaire
Partager sur d’autres sites

Finalement le monitoring de la Freebox est aussi tombé en marche avec telegraf latest. 

Il me reste à résoudre quelques "time out" mais les dashboards s'affichent.

Et influxd, quelqu'un a réussi à faire fonctionner la version 2 ?

Lien vers le commentaire
Partager sur d’autres sites

Je viens d'essayer (sans rien modifier d'autre que la version de telegraf), et bien seuls les panels liés à Docker ne fonctionnent pas. Le reste est ok.

Une idée de comment les refaire fonctionner ?

Le 29/03/2022 à 06:42, .Shad. a dit :

Je vous conseille de cependant de générer un nouveau fichier de configuration vierge à personnaliser, vous aurez ainsi quelque chose de plus à jour, surtout si vous avez toujours le même depuis la mise en place du tutoriel.

Je ne me rappelle plus du tout comment on fait ça 😅

Lien vers le commentaire
Partager sur d’autres sites

il y a 11 minutes, .Shad. a dit :

Tu cherches une solution à quoi ? tu utilises l'IP passerelle, qui ne change jamais, au lieu de l'IP locale, qui est dépendante du réseau sur lequel se trouve le NAS. C'est mieux ainsi, non ?

Je voudrais que soit affiché l’adresse iP lan du nas pas l’adresse du réseau docker de la stack monitoring…

Lien vers le commentaire
Partager sur d’autres sites

il y a 4 minutes, .Shad. a dit :

C'est dans l'input.snmp relatif aux OID de Synology du fichier conf de Telegraf que tu choisis l'IP de l'agent à scruter.

Oh ! En allant voir ce fichier, effectivement c'est 172.0.20.1 qui est mise en plus de l'IP du routeur...
Mais pourquoi j'ai mis ça ??!!

Après modification, j'ai bien ce que je veux 🙂  moyennant l'ajout de ce que j'ai entouré en rouge le temps que l'adresse du réseau docker soit éliminée de la bdd.
smkApf0.png

 

Mais vraiment, je ne me souviens plus de pourquoi j'avais changé l'ip dans le fichier de configuration...
Ha, peut-être que si en fait...
Maintenant je n'ai plus les infos sur le NAS :
qGCsuG8.png


Mais en regardant les panels un à un, je vois que c'est l'ip 172.0.20.1 qui est mise dedans...
Je me demande quand même pourquoi j'avais changé de 192.168.2.200 -> 172.0.20.1 ... 
🧐🤯

Reste les panels Docker qui sont en No Data également... mais pour eux pas d'IP dans l'édition...

Lien vers le commentaire
Partager sur d’autres sites

En fait, pour la supervision de docker dans Grafana, j'ai de nouveau ces erreurs :
 

2022-04-12T16:32:50Z E! [inputs.docker] Error in plugin: Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get "http://%2Fvar%2Frun%2Fdocker.sock/v1.24/info": dial unix /var/run/docker.sock: connect: permission denied

2022-04-12T16:32:50Z E! [inputs.docker] Error in plugin: Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Get "http://%2Fvar%2Frun%2Fdocker.sock/v1.24/containers/json?filters=%7B%22status%22%3A%7B%22running%22%3Atrue%7D%7D&limit=0": dial unix /var/run/docker.sock: connect: permission denied

Mais en lançant un script qui modifie les permissions de docker.sock comme tu l'avais suggéré :

sudo chown root:User-Docker /var/run/docker.sock

je retrouve les stats docker dans grafana 🙂 

Lien vers le commentaire
Partager sur d’autres sites

Il y a 2 heures, MilesTEG1 a dit :

Je me demande quand même pourquoi j'avais changé de 192.168.2.200 -> 172.0.20.1 ...

Fut un temps certaines personnes avaient du mal à faire du poll SNMP en utilisant l'IP locale, pour une raison qui m'a toujours échappée.

Lien vers le commentaire
Partager sur d’autres sites

il y a une heure, bruno78 a dit :

oui, mais c'est laborieux !

Bonjour,

Tu piques ma curiosité, mais je vais rester comme cela tant que ça fonctionne. Si un jour je manque d'activité intellectuelle, je t'en demanderai plus si tu veux bien 😉

Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines après...

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.