web-dev-qa-db-fra.com

Pourquoi mon Hyperv VM perdait-il de la connectivité aléatoire?

J'ai un étrange problème de connectivité intermittent qui se passe une fois toutes les deux semaines.

Tout d'abord, ma configuration: j'exécute un cluster de basculement Hyperv avec deux hôtes physiques (Node01 et Node02). Les hôtes exécutent à la fois Windows Server 2008 R2 Server hyperv (le gratuit) avec SP1. Sur ces hôtes, je suis en cours d'exécution de deux VM en cours d'exécution Windows Server 2008 R2 Web Edition avec SP1. Mon serveur de stockage est Windows Storage Server 2008 connecté via ISCSI. Les deux hôtes ainsi que le serveur de stockage utilisent les derniers pilotes de réseau téléchargés directement à partir du site Web d'Intel.

Voici le problème: 99,99% du temps, tout fonctionne parfaitement. Environ une fois toutes les deux semaines de trois semaines, les VMS perdront simultanément la connectivité réseau, à la fois entrantes et sortantes. Quand cela arrive,

  1. Je ne peux pas RDP dans non plus de la VM.
  2. Je peux RDP dans l'hôte.
  3. Je peux me connecter à VM à partir du gestionnaire de cluster de basculement en cliquant avec le bouton droit de la souris sur le nœud et sélectionnez "Connecter à la machine virtuelle".
  4. Une fois que je me connecte au VM tel que décrit dans le n ° 3 ci-dessus, je ne peux pas accéder à des sites Web ou de machines sur le réseau local. Désactivation et réactivation de la connexion réseau virtuelle à l'intérieur du VM ne résout pas le problème.
  5. Si je déplace le VM sur un autre noeud, cela corrige le problème (pour les deux prochaines semaines).
  6. Si je redémarre l'hôte et déplacez-le VM en arrière, cela corrige le problème (pour les deux prochaines semaines).
  7. Lorsque cela se produit, le cluster de basculement ne bascule pas automatiquement le VM.
  8. Il n'y a pas d'entrées de journal d'événements inhabituels sur l'un des hôtes ou des ordinateurs virtuels.

Cela est arrivé environ 5 fois avec les mêmes symptômes que ceux décrits ci-dessus. Je soupçonne un problème de pilote réseau ou de réseau de réseau, mais puisque je suis déjà en train d'exécuter les derniers pilotes, je ne suis pas sûr de quoi faire à ce sujet.

Ceci est un vrai head-scratchers ... toutes les idées?

Mettre à jour

J'ai trouvé un cas très similaire ici: la machine virtuelle perd la connectivité réseau sur Hyper V Cluster

Mise à jour du 7/29/2011

Après avoir installé Hotfixes et mettre à jour des pilotes de réseau, je rencontre toujours le même problème. En réponse au commentaire demandant des détails matériels, le serveur est un Intel SR1670HV, qui est un châssis 1U contenant deux cartes mères S5500HV indépendantes. La communication se fait via les NIC intégrés des cartes mères qui sont Intel 82574L. Le pilote réseau est la version 16.2.49.0.

10
Mike

Cela s'est avéré être un problème matériel - j'ai isolé le problème à un commutateur géré Netgear GSM7224V2, remplacé par une DGS-1024D D-Link, et tout fonctionne bien depuis.

En tant que "leçon apprise", dans ce cas, j'ai probablement dépensé 99% de mes efforts de diagnostic Dépannage des paramètres logiciels pour ce qui s'est avéré être une question matérielle. J'ai même payé Microsoft Support 259 $ (et j'ai passé beaucoup de temps au téléphone avec eux) pour m'aider à comprendre en piquant les paramètres logiciels. Je suppose que la morale de l'histoire consiste à soupçonner votre matériel autant que votre logiciel.

2
Mike

Nous avions un problème comme celui-ci où je suis à. Je ne me souviens pas des détails exacts, mais la solution finale a dû faire avec une adresse MAC conflictuelle attribuée de manière dynamique à un adaptateur réseau virtuel. Épingler ceux-là qu'ils n'étaient pas dynamiques n'ont pas aidé beaucoup. Vous ne voulez normalement pas faire cela car il peut rendre plus difficile de déplacer une machine virtuelle à un hôte différent, mais cela nous a aidés dans ce cas.

L'autre partie est que les NCI physiques ont été fabriquées par Broadcom et nous avions également une erreur de configuration là-bas, où un administrateur précédent avait essayé de manière incorrecte d'utiliser l'utilitaire Broadcom pour connaître les deux Nics ensemble sur l'hôte pour une bande passante/un débit amélioré. Nous avons supprimé cette configuration et configurée l'un des NICS de sorte qu'il n'y avait pas de propriété intellectuelle sur la machine hôte, mais pourrait toujours être utilisé pour les invités virtuels. Ensuite, nous définissons chaque machine virtuelle pour utiliser une seule carte réseau ou l'autre, en équilibrant la charge en fonction du trafic historique. Bien sûr, cela signifie pas de basculement si un adaptateur ou une connexion diminue, et nous n'avons pas suivi bien pour voir si la circulation est restée équilibrée au fil du temps, mais elle a été solide stable depuis lors.

7
Joel Coel

Je suis conscient que c'est une vieille question, mais j'ai rencontré le même problème et j'ai gaspillé autant de temps à résoudre le problème que je pensais partager la solution qui a fonctionné pour moi. J'ai trouvé la solution à mon problème ici:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

La solution dans ma situation était de désactiver TCP déchargement sur le VMS. Je citerai la section correspondante du lien:

Afin de désactiver TCP Déchargement, j'ai dû créer et définir une nouvelle valeur de registre dans chaque VM connecté au Broadcom 8507 Nextreme II Nic.

J'ai utilisé le changement de registre suivant pour désactiver TCP Déchargement:

Touche: HKLM\System\CurrentControlset\Services\TCPIP\Paramètres

Valeur (DWORD): DisableTâcheOffoffload = 1

Après désactivation TCP Offload sur chaque VM Ainsi, tous les problèmes étaient terminés et que j'ai pu connecter plusieurs VMS à un NIC = Port du Broadcom 5708 Nextreme II Nic.

Mon serveur a Broadcom NetExtreme NICS, il semble donc que cela me semble que la cause de cette question était définitivement liée au conducteur, mais en définissant DisableTaskOffload = 1 résolvé le problème complètement pour moi. J'espère que ces informations sauvent quelqu'un d'autre heures de recherche!

5
BruceHill

J'ai rencontré quelque chose de similaire dans un environnement Hyper-V beaucoup plus simple et j'ai couru sur cet article à Microsoft. Semble s'adapter à votre situation si les serveurs Web sont fortement utilisés.

http://support.microsoft.com/kb/974909 - La connexion réseau d'une machine virtuelle Hyper-V exécutée est perdue sous le trafic de réseaux sortants lourds sur un ordinateur Windows Server 2008 R2

3
Christopher

Nous avons eu ce même problème, cependant, dans notre cas, c'était toutes les 24-48 heures. Je vérifiais que votre produit antivirus/pare-feu scofiquement Server Server 2008 avec Hyper-V, sinon, essayez une différence (ou temporairement si possible si possible) votre produit anti-virus/pare-feu comme test pour voir si le problème s'en va. .

Après un appel à Microsoft et plusieurs téléchargements de fichiers Dump/journal plus tard, ils ont déterminé que Trendmicro OfficeScan était le coupable dans notre cas. Nous utilisions une version qui s'est avérée explicitement prise en charge sur Hyper-V, une fois que nous avons mis à niveau vers la dernière version, le problème s'est éloigné.

2
Jesse

Sur les propriétés de l'adaptateur réseau pour l'invité VM, avez-vous désactivé des paquets Jumbo et une grande décharge d'envoi? Sur la base de mon expérience avec ces paramètres, je voudrais certainement l'essayer.

1
Greg Askew