FRnOG 38 - Hadi Choueiry : Peering and Transit on Whitebox Switches

  • l’année dernière
FRnOG 38 - Hadi Choueiry : Peering and Transit on Whitebox Switches
#FRnOG #network #NOS
Transcription
00:00 Donc je vais commencer d'abord par présenter, faire une introduction à l'open networking.
00:04 Donc qu'est-ce que c'est ? Je vais parler après des ASIC génériques.
00:08 Pour ensuite arriver à comment on peut faire du peering et transit sur des switch whitebox.
00:13 Mais ne vous inquiétez pas, ça va en autre couleur aussi, à base d'ASIC génériques.
00:18 Donc pour commencer, le modèle de routeur traditionnel, je pense que vous le connaissez tous.
00:25 On achète un routeur, on a le hardware et le software qui viennent du même fabricant.
00:30 Et ces deux composants sont indissociables.
00:33 Donc je ne peux pas prendre le software du fabricant A, le mettre sur le hardware du fabricant B ou l'inverse.
00:38 Et au contraire, le modèle open networking, ça sépare les couches.
00:42 Donc on sépare la couche hardware de la couche software.
00:45 Donc le hardware, ça devient ce qu'on appelle whitebox à base d'un ASIC générique tel que Broadcom, Marvell ou autre.
00:54 Le hardware vient avec un bootloader qui s'appelle ONI, Open Network Install Environment.
01:00 Donc ce bootloader permet d'installer le network OS sur le hardware dès qu'il est démarré.
01:08 En plus l'ONI, ça permet la flexibilité, donc je peux changer de software au cours de la vie de mon hardware.
01:15 Et ce software qu'on appelle aussi des fois Network Operating System,
01:21 il fournit les applications de Control Plane, du Management Plane et des API.
01:28 Et en plus dans ce modèle, on a aussi la couche optique qui est indépendante.
01:33 Et tout ce modèle s'est en fait rendu populaire par des initiatives telles que l'Open Compute Project créée en 2011.
01:43 Et je pense tout à l'heure, il y a une présentation sur le CP.
01:46 Et le Telecom Infra Project créé par Meta ou Facebook.
01:50 En 2016.
01:52 Donc le succès de ces modèles, c'est d'abord le déverrouillage de l'utilisateur vis-à-vis de ses fournisseurs.
02:00 Ce déverrouillage apporte trois avantages fondamentaux.
02:04 Le premier, il nous laisse le choix de choisir le meilleur hardware et le meilleur software par rapport à notre besoin spécifique.
02:12 On n'est plus coincé avec ces choix.
02:15 Ça nous permet d'approvisionner le hardware de divers fournisseurs de hardware
02:23 et du coup sécuriser les délais d'approvisionnement, ce qui était problématique pendant une période.
02:30 Et enfin, un élément très important, ça nous permet d'avoir des réductions de coûts, des fois de 50% et plus.
02:37 Donc pourquoi on pense que ce modèle est maintenant mature ?
02:42 Déjà parce que l'écosystème est riche en ODM.
02:46 ODM c'est Original Design Manufacturer qui font des designs et fabriquent des whitebox à base d'ASIC génériques.
02:53 Et d'ailleurs ces ODM sont souvent les mêmes qu'ils fabriquent pour les fabricants traditionnels.
02:58 Côté ASIC, la performance des ASIC génériques a vraiment augmenté récemment.
03:04 Ils ont rattrapé les ASIC propriétaires custom.
03:08 Aussi côté software, aujourd'hui on a un écosystème de fournisseurs de software, de network operating system pour ce modèle.
03:17 Mais aussi il faut regarder côté architecture.
03:20 Donc aujourd'hui les réseaux, on commence à simplifier un peu par rapport à avant.
03:25 Donc les réseaux convergent vers des architectures avec des protocoles standards comme le segment routing, comme le VPN.
03:33 Donc voilà, on n'a plus besoin d'ASIC custom pour faire ce type de fonctionnalités, pour construire ce type de réseau.
03:41 Donc pour aller un peu plus dans le détail,
03:45 donc comme je disais c'est un écosystème riche en solutions software qui marchent avec des solutions hardware.
03:53 Côté software, on a des solutions de l'open source comme le SONIC.
03:59 Allons aux solutions commerciales les plus complètes en termes de fonctionnalités comme celles de IP infusion qui s'appelle Oknos.
04:08 Côté hardware, on a aussi un écosystème de fabricants de hardware qui couvre tous les use cases.
04:15 Donc peering, cœur de réseau, transit, accès, agrégation.
04:24 Et nous, Pine Networks, qu'est-ce qu'on fait dans cette histoire ?
04:27 On est intégrateur de système, on est spécialisé dans l'open networking.
04:31 Donc on accompagne les clients qui souhaitent gagner en flexibilité,
04:36 qui souhaitent faire des réductions majeures de coûts en allant à ce modèle d'open networking.
04:41 Donc on est partenaire avec IP infusion, avec Edgecore et d'autres fabricants.
04:47 Donc on accompagne nos clients sur diverses use cases de networking.
04:54 Donc là, vu que j'ai introduit l'open networking,
04:58 maintenant on va regarder les tendances à terme en matière de capacité, de performance,
05:05 pour des use cases de peering et comment les ASICs génériques d'aujourd'hui répondent à ces besoins.
05:15 Donc je vais commencer par cette fameuse courbe qu'on voit passer dans tous les NOG.
05:21 Donc le nombre de préfixes IPv4, IPv6 dans la table internet.
05:26 Donc en bleu, on a les IPv4 qui croient linéairement aujourd'hui.
05:31 En noir pointillé, on a les préfixes IPv6 qui ont croissance exponentielle,
05:37 même si on ne le voit pas bien ici.
05:39 Et ce qu'on a en orange, c'est la capacité FIB, les Forwarding Information Base des ASICs.
05:45 Par exemple, là on a utilisé Broadcom.
05:48 Donc actuellement, sur les ASICs d'aujourd'hui, on a une capacité de 3 millions de routes.
05:54 Or, la table IPv4, IPv6, on est à peu près 900 000, 1 million.
06:00 Donc on a de la marge.
06:01 Et la bonne nouvelle, c'est la capacité des ASICs, elle augmente de 50% annuellement.
06:06 Donc on a de la marge pour les besoins d'aujourd'hui et sur les besoins sur les prochains 5, 10 ans.
06:16 Donc à part les PERFs aussi, les architectures sont en train d'évoluer.
06:20 Donc historiquement, on faisait du peering, on prenait un grand châssis modulaire,
06:26 on l'utilisait pour faire une fabrique de peering.
06:28 C'est des châssis qui nous donnent beaucoup de débit, beaucoup de PERFs,
06:32 mais au passage, ils consomment beaucoup d'énergie.
06:34 Et ce n'est pas un modèle simple à gérer, surtout quand on atteint les limites du scale-up.
06:39 Maintenant, il faut remplacer un châssis et là, je pense que ça devient problématique.
06:45 Donc, hormis aujourd'hui, par exemple, les DataCenters ont adopté les architectures des scale-out,
06:53 qui sont successives aujourd'hui.
06:55 Donc on adopte les mêmes architectures pour faire des fabriques de peering, ce qu'on représente ici.
07:00 Donc ces fabriques de peering nous permettent une croissance propre.
07:04 On peut scaler en ajoutant des pizza boxes, des châssis non modulaires,
07:09 et avec l'augmentation des PERFs des ASICs génériques,
07:13 aujourd'hui on peut construire des fabriques qui nous donnent beaucoup de capacités,
07:17 beaucoup de PERFs, et aussi qu'on peut utiliser pour faire des protocoles tels que le segment routing,
07:25 le label d'Unicast, du S-Flow, etc.
07:30 J'ai parlé beaucoup d'ASICs génériques, donc là je veux donner un exemple.
07:36 On va parler de l'ASIC Broadcom-Qumran.
07:40 Dans ce tableau, on va s'intéresser à deux choses.
07:44 C'est un tableau de profils de forwarding.
07:47 On va s'intéresser au profil balanced.
07:50 C'est le profil par défaut qui est pour un use case de switching et routing,
07:54 donc un peu des deux.
07:56 Et le profil L3XL, c'est un profil optimisé pour des use cases de routage,
08:03 tel que le peering.
08:05 Avec cet ASIC, en profil balanced, on a 1 million de préfixes dans la FIB.
08:12 Et si on passe au profil L3XL, on a 1,4 million de préfixes dans la FIB.
08:19 Et il ne faut pas oublier que ce sont des profils configurables en software,
08:22 donc on ne va pas changer de hardware, c'est juste qu'on change une configuration de software.
08:27 Si on passe au Qumran 2C, la variante la plus performante,
08:32 en balance on a 2 millions de routes, ou de préfixes,
08:37 et en L3XL, 2,8 millions.
08:41 Et maintenant si on prend la gamme Qumran 2C avec TECAM externe,
08:45 c'est là qu'on voit la différence.
08:48 On a 20 millions de préfixes dans la FIB de capacité.
08:54 Ce qui est intéressant ici, c'est la différence de prix entre le Qumran sans TECAM externe
08:59 et le Qumran avec TECAM.
09:02 C'est vraiment pas très considérable, donc avec juste un petit peu plus,
09:06 on peut avoir quelque chose qui tient la route plusieurs années.
09:11 Pour aller un peu plus loin, on a testé ça en labo.
09:16 On a pris un whitebox à base de Qumran 2C, un autre à base de Qumran 2A,
09:23 et on a utilisé deux méthodes pour jouer un peu.
09:26 On a utilisé le Spirent dans lequel on a programmé un très grand nombre de routes.
09:33 On a utilisé GoBGP avec des fichiers MRT qu'on a injectés dedans,
09:37 avec la vraie table de routage, avec les vrais attributs dedans.
09:44 Pour regarder sur le Qumran 2C, on a configuré trois pierres BGP.
09:49 Chaque pierre nous annonce 1,6 millions de routes.
09:53 Je ne sais pas si vous voyez, c'est un peu petit.
09:56 On voit 4,8 millions de routes dans la RIB et on voit 1,6 millions de routes injectées dans la FIB.
10:04 Donc ça c'est par exemple un use case d'un moyen fournisseur d'accès Internet,
10:09 d'un datacenter qui a plusieurs fournisseurs de transit, qui est présent dans quelques IX.
10:15 Donc ça correspond à ce genre de besoin et avec de la marge pour avoir de la croissance.
10:22 Et là le test avec le Qumran 2A et le GoBGP.
10:26 Donc là on a configuré un seul neighbor qui nous annonce 920.000 préfixes
10:32 qui sont dans la, qu'on voit dans la RIB et aussi injectés dans la FIB.
10:38 Donc pour conclure ma partie, donc voilà on voit que le modèle Open Networking aujourd'hui
10:44 est mature avec plein d'acteurs côté software, côté hardware,
10:48 côté à doigt et des standards qui permettent les deux de fonctionner ensemble.
10:53 Les ASIC génériques, ils ont fortement augmenté en capacité.
10:57 Donc ils apportent les PERFs nécessaires pour ce genre de use case et autres aussi.
11:02 Et tout ça en apportant des bénéfices de diversification, de flexibilité
11:08 et des réductions des coûts majeurs par rapport au système, aux solutions de routage traditionnelles.

Recommandations