Responsibilities:
As a Network Engineer specializing in High-Performance Computing (HPC) environments, you will be a key player in designing, implementing, and maintaining Juniper and Cisco switching infrastructure for an AI cluster. Proficiency with RoCEV2, RDMA, and Clos architecture is essential for success in this role.
Main Responsibilities:
Network Design and Implementation:
- Design, implement, and maintain Juniper and Cisco switching infrastructure tailored for High-Performance Computing environments.
- Ensure optimal network performance and reliability to support AI cluster operations.
- Specialized Knowledge:
- Demonstrate expertise in Juniper and Cisco switching technologies.
- Proficient in RoCEV2 (RDMA over Converged Ethernet) to enhance network performance.
- RDMA and Clos Architecture:
- Implement and manage RDMA (Remote Direct Memory Access) to optimize data transfer in an HPC setting.
- Utilize Clos architecture principles for efficient network scalability and high bandwidth.
- Collaboration:
- Collaborate with cross-functional teams, including system administrators and data scientists, to ensure seamless integration of network infrastructure with HPC systems.
- Troubleshooting and Optimization:
- Troubleshoot network issues and implement solutions promptly to minimize downtime.
- Optimize network configurations for enhanced performance in an AI cluster environment.
- Documentation:
- Maintain accurate and up-to-date documentation of network configurations, changes, and troubleshooting procedures.
- Security:
- Implement and maintain network security measures to safeguard the HPC environment.
- Emerging Technologies:
- Stay abreast of industry trends and emerging technologies in networking, HPC, and AI to recommend and implement improvements.
Requirements:
- Proven experience in designing and implementing Juniper and Cisco switching infrastructure.
- Proficiency in RoCEV2 and RDMA for high-performance data transfer.
- Familiarity with Clos architecture principles.
- Experience in troubleshooting network issues in an HPC environment.
- Strong collaboration and communication skills.
- Ability to adapt to evolving technologies and work in a dynamic, fast-paced environment.
Preferred Qualifications:
- Relevant certifications in Juniper and Cisco networking.
- Previous experience working in HPC environments supporting AI clusters.
- If you are a skilled Network Engineer with a passion for high-performance computing, and you possess expertise in Juniper and Cisco switching technologies along with RoCEV2, RDMA, and Clos architecture, we invite you to apply for this exciting opportunity. Join us in contributing to the advancement of AI and HPC capabilities.
apply now
المسؤوليات:
باعتبارك مهندس شبكات متخصصًا في بيئات الحوسبة عالية الأداء (HPC)، ستكون لاعبًا رئيسيًا في تصميم وتنفيذ وصيانة البنية التحتية للتبديل من Juniper وCisco لمجموعة الذكاء الاصطناعي. يعد إتقان هندسة RoCEV2 وRDMA وClos أمرًا ضروريًا للنجاح في هذا الدور.
المسؤوليات الرئيسية:
تصميم الشبكة وتنفيذها:
- تصميم وتنفيذ وصيانة البنية التحتية للتبديل Juniper وCisco المصممة لبيئات الحوسبة عالية الأداء.
- ضمان الأداء الأمثل للشبكة والموثوقية لدعم عمليات مجموعة الذكاء الاصطناعي.
- معرفة تخصصية:
- إظهار الخبرة في تقنيات التبديل Juniper وCisco.
- يتقن RoCEV2 (RDMA عبر Ethernet المتقاربة) لتحسين أداء الشبكة.
- بنية RDMA وClos:
- قم بتنفيذ وإدارة RDMA (الوصول المباشر للذاكرة عن بعد) لتحسين نقل البيانات في إعداد HPC.
- استخدم مبادئ بنية Clos لقابلية التوسع الفعالة للشبكة وعرض النطاق الترددي العالي.
- تعاون:
- تعاون مع فرق متعددة الوظائف، بما في ذلك مسؤولي النظام وعلماء البيانات، لضمان التكامل السلس للبنية التحتية للشبكة مع أنظمة HPC.
- استكشاف الأخطاء وإصلاحها والتحسين:
- استكشاف مشكلات الشبكة وإصلاحها وتنفيذ الحلول على الفور لتقليل وقت التوقف عن العمل.
- قم بتحسين تكوينات الشبكة لتحسين الأداء في بيئة مجموعة الذكاء الاصطناعي.
- توثيق:
- الحفاظ على وثائق دقيقة وحديثة لتكوينات الشبكة والتغييرات وإجراءات استكشاف الأخطاء وإصلاحها.
- حماية:
- تنفيذ والحفاظ على تدابير أمان الشبكة لحماية بيئة HPC.
- التقنيات الناشئة:
- مواكبة اتجاهات الصناعة والتقنيات الناشئة في مجال الشبكات والحوسبة عالية الأداء (HPC) والذكاء الاصطناعي للتوصية بالتحسينات وتنفيذها.
متطلبات:
- خبرة مثبتة في تصميم وتنفيذ البنية التحتية للتبديل من Juniper وCisco.
- الكفاءة في RoCEV2 وRDMA لنقل البيانات عالية الأداء.
- الإلمام بمبادئ الهندسة المعمارية Clos.
- خبرة في استكشاف مشكلات الشبكة وإصلاحها في بيئة HPC.
- مهارات التعاون والتواصل القوية.
- القدرة على التكيف مع التقنيات المتطورة والعمل في بيئة ديناميكية سريعة الخطى.
المؤهلات فضل:
- الشهادات ذات الصلة في شبكات Juniper و Cisco.
- خبرة سابقة في العمل في بيئات HPC التي تدعم مجموعات الذكاء الاصطناعي.
- إذا كنت مهندس شبكات ماهرًا ولديك شغف بالحوسبة عالية الأداء، ولديك خبرة في تقنيات التبديل Juniper وCisco جنبًا إلى جنب مع هندسة RoCEV2 وRDMA وClos، فنحن ندعوك للتقدم لهذه الفرصة المثيرة. انضم إلينا للمساهمة في تطوير قدرات الذكاء الاصطناعي والحوسبة عالية الأداء.
