About the job
- NexGen Cloud is a rapidly growing IaaS company focused on providing innovative cloud solutions and infrastructure services. Our GPU cloud infrastructure solutions accelerate development in industries such as Artificial Intelligence & Machine Learning, VFX & Rendering, Data Science & IoT, and Computer Aided Engineering & MDO.
- We are dedicated to helping our clients navigate the complexities of the digital world and achieve success through cutting-edge, scalable, secure and affordable solutions.
- At the company's heart stands a group of very talented, experienced, and motivated individuals who want to make a positive change and a lasting impact on the tech world.
Position summary
- We are seeking a highly skilled and experienced Senior HPC Engineer to join our growing team at NexGen Cloud. The successful candidate will be responsible for designing, implementing, and maintaining complex High Performance Computing infrastructure solutions. This is a fantastic opportunity for a talented engineer with a passion for cloud technologies to contribute to the ongoing success and growth of NexGen Cloud.
Key Responsibilities:
- Design, deploy, and manage highly available, scalable, and secure HPC infrastructure solutions, including our HPC-aaS offering
- Design, develop and support Hyperstack and InfraHub API development as related to our HPC services
- Develop and maintain infrastructure-as-code (IaC) templates and scripts to automate deployment, management, and monitoring processes.
- Collaborate closely with cross-functional teams, including architects, developers, and product managers, to develop and implement innovative infrastructure strategies that meet business requirements.
- Troubleshoot and resolve complex infrastructure issues, ensuring optimal performance and reliability.
- Lead and mentor junior infrastructure engineers, fostering a culture of continuous learning and improvement.
- Continuously research and stay up-to-date with the latest cloud technologies, tools, and best practices to drive innovation and efficiency within the team.
Essential Skills:
- 7+ years of experience in HPC infrastructure, administration and service
- Understanding of data center infrastructure
- Experience with GPU technologies through AI\ML, Mining, Rendering or other application.
- Hands on experience with High Performance Computing administration, upgrades and scale-out operations.
- Hands on experience with high performance parallel / distributed storage and networking for HPC
- Experience in using Ansible to manage routine operations.
- You have worked as part of a team spanning across multiple time zones and multiple disciplines.
- Fluent written English and at least conversational spoken English
- In-depth understanding of cloud architecture principles, networking, security, and performance optimization.
- Strong knowledge of Linux/Unix systems, virtualization technologies, and containerization platforms like Docker and Kubernetes.
- Excellent problem-solving, analytical, and communication skills.
- Strong teamwork and collaboration abilities, with a commitment to fostering a positive work environment.
Desirable skills:
- Experience with Openstack cloud, Ceph and WEKA storage
- Exposure to Jira and Confluence
- Capability to write technical documentation.
- Experience writing Ansible playbooks.
- Ability to write scripts\tools in Python
- Git and CI/CD pipeline management
What We Offer:
- Competitive salary
- Opportunity to work with a diverse team of talented professionals who are passionate about technology and innovation.
- A collaborative and supportive work environment that encourages professional growth and development.
- Exposure to cutting-edge technologies and the opportunity to make a significant impact on the future of cloud computing.
To contact and send your CV, click on the link below
https://www.nexgencloud.com/
عن العمل
- NexGen Cloud هي شركة IaaS سريعة النمو تركز على تقديم حلول سحابية مبتكرة وخدمات البنية التحتية. تعمل حلول البنية التحتية السحابية لوحدة معالجة الرسومات لدينا على تسريع التطوير في صناعات مثل الذكاء الاصطناعي والتعلم الآلي، والمؤثرات البصرية والعرض، وعلوم البيانات وإنترنت الأشياء، والهندسة بمساعدة الكمبيوتر وMDO.
- نحن ملتزمون بمساعدة عملائنا على التغلب على تعقيدات العالم الرقمي وتحقيق النجاح من خلال حلول متطورة وقابلة للتطوير وآمنة وبأسعار معقولة.
- يوجد في قلب الشركة مجموعة من الأفراد الموهوبين وذوي الخبرة والمتحمسين الذين يرغبون في إحداث تغيير إيجابي وتأثير دائم في عالم التكنولوجيا.
ملخص الموقف
- نحن نبحث عن مهندس HPC ذو مهارات عالية وخبرة عالية للانضمام إلى فريقنا المتنامي في NexGen Cloud. سيكون المرشح الناجح مسؤولاً عن تصميم وتنفيذ وصيانة حلول البنية التحتية المعقدة للحوسبة عالية الأداء. هذه فرصة رائعة لمهندس موهوب لديه شغف بالتقنيات السحابية للمساهمة في النجاح والنمو المستمر لـ NexGen Cloud.
المهام الأساسية:
- تصميم ونشر وإدارة حلول البنية التحتية عالية الأداء والقابلة للتطوير والآمنة للحوسبة عالية الأداء، بما في ذلك عروض HPC-aaS الخاصة بنا
- تصميم وتطوير ودعم تطوير Hyperstack وInfraHub API فيما يتعلق بخدمات HPC لدينا
- قم بتطوير وصيانة قوالب ونصوص البنية التحتية كرمز (IaC) لأتمتة عمليات النشر والإدارة والمراقبة.
- التعاون بشكل وثيق مع فرق متعددة الوظائف، بما في ذلك المهندسين المعماريين والمطورين ومديري المنتجات، لتطوير وتنفيذ استراتيجيات البنية التحتية المبتكرة التي تلبي متطلبات العمل.
- استكشاف أخطاء البنية التحتية المعقدة وإصلاحها وحلها، مما يضمن الأداء الأمثل والموثوقية.
- قيادة وتوجيه مهندسي البنية التحتية المبتدئين، وتعزيز ثقافة التعلم المستمر والتحسين.
- قم بالبحث المستمر والبقاء على اطلاع بأحدث التقنيات والأدوات وأفضل الممارسات السحابية لدفع الابتكار والكفاءة داخل الفريق.
مهارات اساسيه:
- أكثر من 7 سنوات من الخبرة في البنية التحتية والإدارة والخدمة HPC
- فهم البنية التحتية لمركز البيانات
- تجربة مع تقنيات GPU من خلال AI\ML أو التعدين أو العرض أو أي تطبيق آخر.
- خبرة عملية في إدارة الحوسبة عالية الأداء والترقيات والعمليات واسعة النطاق.
- خبرة عملية في مجال التخزين والشبكات المتوازية/الموزعة عالية الأداء لـ HPC
- خبرة في استخدام Ansible لإدارة العمليات الروتينية.
- لقد عملت كجزء من فريق يمتد عبر مناطق زمنية متعددة وتخصصات متعددة.
- إجادة اللغة الإنجليزية المكتوبة والإنجليزية المنطوقة على الأقل
- فهم متعمق لمبادئ البنية السحابية والشبكات والأمان وتحسين الأداء.
- معرفة قوية بأنظمة Linux/Unix وتقنيات المحاكاة الافتراضية ومنصات الحاويات مثل Docker وKubernetes.
- مهارات ممتازة في حل المشكلات والتحليل والتواصل.
- قدرات قوية على العمل الجماعي والتعاون، مع الالتزام بتعزيز بيئة عمل إيجابية.
المهارات المرغوبة:
- تجربة مع Openstack cloud وتخزين Ceph وWEKA
- التعرض لجيرا والتقاء
- القدرة على كتابة الوثائق الفنية.
- تجربة كتابة كتب اللعب Ansible.
- القدرة على كتابة البرامج النصية والأدوات في بايثون
- إدارة خطوط أنابيب Git وCI/CD
ما نقدمه:
- رواتب منافسة
- فرصة للعمل مع فريق متنوع من المهنيين الموهوبين المتحمسين للتكنولوجيا والابتكار.
- بيئة عمل تعاونية وداعمة تشجع النمو والتطوير المهني.
- التعرض للتقنيات المتطورة وفرصة إحداث تأثير كبير على مستقبل الحوسبة السحابية.
