Overview
We are a leading company in the cloud AI/ML sector, offering cutting-edge services in Generative AI and large language models (LLMs). Our team of over 40 engineers works together to provide clients with scalable and reliable cloud infrastructure solutions. As we continue to grow, we are looking for exceptional talent to join our professional services team.
↔
GenAI Cloud Specialist
Key Responsibilities:
GenAI and Cloud Expertise:
- Collaborate with data scientists, consultants, and client stakeholders to understand their Generative AI and LLM requirements.
- Architect and deploy cloud-based solutions leveraging AWS Bedrock as the primary platform for scalable AI/ML deployments and GCP Vertex AI where applicable.
- Work with the latest open-source GenAI models such as LLaMA 3, Falcon 2, and Mistral to build impactful solutions for real-world applications.
- Design and implement cloud-native pipelines for training, fine-tuning, and serving LLMs.
Deployment, Monitoring, and Optimization:
- Deploy AI/ML models into production environments using AWS services like SageMaker, Inferentia, and Lambda, and Google Vertex AI.
- Build and maintain robust monitoring systems using tools like CloudWatch and Prometheus to track model inference performance, cost, and utilization.
- Optimize cloud infrastructure to reduce costs while maintaining high performance, leveraging GPU/TPU acceleration, autoscaling, and GPU slicing.
- Establish processes for monitoring and mitigating issues like model drift and security vulnerabilities in Generative AI systems.
Preferred Qualifications:
- 4+ years of experience in AI/ML engineering with a focus on cloud-native AI solutions.
- Hands-on experience with Generative AI tools and Large Language Models (e.g., LLaMA 3, Falcon 2, Mistral).
- Expertise in AWS Bedrock, SageMaker, and working knowledge of GCP Vertex AI.
- Experience working with open-source AI/ML libraries (e.g., Hugging Face Transformers).
- Familiarity with deploying models on Kubernetes, Docker, and serverless platforms.
- Understanding of modern GenAI challenges such as prompt engineering, data privacy, and model bias mitigation.
- Strong analytical, problem-solving, and communication skills.
- Ability to work independently, manage multiple projects, and thrive in a remote-first environment.
Benefits of Working with Us:
- Competitive hourly rate and flexible work schedule within agreed-upon part-time parameters.
- Opportunity to work on cutting-edge GenAI projects, solving real-world challenges with LLMs and advanced cloud AI tools.
- Collaborate in a supportive, remote team environment.
- Stay at the forefront of the rapidly evolving Generative AI space, gaining hands-on experience with the latest technologies.
To apply, please click here for available vacancies.
نظرة عامة
نحن شركة رائدة في قطاع الذكاء الاصطناعي السحابي / التعلم الآلي، نقدم خدمات مبتكرة في مجال الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة (LLMs). يعمل فريقنا المكون من أكثر من 40 مهندسًا معًا لتوفير حلول بنية تحتية سحابية قابلة للتوسع وموثوقة للعملاء. مع استمرارنا في النمو، نحن نبحث عن مواهب استثنائية للانضمام إلى فريق خدماتنا المهنية.
أخصائي سحابي للذكاء الاصطناعي التوليدي
المسؤوليات الرئيسية:
الخبرة في الذكاء الاصطناعي التوليدي والسحابي:
- التعاون مع علماء البيانات والاستشاريين وأصحاب المصلحة من العملاء لفهم متطلباتهم في مجال الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة.
- تصميم وتطوير حلول سحابية باستخدام AWS Bedrock كمنصة رئيسية لنشر حلول الذكاء الاصطناعي والتعلم الآلي القابلة للتوسع وGCP Vertex AI حيثما ينطبق.
- العمل مع أحدث نماذج الذكاء الاصطناعي التوليدي مفتوحة المصدر مثل LLaMA 3 وFalcon 2 وMistral لتطوير حلول ذات تأثير حقيقي لتطبيقات العالم الواقعي.
- تصميم وتنفيذ خطوط أنابيب سحابية لتدريب النماذج وتحسينها وخدمتها.
النشر والمراقبة والتحسين:
- نشر نماذج الذكاء الاصطناعي والتعلم الآلي في بيئات الإنتاج باستخدام خدمات AWS مثل SageMaker وInferentia وLambda، وGoogle Vertex AI.
- بناء وصيانة أنظمة مراقبة قوية باستخدام أدوات مثل CloudWatch وPrometheus لتتبع أداء الاستدلال للنماذج والتكلفة والاستخدام.
- تحسين البنية التحتية السحابية لتقليل التكاليف مع الحفاظ على الأداء العالي، من خلال استخدام تسريع GPU/TPU، والتوسع التلقائي، وتقسيم GPU.
- إنشاء عمليات لمراقبة ومعالجة القضايا مثل انحراف النماذج والثغرات الأمنية في أنظمة الذكاء الاصطناعي التوليدي.
المؤهلات المفضلة:
- خبرة تزيد عن 4 سنوات في هندسة الذكاء الاصطناعي والتعلم الآلي مع التركيز على الحلول السحابية.
- خبرة عملية في أدوات الذكاء الاصطناعي التوليدي ونماذج اللغة الكبيرة (مثل LLaMA 3 وFalcon 2 وMistral).
- خبرة في AWS Bedrock وSageMaker ومعرفة عملية بـ GCP Vertex AI.
- خبرة في العمل مع مكتبات الذكاء الاصطناعي / التعلم الآلي مفتوحة المصدر (مثل Hugging Face Transformers).
- إلمام بنشر النماذج على منصات Kubernetes وDocker والمنصات بدون خوادم.
- فهم لتحديات الذكاء الاصطناعي التوليدي الحديثة مثل هندسة الاستفسارات وخصوصية البيانات والتقليل من التحيز في النماذج.
- مهارات تحليلية وحل المشكلات قوية.
- القدرة على العمل بشكل مستقل، وإدارة عدة مشاريع، والازدهار في بيئة العمل عن بُعد.
فوائد العمل معنا:
- أجر تنافسي وساعات عمل مرنة ضمن المعايير المتفق عليها للعمل الجزئي.
- فرصة للعمل في مشاريع مبتكرة في مجال الذكاء الاصطناعي التوليدي، وحل التحديات الحقيقية باستخدام LLMs وأدوات الذكاء الاصطناعي السحابية المتقدمة.
- التعاون في بيئة فريق داعمة عن بُعد.
- البقاء في طليعة التطورات السريعة في مجال الذكاء الاصطناعي التوليدي، واكتساب خبرة عملية مع أحدث التقنيات.