Join our team at DFINITY and enjoy career benefits - Bahrain
Software Engineer - Reinforcement Learning
Employment Type: 6-Month Contract
We are looking for a Software Engineer with a focus on data preparation and AI model training. You will work on assembling, annotating, and cleaning training data, while contributing to reward modeling and supervised fine-tuning tasks.
You might thrive in this role if you:
- Have a deep understanding of machine learning and its applications.
- Have experience tuning large language models (multimodal) and building evaluations.
- Are willing to dive into large codebases to debug.
- Thrive in a dynamic and technically complex environment.
- Have a track record of delivering outside-the-box solutions to solve real-world constraints.
Responsibilities:
- Data Assembly & Annotation: Gather and annotate training data for AI models, ensuring it meets quality requirements for reward modeling and supervised fine-tuning.
- Data Cleaning & Processing: Conduct data cleaning and preprocessing to ensure models receive high-quality input.
- Model Training: Participate in training and fine-tuning models, ensuring they meet performance and accuracy standards.
- Collaboration: Work with AI engineers, data scientists, and other team members to ensure efficient workflows and data handling.
- Continuous Improvement: Support iterative improvements to models based on performance monitoring and feedback.
Requirements:
- Experience: At least 3 years in software engineering focused on AI/ML tasks.
- Data Expertise: Hands-on experience assembling, annotating, and cleaning training data for machine learning models.
- Technical Skills: Proficiency in Python and experience with AI frameworks like TensorFlow or PyTorch.
- Model Training: Familiarity with reward modeling and supervised fine-tuning techniques.
- Attention to Detail: Strong focus on data quality when handling large datasets.
Bonus Points:
- Experience with reward modeling for AI systems.
- Familiarity with data labeling tools and techniques for supervised fine-tuning.
- Knowledge of cloud platforms for AI/ML workloads.
About DFINITY and the Internet Computer:
DFINITY is a leading contributor to the Internet Computer Protocol (ICP), aiming to bring the world's compute onto the secure ICP network. Built on its unique third-generation blockchain technology, ICP enables the development of unstoppable, decentralized web applications and AI models. Through integration with Bitcoin, Ethereum, and other networks, ICP supports multi-chain operations for digital assets and web3.
Join over 250 talented professionals, including world-renowned cryptographers, distributed systems engineers, and industry leaders, in shaping the future of the internet and web3.
DFINITY was founded in 2016 by entrepreneur and crypto theoretician, Dominic Williams.
All qualified applicants will receive consideration for employment without regard to race, color, religion, gender identity, sexual orientation, national origin, genetics, disability, age, or veteran status..
Senior AI Engineer - Reinforcement Learning (Post-training)
Overview of the Role
We are seeking a highly skilled Senior AI Engineer to accelerate the deployment of improvements to our models. You will collaborate with diverse teams handling various facets of the system, including core capabilities, multimodal integration (code, text, and images), tools, and
more. This role offers a unique opportunity to shape the future of the Internet Computer, working across the technology stack, from optimizing low-level components like GPU kernels to mastering the intricacies of reinforcement learning post-training.
Responsibilities
Ownership of Post-Training Pipeline: Lead the design, implementation, and optimization of the post-training pipeline to ensure efficient model deployment and scalability.
Coordination of Data Development: Oversee the development of high-quality training datasets, including managing the creation and use of synthetic data.
Model Training: Conduct advanced model training, ensuring continuous improvement in accuracy and performance.
Collaboration: Work closely with cross-functional teams including data engineers, software engineers, and product teams to integrate AI models into production.
Performance Monitoring: Analyze and monitor the performance of models in production, iterating on training pipelines to enhance outcomes.
Requirements
Experience: Minimum 5 years of experience in AI/ML engineering with a focus on model training and deployment.
Post-Training Expertise: Demonstrated ability to build and optimize post-training pipelines at scale.
Data Coordination: Experience in managing the development and annotation of synthetic and real-world datasets.
Technical Skills: Proficiency in Python, TensorFlow/PyTorch, and experience with cloud platforms like AWS, GCP, or Azure.
Team Leadership: Proven track record of coordinating complex engineering projects with cross-functional teams.
Analytical Skills: Strong problem-solving skills with a focus on performance optimization and automation.
Bonus Points
Prior experience with distributed AI systems.
Hands-on experience with synthetic data generation and augmentation techniques.
Familiarity with tools for data pipeline automation and orchestration.
About DFINITY and the Internet Computer
DFINITY is a leading contributor to the Internet Computer Protocol (ICP), with a mission to bring the world's compute onto the secure ICP network. Built on its unique third-generation blockchain technology, ICP enables the development and operation of a new generation of unstoppable, tamper-proof, fully decentralized web applications. Its powerful technology can run entire AI models within smart contracts, representing a major advancement for secure AI. Through seamless integration with Bitcoin, Ethereum, and other networks, ICP facilitates multi-chain operations for digital assets and web3.
Join our team of over 250 talented individuals, including world-renowned cryptographers, distributed systems engineers, programming language experts, and industry leaders, who are shaping the future of the internet and web3.
DFINITY was founded in 2016 by entrepreneur and crypto theoretician, Dominic Williams.
All qualified applicants will receive consideration for employment without regard to race, color, religion, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, or veteran status.
انضم الى فريقنا فى DFINITY وتمتع بمزايا وظيفية-البحرين
مهندس برمجيات - التعلم التعزيزي
نوع التوظيف: عقد لمدة 6 أشهر
نحن نبحث عن مهندس برمجيات يركز على تحضير البيانات وتدريب نماذج الذكاء الاصطناعي. ستعمل على تجميع البيانات وتوضيحها وتنظيفها بالإضافة إلى المساهمة في نمذجة المكافآت والتدريب الموجه بالإشراف.
قد تنجح في هذا الدور إذا:
- لديك فهم عميق لـ تعلم الآلة وتطبيقاته.
- لديك خبرة في ضبط النماذج اللغوية الكبيرة (متعددة الوسائط) وبناء التقييمات.
- على استعداد للغوص في قواعد البيانات الكبيرة لإصلاح الأخطاء.
- تزدهر في بيئة تقنية معقدة وديناميكية.
- لديك سجل حافل بتقديم حلول مبتكرة خارج الصندوق للتغلب على القيود الواقعية.
المسؤوليات:
- تجميع البيانات وتوضيحها: جمع البيانات وتوضيحها للنماذج الذكية، وضمان تحقيق متطلبات الجودة من أجل نمذجة المكافآت والتدريب الموجه بالإشراف.
- تنظيف البيانات ومعالجتها: تنفيذ عمليات تنظيف البيانات ومعالجتها لضمان إدخال البيانات ذات الجودة العالية إلى النماذج.
- تدريب النماذج: المشاركة في تدريب وتعديل النماذج، وضمان توافقها مع معايير الأداء والدقة.
- التعاون: العمل مع مهندسي الذكاء الاصطناعي وعلماء البيانات وغيرهم لضمان تدفق العمل الفعال والتعامل مع البيانات.
- التحسين المستمر: دعم تحسين النماذج بناءً على مراقبة الأداء والتغذية الراجعة.
المتطلبات:
- الخبرة: 3 سنوات على الأقل في هندسة البرمجيات المركزة على مهام الذكاء الاصطناعي/تعلم الآلة.
- مهارات البيانات: خبرة عملية في تجميع وتوضيح وتنظيف البيانات المستخدمة في نماذج تعلم الآلة.
- المهارات التقنية: إتقان Python وخبرة مع أطر العمل مثل TensorFlow أو PyTorch.
- تدريب النماذج: معرفة بتقنيات نمذجة المكافآت والتدريب الموجه بالإشراف.
- الاهتمام بالتفاصيل: تركيز قوي على جودة البيانات عند التعامل مع مجموعات البيانات الكبيرة.
نقاط إضافية:
- خبرة في نمذجة المكافآت لأنظمة الذكاء الاصطناعي.
- معرفة بأدوات وضع العلامات على البيانات والتقنيات المستخدمة في التدريب الموجه بالإشراف.
- معرفة المنصات السحابية للأعمال المتعلقة بالذكاء الاصطناعي/تعلم الآلة.
عن DFINITY و Internet Computer:
DFINITY هي مساهم رئيسي في بروتوكول Internet Computer (ICP)، وتهدف إلى نقل العالم الحاسوبي إلى شبكة ICP الآمنة. بُني على تقنية البلوك تشين من الجيل الثالث الفريدة، يمكّن ICP من تطوير وتشغيل تطبيقات ويب غير قابلة للتوقف ولامركزية تمامًا، بما في ذلك نماذج الذكاء الاصطناعي. من خلال التكامل السلس مع Bitcoin وEthereum والشبكات الأخرى، يدعم ICP العمليات متعددة السلاسل للأصول الرقمية والويب 3.
انضم إلى فريق يضم أكثر من 250 محترفًا موهوبًا، بما في ذلك علماء التشفير المشهورين عالميًا، ومهندسي الأنظمة الموزعة، وخبراء لغات البرمجة، وقادة الصناعة الذين يشكلون مستقبل الإنترنت والويب 3.
تأسست DFINITY في عام 2016 على يد رائد الأعمال ونظري التشفير، دومينيك ويليامز.
ستحصل جميع الطلبات المؤهلة على اعتبار للعمل دون تمييز على أساس العرق أو اللون أو الدين أو الهوية الجندرية أو التوجه الجنسي أو الأصل القومي أو الوراثة أو الإعاقة أو العمر أو وضع المحاربين القدامى.
مهندس الذكاء الاصطناعي الأول - التعزيز التعلمي (ما بعد التدريب)
نظرة عامة على الدور
نحن نبحث عن مهندس ذكاء اصطناعي أول ذو مهارات عالية لتسريع نشر التحسينات على نماذجنا. ستتعاون مع فرق متنوعة تتعامل مع جوانب مختلفة من النظام، بما في ذلك القدرات الأساسية، والتكامل متعدد الوسائط (الكود، النص، والصور)، والأدوات، وأكثر من ذلك. يوفر هذا الدور فرصة فريدة لتشكيل مستقبل الكمبيوتر المتصل بالإنترنت، من خلال العمل عبر مجموعة التكنولوجيا، بدءًا من تحسين المكونات منخفضة المستوى مثل نوى GPU إلى إتقان تعقيدات التعزيز التعلمي ما بعد التدريب.
المسؤوليات
امتلاك خط أنابيب ما بعد التدريب: قيادة تصميم وتنفيذ وتحسين خط أنابيب ما بعد التدريب لضمان نشر النموذج بكفاءة وقابلية التوسع.
تنسيق تطوير البيانات: الإشراف على تطوير مجموعات البيانات التدريبية عالية الجودة، بما في ذلك إدارة إنشاء واستخدام البيانات الاصطناعية.
تدريب النموذج: إجراء تدريب متقدم للنماذج، مع ضمان التحسين المستمر في الدقة والأداء.
التعاون: العمل عن كثب مع الفرق متعددة التخصصات بما في ذلك مهندسي البيانات، ومهندسي البرمجيات، وفرق المنتجات لتكامل نماذج الذكاء الاصطناعي في الإنتاج.
مراقبة الأداء: تحليل ومراقبة أداء النماذج في الإنتاج، مع تعديل خطوط أنابيب التدريب لتحسين النتائج.
المتطلبات
الخبرة: خبرة لا تقل عن 5 سنوات في هندسة الذكاء الاصطناعي/تعلم الآلة مع تركيز على تدريب النماذج ونشرها.
خبرة ما بعد التدريب: القدرة المثبتة على بناء وتحسين خطوط أنابيب ما بعد التدريب على نطاق واسع.
تنسيق البيانات: خبرة في إدارة تطوير وتعليق مجموعات البيانات الاصطناعية والحقيقية.
المهارات التقنية: إتقان Python، وTensorFlow/PyTorch، وخبرة مع منصات السحابة مثل AWS، GCP، أو Azure.
قيادة الفريق: سجل مثبت في تنسيق مشاريع هندسية معقدة مع فرق متعددة التخصصات.
المهارات التحليلية: مهارات قوية في حل المشكلات مع التركيز على تحسين الأداء والأتمتة.
نقاط إضافية
خبرة سابقة في أنظمة الذكاء الاصطناعي الموزعة.
خبرة عملية في إنشاء وتكبير البيانات الاصطناعية.
معرفة بالأدوات الخاصة بأتمتة خطوط البيانات وتنظيمها.
عن DFINITY وكمبيوتر الإنترنت
DFINITY هو مساهم رائد في بروتوكول كمبيوتر الإنترنت (ICP)، مع مهمة لجلب الحوسبة العالمية إلى شبكة ICP الآمنة. يعتمد على تقنية البلوكشين الفريدة من نوعها من الجيل الثالث، يمكّن ICP تطوير وتشغيل جيل جديد من تطبيقات الويب غير القابلة للتوقف، والتي لا يمكن تغييرها، وموزعة بالكامل. يمكن لتقنيته القوية تشغيل نماذج الذكاء الاصطناعي كاملة داخل العقود الذكية، مما يمثل تقدمًا كبيرًا للذكاء الاصطناعي الآمن. من خلال التكامل السلس مع Bitcoin وEthereum وغيرها من الشبكات، يسهل ICP العمليات متعددة السلاسل للأصول الرقمية والويب 3.
انضم إلى فريقنا الذي يضم أكثر من 250 فردًا موهوبًا، بما في ذلك علماء تشفير عالميين، ومهندسي أنظمة موزعة، وخبراء في لغات البرمجة، وقادة الصناعة، الذين يشكلون مستقبل الإنترنت والويب 3.
تأسست DFINITY في عام 2016 على يد رائد الأعمال ونظرية التشفير، دومينيك ويليامز.
ستحصل جميع الطلبات المؤهلة على اعتبار للتوظيف دون تمييز على أساس العرق، أو اللون، أو الدين، أو الجنس، أو هوية أو تعبير الجنس، أو التوجه الجنسي، أو الأصل القومي، أو الجينات، أو الإعاقة، أو العمر، أو حالة المحارب.
