Company DFINITY opens its doors to those interested in obtaining exceptional job opportunities in Bahrain
If you are interested, check out the following details:
↔
Vacant Positions:
Software Engineer - Reinforcement Learning
Responsibilities
- Data Assembly & Annotation: Gather and annotate training data for AI models, ensuring it meets the quality requirements for reward modeling and supervised fine-tuning.
- Data Cleaning & Processing: Conduct data cleaning and preprocessing to ensure models receive high-quality input.
- Model Training: Participate in the training and fine-tuning of models, ensuring that they meet performance and accuracy standards.
- Collaboration: Work with AI engineers, data scientists, and other team members to ensure efficient workflows and data handling.
- Continuous Improvement: Support iterative improvements to models based on performance monitoring and feedback.
Senior ML Engineer - LLM Post-training
Key Responsibilities:
- Content Creation and Curation: Develop, refine, and curate high-quality content (code, text, prompts, dialogues, scenarios) for use in the post-training of large language models optimized for code generation.
- Fine-tuning Data: Design datasets for tasks such as instruction following, question answering, reasoning, conversational models, etc., to improve model accuracy, robustness, and generalization.
- Post-training Optimization: Collaborate with ML engineers to integrate the curated content into fine-tuning pipelines, ensuring that models are tailored to specific use cases.
- Evaluation and Benchmarking: Create scenarios to evaluate LLM performance and establish benchmarks for targeted improvements in different areas such as comprehension, creativity, factuality, and bias reduction.
- Feedback Loop Development: Set up human-in-the-loop feedback systems for continuous model improvement, and work closely with annotators or SMEs to enhance dataset quality.
- Data Quality Control: Monitor data quality, diversity, and relevance; identify and resolve gaps or biases in the training data.
- Collaboration: Work with cross-functional teams including product managers, data scientists, and engineers to align post-training content with business goals and technical requirements.
- Documentation: Write and maintain clear and detailed documentation on content curation methodologies, dataset specifications, and post-training processes.
Application Steps:
- Open the application link
- Browse the available jobs and select the one that suits you.
- Click on "Apply Now" and enter the required informatiشon.
- Ensure that your details are entered correctly, then click "Submit".
Additional Details:
- Source: linked in
- Posting Date: 13/11/2024
- Required Nationalities:
- Required Nationalities: All nationalities
شركة DFINITY تفتح أبوابها للراغبين في الحصول على فرص عمل مميزة في البحرين
إذا كنت مهتمًا، فراجع التفاصيل التالية:
الوظائف الشاغرة:
مهندس برمجيات - التعلم المعزز
المسؤوليات
- تجميع البيانات والتعليق عليها: جمع بيانات التدريب وتعليقها على نماذج الذكاء الاصطناعي، والتأكد من أنها تلبي متطلبات الجودة لنمذجة المكافآت والضبط الدقيق الخاضع للإشراف.
- تنظيف البيانات ومعالجتها: قم بإجراء تنظيف البيانات ومعالجتها المسبقة لضمان حصول النماذج على مدخلات عالية الجودة.
- تدريب النماذج: المشاركة في تدريب النماذج وضبطها، والتأكد من أنها تلبي معايير الأداء والدقة.
- التعاون: العمل مع مهندسي الذكاء الاصطناعي وعلماء البيانات وأعضاء الفريق الآخرين لضمان سير العمل والتعامل مع البيانات بكفاءة.
- التحسين المستمر: دعم التحسينات التكرارية للنماذج استنادًا إلى مراقبة الأداء وردود الفعل.
مهندس ML كبير - ماجستير في القانون بعد التدريب
المسؤوليات الرئيسية:
- إنشاء المحتوى وتنظيمه: تطوير وتحسين وتنظيم المحتوى عالي الجودة (الكود والنص والمطالبات والحوارات والسيناريوهات) لاستخدامه في مرحلة ما بعد التدريب لنماذج اللغة الكبيرة المُحسّنة لتوليد الكود.
- ضبط البيانات بدقة: تصميم مجموعات البيانات للمهام مثل متابعة التعليمات، والإجابة على الأسئلة، والاستدلال، ونماذج المحادثة، وما إلى ذلك، لتحسين دقة النموذج، وقوته، وتعميمه.
- تحسين ما بعد التدريب: التعاون مع مهندسي التعلم الآلي لدمج المحتوى المنسق في خطوط الأنابيب الدقيقة، مما يضمن تخصيص النماذج لحالات الاستخدام المحددة.
- التقييم والمقارنة: إنشاء سيناريوهات لتقييم أداء الماجستير في القانون وإنشاء معايير للتحسينات المستهدفة في مجالات مختلفة مثل الفهم والإبداع والواقعية والحد من التحيز.
- تطوير حلقة التغذية الراجعة: إعداد أنظمة تغذية راجعة بشرية لتحسين النموذج بشكل مستمر، والعمل بشكل وثيق مع المعلقين أو المتخصصين في المجال لتحسين جودة مجموعة البيانات.
- مراقبة جودة البيانات: مراقبة جودة البيانات وتنوعها وأهميتها؛ تحديد الفجوات أو التحيزات في بيانات التدريب وحلها.
- التعاون: العمل مع فرق متعددة الوظائف بما في ذلك مديري المنتجات وعلماء البيانات والمهندسين لمواءمة محتوى ما بعد التدريب مع أهداف العمل والمتطلبات الفنية.
- التوثيق: كتابة وصيانة توثيق واضح ومفصل لمنهجيات تنظيم المحتوى ومواصفات مجموعة البيانات وعمليات ما بعد التدريب.
خطوات التقديم:
- افتح رابط التطبيق
- تصفح الوظائف المتاحة واختر الوظيفة التي تناسبك.
- انقر فوق "تقدم الآن" وأدخل المعلومات المطلوبة.
- تأكد من إدخال تفاصيلك بشكل صحيح، ثم انقر فوق "إرسال".
تفاصيل إضافية:
- المصدر: linked in
- تاريخ النشر: 13/11/2024
- الجنسيات المطلوبة:
- الجنسيات المطلوبة: جميع الجنسيات
