
Your main tasks will be:
- Create a co-pilot system for our text services;
- Conduct data research and implement the results into production;
- Define the design of experiments to validate models via A/B test;
- Improve the current infrastructure for working with data and models.
We expect from you:
- Chat-bot creation experience based on product description;
- Experience creating datasets for chat-bots;
- Fine-tuning LLM on dataset;
- Experience creating a training pipeline for LLM using a different kind of datasets;
- Experience in inference LLM in the production;
- Experience with vLLM, OpenLLM, HuggingFace LLM framework;
- Good knowledge of QLoRA and LoRA training frameworks;
- Proficiency in quantisation methodology for training and inference;
- Distributed training experience;
- Fluent English & Russian.
Nice to have:
- Experience RL for chat-bots.
What do we offer:
REMOTE OPPORTUNITY to work full time from any location;
- 7 wellness days per year (time off) that can be used to deal with household issues, to lie down and recover without taking sick leave;
- Bonuses up to $5000 for recommending successful applicants for positions in the company;
- Full payment for professional training, international conferences and meetings;
- Corporate discount for English lessons;
- Health benefits. If you are not eligible for Corporate Medical Insurance, the company will compensate up to $1000 gross per year per employee according to the paychecks. This can be spent on self-purchase of health insurance, or on doctor’s fees for yourself and close relatives (spouse, children);
- Workplace organization. The company provides all employees with an equipped workplace and all the necessary equipment (table, armchair, wifi, etc.) in the locations where we have offices or co-working. In the other locations, the company provides reimbursement of workplace costs up to $ 1000 gross once every 3 years according to the paychecks. This money can be spent on the rent of the co-working room, on equipping the working place at home (desk, chair, Internet, etc.) during those 3 years;
- Internal gamified gratitude system: receive bonuses from colleagues and exchange them for time off, merch, team building activities, massage certificates, etc.
To contact and send your CV, click on the link below
ستكون مهامك الرئيسية هي:
- إنشاء نظام تجريبي مساعد لخدماتنا النصية؛
- إجراء أبحاث البيانات وتنفيذ النتائج في الإنتاج؛
- تحديد تصميم التجارب للتحقق من صحة النماذج عبر اختبار أ/ب؛
- تحسين البنية التحتية الحالية للعمل مع البيانات والنماذج.
نتوقع منك:
- تجربة إنشاء روبوت الدردشة بناءً على وصف المنتج؛
- تجربة إنشاء مجموعات بيانات لروبوتات الدردشة.
- ضبط LLM على مجموعة البيانات؛
- تجربة إنشاء مسار تدريب لـ LLM باستخدام نوع مختلف من مجموعات البيانات؛
- خبرة في الاستدلال LLM في الإنتاج؛
- تجربة مع إطار عمل vLLM وOpenLLM وHuggingFace LLM؛
- معرفة جيدة بأطر التدريب QLoRA وLoRA؛
- الكفاءة في منهجية القياس للتدريب والاستدلال.
- الخبرة التدريبية الموزعة؛
- يجيد اللغة الإنجليزية والروسية.
من الجميل أن يكون لديك:
- تجربة ce RL لروبوتات الدردشة.
ماذا نقدم:
فرصة بعيدة للعمل بدوام كامل من أي مكان؛
- 7 أيام عافية سنويًا (إجازة) يمكن استخدامها للتعامل مع المشكلات المنزلية والاستلقاء والتعافي دون أخذ إجازة مرضية؛
- مكافآت تصل إلى 5000 دولار للتوصية بالمتقدمين الناجحين لشغل مناصب في الشركة؛
- الدفع الكامل للتدريب المهني والمؤتمرات والاجتماعات الدولية؛
- خصم الشركات لدروس اللغة الإنجليزية؛
- الفوائد الصحية. إذا لم تكن مؤهلاً للحصول على التأمين الطبي للشركات، فستقوم الشركة بتعويض ما يصل إلى 1000 دولار إجمالي سنويًا لكل موظف وفقًا لشيكات الراتب. يمكن إنفاق هذا على الشراء الذاتي للتأمين الصحي، أو على رسوم الطبيب لك ولأقاربك المقربين (الزوج، الأطفال)؛
- تنظيم مكان العمل. توفر الشركة لجميع الموظفين مكان عمل مجهزًا وجميع المعدات اللازمة (طاولة، كرسي بذراعين، واي فاي، إلخ) في المواقع التي لدينا فيها مكاتب أو أماكن عمل مشتركة. وفي المواقع الأخرى، توفر الشركة تعويضًا عن تكاليف مكان العمل بما يصل إلى 1000 دولار إجماليًا مرة واحدة كل 3 سنوات وفقًا لشيكات الراتب. يمكن إنفاق هذه الأموال على إيجار غرفة العمل المشتركة، وعلى تجهيز مكان العمل في المنزل (مكتب، كرسي، إنترنت، إلخ) خلال تلك السنوات الثلاث؛
- نظام الامتنان الداخلي القائم على الألعاب: احصل على مكافآت من الزملاء واستبدلها بإجازة، أو سلع، أو أنشطة بناء الفريق، أو شهادات التدليك، وما إلى ذلك.