Overview
- Our client is a leading Conversational AI start-up revolutionizing the customer service and sales industry. Their authentic Generative AI sales agent has commanded significant interest globally.
- In this role you will work closely with their engineers and product team to optimize their conversational agent's speech recognition and synthesis capabilities. The role will largely focus, not just on Text-to-Speech capabilities, but on Speech-to-Speech capabilities, ML models generally and working with LLM's.
Job Responsibilities:
- Conduct research to advance their conversational agent's speech recognition accuracy, particularly for challenging accents and noisy environments
- Improve their text-to-speech and speech-to-speech engine to produce more natural sounding voices that match their clients brand persona's
- Design and run experiments to collect diverse speech data sets for training their models
- Publish papers to share your work with the larger speech technology community
- Collaborate with other scientists and engineers to develop ML models.
- Ensure models and the overall inference pipelines run efficiently on Cloud
Requirements:
- PhD in Computer Science, Linguistics, Electrical Engineering or related field
- 3+ years experience as a speech scientist/researcher, with demonstrated contributions to the field
- Strong publication record in top speech technology conferences (e.g. Interspeech, ICASSP)
- Experience applying machine learning techniques like deep neural networks to speech tasks
- Excellent coding skills, particularly in Python/PyTorch
- Experience in deep learning techniques, especially sequence-to-sequence models, encoder/decoder, VQ-VAE, GAN.
- Experience with speech corpora, forced aligners, and common speech processing tools
- Knowledge of linguistics and phonetics
- Passion for advancing speech technology and its applications
Bonus Qualifications:
- Previously done research or been associated with technology institutes like The Centre of Speech Technology Research at the University of Edinburgh or spent time working at a top Speech AI start-up previously
Benefits and Perks:
- Highly competitive compensation package with salary and equity options.
- Comprehensive health, dental, and vision insurance plans.
- 401(k) retirement plan with company matching.
apply now
ملخص
- عميلنا هو شركة ناشئة رائدة في مجال الذكاء الاصطناعي للمحادثة تُحدث ثورة في خدمة العملاء وصناعة المبيعات. لقد حظي وكيل مبيعات Geneative AI الأصلي الخاص بهم باهتمام كبير على مستوى العالم.
- في هذا الدور، ستعمل بشكل وثيق مع المهندسين وفريق المنتج لتحسين قدرات التعرف على الكلام والتوليف الخاصة بوكيل المحادثة. سيركز الدور إلى حد كبير، ليس فقط على إمكانات تحويل النص إلى كلام، ولكن على إمكانات تحويل الكلام إلى كلام، ونماذج ML بشكل عام والعمل مع LLM.
مسؤوليات العمل:
- قم بإجراء بحث لتحسين دقة التعرف على الكلام لدى وكيل المحادثة، خاصة بالنسبة لللكنات الصعبة والبيئات الصاخبة
- تحسين محرك تحويل النص إلى كلام وتحويل الكلام إلى كلام لإنتاج أصوات أكثر طبيعية تتوافق مع شخصية العلامة التجارية لعملائهم
- تصميم وتنفيذ تجارب لجمع مجموعات بيانات الكلام المتنوعة لتدريب نماذجهم
- انشر الأبحاث لمشاركة عملك مع مجتمع تكنولوجيا الكلام الأكبر
- التعاون مع العلماء والمهندسين الآخرين لتطوير نماذج تعلم الآلة.
- تأكد من تشغيل النماذج ومسارات الاستدلال الشاملة بكفاءة على السحابة
متطلبات:
- دكتوراه في علوم الكمبيوتر أو اللغويات أو الهندسة الكهربائية أو مجال ذي صلة
- أكثر من 3 سنوات من الخبرة كعالم/باحث في مجال النطق، مع مساهمات مثبتة في هذا المجال
- سجل نشر قوي في أهم مؤتمرات تكنولوجيا الكلام (مثل Interspeech وICASSP)
- تجربة تطبيق تقنيات التعلم الآلي مثل الشبكات العصبية العميقة على مهام الكلام
- مهارات ترميز ممتازة، خاصة في Python/PyTorch
- خبرة في تقنيات التعلم العميق، وخاصة نماذج التسلسل إلى التسلسل، والتشفير/وحدة فك التشفير، وVQ-VAE، وGAN.
- خبرة في التعامل مع مجاميع الكلام، والمصففات القسرية، وأدوات معالجة الكلام الشائعة
- معرفة اللغويات والصوتيات
- شغف بتطوير تكنولوجيا الكلام وتطبيقاتها
مؤهلات المكافأة:
- سبق أن أجريت بحثًا أو ارتبطت بمعاهد التكنولوجيا مثل مركز أبحاث تكنولوجيا الكلام في جامعة إدنبره أو قضيت وقتًا في العمل في إحدى الشركات الناشئة الرائدة في مجال الذكاء الاصطناعي للكلام سابقًا
الفوائد والامتيازات:
- حزمة تعويضات تنافسية للغاية مع خيارات الرواتب والأسهم.
- خطط تأمين شاملة للصحة وطب الأسنان والرؤية.
- 401 (ك) خطة التقاعد مع مطابقة الشركة
