כדי לראות תפקידים מתאימים עליך להוסיף כישורים בפרופיל האישי במערכת COB.
ההרשמה והשימוש חינם!
מעולה, רוצה להירשם

ML Engineer – AI Infra Group

מלאה
אזור מרכז - גוש דןחולון / בת יםפתח תקווהראשון לציוןתל אביב
NLP/Machine Learning|תוכנה
אזור מרכז - גוש דןחולון / בת יםפתח תקווהראשון לציוןתל אביב
מלאה
פורסם לפני 2 חודשים
פורסמה ברשת
Required ML Engineer – AI Infra Group
Tel Aviv Full-time
We are on an expedition to find you, someone who is passionate about creating intuitive, out-of-this-world production-grade AI infrastructure. This group builds scalable, high-performance AI systems for internal users and external customers, designed to run seamlessly across cloud and on-premise environments using the latest hardware advancements.
Responsibilities
Design and optimize LLM serving infrastructure using inference engines (vLLM, TensorRT-LLM, Triton Inference Server)
Implement and tune distributed inference strategies including tensor parallelism, pipeline parallelism, and multi-node serving
Develop and apply model compression techniques to optimize cost, latency, and memory footprint while maintaining model quality
Build self-service fine-tuning platforms that enable data scientists to run experiments (LoRA, QLoRA, full fine-tuning) in a standardized, reproducible, and governed manner
Optimize inference performance through batching strategies, KV-cache tuning, and speculative decoding
Develop reusable APIs, abstractions, and platform services for model deployment, scaling, and lifecycle management
Collaborate with AI researchers and product teams to productionize models and meet latency/throughput requirements
Evaluate and benchmark new model architectures, compression methods, and serving frameworks.

Requirements:
5+ years of experience in software engineering or ml engineering with significant focus on ML systems or backend infrastructure
Strong proficiency in Python and deep learning frameworks (PyTorch)
Hands-on experience with LLM inference engines (vLLM, TensorRT-LLM, Triton Inference Server)
Deep understanding of transformer architectures and LLM-specific optimizations (attention mechanisms, KV-cache, quantization techniques like GPTQ, AWQ, GGUF)
Experience with distributed training/fine-tuning frameworks (Ray, DeepSpeed, FSDP)
Ability to build developer-facing tools and platforms with clear APIs and documentation
Understanding of GPU performance profiling and optimization
Familiarity with LLM evaluation methodologies and benchmarking.

This position is open to all candidates.
מידת ההתאמה שלי לתפקיד
התאמה למשרה
התאמתך לתפקיד מחושבת על פי כישורך (כפי שסיפרת לנו עליהם) מול דרישות המעסיק - אין בכך כדי להעיד על קבלתך לעבודה (זה יחליט המעסיק)
משרות חדשות במערכת שיכולות לעניין אותך
היברידי
קיסריה
פורסם לפני 3 שבועות
What Youll Do Own the full lifecycle of AI and computer vision systems, from model integration to scalable, production deployment. ...
מלאה
פורסם לפני 3 שבועות
We are seeking a skilled software engineer to join our NPU software stack development team. This role involves developing high-performance ...
מלאה
פורסם לפני 3 שבועות
We are seeking an experienced technical leader to head our collective communication library development team. This role involves leading a ...
מלאה
פורסם לפני 4 שבועות
Were looking for product-minded engineers who are excited about developer tools, to help us quickly define and ship IDE experiences ...
מלאה
פורסם לפני 4 שבועות
Were looking for product-minded engineers who are excited about developer tools, to help us quickly define and ship IDE experiences ...
מלאה
פורסם לפני 4 שבועות
As a Software Engineer on the IDE Integrations team, youll help bring Datadogs observability and AI capabilities directly into developers ...
מלאה
הוד השרוןחיפה
פורסם לפני 4 שבועות
Our team at the Huawei Computing Network Innovation Lab is looking for exceptional talent to join us and lead the ...
מלאה
פורסם לפני 4 שבועות
We are looking for a highly skilled AI Engineer with a strong engineering mindset to bridge the gap between research ...
מלאה
רעננה
פורסם לפני 4 שבועות
In one sentenceJoin our companys GenAI & Data unit as a Lead Data Scientist and shape the future of AI ...
מלאה
חיפה
פורסם לפני 4 שבועות
As an ML Software Engineer with a focus on low-level and CUDA-based optimizations, you will play a key role in ...
מלאה
פורסם לפני 4 שבועות
we are a global leader in control systems for quantum computing-a field on the verge of exponential growth.Our innovative hardware ...
מלאה
פורסם לפני חודש 1
We seek a strong, motivated, and highly technical researcher who can be part of the Innovation & Research team. With ...
מלאה
פורסם לפני 2 חודשים
We are growing, and we're looking for a passionate, curious AI Adoption Specialist to join our R&D team!We are a ...
מלאה
אזור מרכז - גוש דןתל אביב
פורסם לפני 2 חודשים
Required AI/ML Engineer AI Foundations GroupTel Aviv Full-timeAbout The PositionOur AI cybersecurity platform applies a new, out-of-the-ordinary, multi-layered approach, covering ...
מלאה
פורסם לפני 2 חודשים
Our team is looking for a Deep Learning Engineer.Role and Responsibilities:Develop Large Language Models as part of our applied research ...
הצגת משרות נוספות
שימו לב: זה טווח השכר הממוצע לסוג תפקיד בשוק רק המעסיק יקבע את השכר בפועל.
עדכון הכישורים שלך
להלן הכישורים הקיימים בפרופיל שלך. מומלץ להוסיף כישורים אשר דרושים למשרה או כישורים שלהערכתך רלוונטים לתפקיד.