شركة Root Signals تقدم Root Judge لقياس موثوقية تطبيقات LLM

أعلنت شركة Root Signals، الرائدة في تقييم نماذج اللغات الكبيرة (LLM) ومراقبة جودة تطبيقات الذكاء الاصطناعي، بفخر عن إصدار Root Judge، وهو برنامج LLM رائد يضع معيارًا جديدًا لنماذج التقييم الموثوقة والقابلة للتخصيص والقابلة للنشر محليًا. تم تصميم Root Judge كإصدار مُحسَّن من Meta’s Llama-3.3-70B-Instruct، أحد أقوى نماذج الأوزان المفتوحة متوسطة الحجم.

تم تصميم Root Judge في المقام الأول ليكون بمثابة برنامج LLM-as-a-Judge، مما يتيح للمؤسسات:

  • اكتشاف الهلوسة المرتبطة بالسياق: اكتشاف الهلوسة ووصفها وحظرها تلقائيًا في خطوط أنابيب التوليد المعزز بالاسترجاع (RAG).
  • تسهيل أحكام التفضيل الزوجي: استخدم معايير قابلة للتخصيص لمهام مثل تحسين الحوسبة في وقت الاستدلال أو توليد البيانات الاصطناعية التي تتطلب قرارات الأفضل من بين N.
  • دعم النشر المرتكز على الخصوصية: تجنب إرسال البيانات الحساسة عبر الإنترنت العام مع الاستفادة من إمكانات LLM المتطورة.

أساسيات التدريب الصلبة

تم تدريب Root Judge بدقة بعد ذلك على مجموعة بيانات عالية الجودة ومُعلَّقة بشريًا، ومصممة لإصدار أحكام تفضيلية ثنائية ومهام تتبع التعليمات متعددة الأدوار مع الاستشهاد بالمصدر. باستخدام تقنيات التحسين المتقدمة، مثل تحسين التفضيل المباشر (DPO) مع فقدان تحسين تفضيلات الهوية (IPO)، خضع النموذج للتدريب على 384 وحدة معالجة رسومية AMD Radeon Instinct MI250X باستخدام الكمبيوتر الفائق LUMI.

قال بيتر سارلين، المؤسس المشارك ونائب الرئيس التنفيذي لشركة AMD Silo AI :”من خلال الحلول الخاصة بالذكاء الاصطناعي الموثوق والقابل للتفسير، تساهم Root Signals في موضوع بالغ الأهمية بالنسبة للمؤسسات. ويوضح التدريب الناجح لـ Root Judge على حاسوب LUMI العملاق قوة منصات الحوسبة من AMD وحيوية نظام الذكاء الاصطناعي في فنلندا. وهذا هو بالضبط نوع الابتكار الذي نحتاج إلى رؤيته أكثر في فنلندا وأوروبا”.

لماذا يبرز Root Judge:

  1. التميز الدقيق: كشف الهلوسة على أحدث طراز، متفوقًا على كل من نماذج الحدود ذات المصدر المغلق مثل OpenAI’s GPT-4o وo1-mini وo1-preview وAnthropic’s Sonnet-3.5 بالإضافة إلى نماذج Judge LLM مفتوحة المصدر الأخرى ذات الحجم المماثل.
  2. مخرجات قابلة للتفسير: مصممة لتوفير مبررات شفافة للتسجيل، وتعزيز الثقة في التقييمات التي يقودها الذكاء الاصطناعي.
  3. الوصول المفتوح للابتكار: من خلال الأوزان المفتوحة والتركيز على النشر المرتكز على الخصوصية، يعزز Root Judge الابتكار مع معالجة مخاوف أمن البيانات.

نموذج مصمم للمستقبل

يقول أري هيلجاكا، الرئيس التنفيذي لشركة Root Signals: “يمثل Root Judge قفزة كبيرة في كيفية تمكين المؤسسات من تقييم وتحسين أنظمة LLM الخاصة بها. وتضمن قدرتها على تقديم أحكام شفافة تستند إلى السياق أن تتمكن الشركات من نشر الذكاء الاصطناعي بشكل مسؤول وفعال، مع تحسين تكاليف الاستدلال وضمان الخصوصية”.

تتوسع تطبيقات Root Judge عبر الصناعات، مما يجعلها أداة متعددة الاستخدامات للمؤسسات والمطورين والباحثين الذين يسعون إلى الحصول على حلول ذكاء اصطناعي موثوقة ومصممة لتناسب احتياجاتهم.

التوفر

يتوفر Root Judge الآن بموجب ترخيص أوزان مفتوح، مما يسمح للمطورين والمؤسسات بدمجه وتخصيصه لتدفقات عمل التقييم الخاصة بهم. يمكن أيضًا استخدام النموذج على الفور ومقارنته بأنظمة LLM الأخرى المغلقة والمفتوحة السائدة على منصة Root Signals EvalOps التي تسمح ببناء وتحسين وإدارة طبقات القياس المخصصة المدعومة بأنظمة LLM، لمراقبة سلوكيات تطبيقات الذكاء الاصطناعي والوكلاء بدقة في الإنتاج.

لمعرفة المزيد عن Root Judge واستكشاف قدراته التحويلية، تفضل بزيارة https://www.rootsignals.ai/root-judge-llm.

Editorial Team

دليلك الى احدث اخبار ومراجعات التقنية بالعربية

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى