فائدة جديدة من Google تسرّع تشغيل Gemma 4 ثلاث مرات على الهواتف الذكية

تسريعات Google الجديدة تُسرّع تشغيل Gemma 4 على الهواتف الذكية حتى 3 أضعاف ⚙️📱

ملخص فني

أطلقت Google تقنية جديدة تسمى Multi-Token Prediction (MTP)، تُحسّن أداء نماذج الذكاء الاصطناعي من نوع Gemma 4، خصوصًا على الأجهزة المحلية مثل الهواتف الذكية. هذه التقنية تعتمد على نماذج مساعدة صغيرة تعرف باسم “drafters” تقوم بتوقع أجزاء من الطلبات النصية قبل إرسالها للنموذج الرئيسي، مما يقلل من الحاجة إلى تحميل الذاكرة بشكل متكرر ويزيد من كفاءة المعالجة. النتيجة: تسريع تشغيل Gemma 4 حتى 3 مرات، مع تحسين استخدام الموارد دون الحاجة إلى رفع قوة المعالجة أو استهلاك ذاكرة إضافي.


كيف تعمل تقنية MTP لتحسين أداء Gemma 4؟ ⚙️

تُعد Gemma 4 مجموعة من نماذج الذكاء الاصطناعي المتقدمة التي صممت خصيصًا لتعمل محليًا على الأجهزة الاستهلاكية مثل الهواتف الذكية، ما يدعم خصوصية البيانات بفضل المعالجة المحلية. لكن العمل بهذه الطريقة يصاحبه تحدي رئيسي: استهلاك موارد الأجهزة مثل المعالج والذاكرة بشكل كبير، ما يبطئ سرعة الاستجابة.

لتخطي هذا الحاجز، قدمت Google تقنية Multi-Token Prediction التي تعتمد على “نماذج مساعدة” أو drafters. هذه النماذج المساعدة أصغر حجمًا وهي تعمل بالتوازي مع النموذج الرئيسي. تقوم drafters بتوقع الكلمات أو الجمل التالية في الطلب النصي قبل أن تتم معالجتها بالكامل بواسطة Gemma 4.

آلية العمل بتقنية MTP

  • يقوم drafter بتوليد مجموعة من الكلمات المتوقعة ضمن الطلب النصي التالي.
  • في الوقت ذاته، تتحقق Gemma 4 من صحة هذه التوقعات.
  • إذا كانت التوقعات صحيحة، يتقدم النظام مباشرةً إلى معالجة المجموعات التالية.
  • إذا وجد جزء غير صحيح، تستبدل Google الكلمات الخاطئة دون الحاجة لإعادة معالجة كل النص.

تُعرف هذه الطريقة بـ Speculative Decoding أي “فك التشفير التكهنّي”، وهي تحول طريقة المعالجة من التتابع التقليدي إلى معالجة متوازية ذكية، تُرجع نتائج أسرع.


✨ لماذا تجعل MTP Gemma 4 أسرع 3 مرات؟

مصدر البطء ليس دائمًا وحدات المعالجة (CPU أو GPU)، بل غالبًا يتمثل في عرض النطاق الترددي للذاكرة (Memory Bandwidth) كذاكرة الوصول العشوائي للفيديو (VRAM). لأن كل كلمة أو جزء من الطلب يُتطلب تحميله من الذاكرة إلى النموذج، وبذلك تستغرق العملية وقتًا كبيرًا.

من خلال دمج عدة كلمات في “كتلة” واحدة متوقعة في كل مرة، يُقلل النموذج حاجة المعالجة إلى استدعاء النموذج عدة مرات منفصلة لكل كلمة. وبدلًا من ذلك تتم معالجة كل كتلة دفعة واحدة، مما يقلل من العمليات على الذاكرة وينقل العبء إلى وحدة المعالجة بشكل أكثر كفاءة.


خلاصة سريعة:
نقل العبء من الذاكرة إلى المعالج عن طريق التنبؤ المتقدم يجعل النماذج تعمل بشكل أسرع مع استهلاك موارد أقل.


تأثير MTP على تجربة استخدام الذكاء الاصطناعي في الهواتف الذكية 📱🧠

تشغيل نماذج الذكاء الاصطناعي الثقيلة مثل Gemma 4 على الهواتف الذكية يُعد تحديًا كبيرًا. فمعالجة هذه النماذج محليًا تعني سرية بيانات أكبر، لكنها قد تؤدي إلى تقليل سرعة الإجابة وتجربة المستخدم. تقنية MTP تدفع بالحدود إلى الأمام من خلال:

  • زيادة سرعة الاستجابة بنسبة تصل إلى 3 أضعاف.
  • تحسين كفاءة استهلاك الذاكرة وتقليل الضغط على VRAM.
  • العمل بكفاءة أعلى على شرائح الهواتف المختلفة بما في ذلك معالجات متخصصة مثل Apple Silicon.
  • دعم التكامل مع منصات وأدوات متنوعة مثل HuggingFace، Kaggle، Ollama، فضلاً عن متجر Google للذكاء الاصطناعي على Android وiOS.

وبذلك، لا تقتصر فوائد MTP على التسريع فقط، بل تُسهل أيضًا وجود حلول AI قوية تعمل بسلاسة على الأجهزة المختلفة.


لماذا هذا مهم؟
تمكين نماذج الذكاء الاصطناعي على الأجهزة المحلية يحقق توازنًا بين الخصوصية وسرعة المعالجة، مما يعزز تجربة المستخدم ويجعل تقنيات الذكاء الاصطناعي الأكثر تقدمًا متاحة دون الحاجة للاتصال الدائم بالسيرفرات الخارجية.


دعم الأجهزة المختلفة – خطوة نحو تجربة مخصصة ومتنوعة ⚡

تؤكد Google على تطوير نسخ من نماذج Gemma 4 بحجوم مختلفة لتتلاءم مع قدرات أنواع مختلفة من الأجهزة. وهي تخطط لتحسين أداء هذه النماذج على شرائح ذات قدرات مميزة مثل:

  • Apple Silicon التي تتميز بقدرات متقدمة في تحليل البيانات والرسومات.
  • Nvidia A100، منصة معالجة متخصصة تدعم مهام الذكاء الاصطناعي المعقدة.

هذا التوجه يشير إلى رغبة Google في توسيع قاعدة الأجهزة التي تستفيد من Gemma 4 وتقنياتها الجديدة، ليشمل ذلك الهواتف الذكية بجميع قدراتها وأجهزة الكمبيوتر المحمولة والخوادم الصغيرة.


نقطة مهمة:
تكييف نماذج AI مع نوع العتاد المتوفر هو مفتاح لتحقيق أفضل توازن بين الأداء واستهلاك الطاقة، خصوصًا في عالم الهواتف الذكية.


كيف تستخدم تقنية MTP وGemma 4؟

توفر Google نماذج Gemma 4 مع تقنية MTP كخدمة للمطورين والمستخدمين عبر منصات متعددة، مما يتيح لهم الاستفادة من الذكاء الاصطناعي المتقدم على هواتفهم أو أجهزتهم الشخصية:

  • تشغيل النماذج عبر مكتبات متاحة على منصات مثل HuggingFace و Kaggle.
  • استخدام أدوات مثل Ollama التي تسهل تنفيذ وتحليل النماذج محليًا.
  • توفير النماذج من خلال متجر Google AI Edge Gallery لمستخدمي أجهزة Android وiOS.

وهذا يفتح الباب أمام المزيد من التطبيقات العملية التي تعتمد على الذكاء الاصطناعي، بدءًا من المساعدات الذكية إلى تحليل النصوص والترجمة الآنية، دون الحاجة للاتصال المستمر بالسحابة.


ما الذي تغيّر هنا؟
لم يعد الذكاء الاصطناعي يتطلب اتصالًا دائمًا بالسيرفرات أو الحوسبة السحابية الثقيلة. الذكاء AI أصبح بالفعل جزءًا فعالًا من تجربة الهواتف من خلال تقنيات تسريع محلية ذكية.


خاتمة: نحو مستقبل أسرع وأكثر كفاءة للذكاء الاصطناعي على الأجهزة المحمولة

تطور Google بتقديم تقنية MTP لمساعدة Gemma 4 يعتبر ثورة هادئة في عالم الذكاء الاصطناعي على الهواتف الذكية. بدلاً من الاعتماد الكامل على الحوسبة السحابية، تعمل هذه التقنية على تحسين الأداء والكفاءة محليًا، مما يضمن إجابات أسرع وتجربة استخدام أكثر سلاسة.

يُعد هذا التقدم خطوة مهمة في دمج الذكاء الاصطناعي ضمن الحياة اليومية بأقل تكلفة من حيث استهلاك الطاقة وسعة التخزين والذاكرة. كما أنه يعزز خصوصية المستخدمين من خلال المعالجة المحلية للبيانات.

التقنيات مثل Multi-Token Prediction تفتح آفاقًا جديدة تمكن الأجهزة المحمولة من معالجة المهام المعقدة، وتضعنا على الطريق نحو هواتف أذكى قادرة على التعامل مع تحديات الذكاء الاصطناعي بذكاء وكفاءة.


استمروا في متابعة تطورات الذكاء الاصطناعي والهواتف الذكية، حيث تواصل الابتكارات التقنية إعادة تعريف تجربة المستخدم وعلاقاتنا مع التكنولوجيا.

Related Articles

[td_block_social_counter style="style8 td-social-boxed td-social-font-icons" tdc_css="eyJhbGwiOnsibWFyZ2luLWJvdHRvbSI6IjM4IiwiZGlzcGxheSI6IiJ9LCJwb3J0cmFpdCI6eyJtYXJnaW4tYm90dG9tIjoiMzAiLCJkaXNwbGF5IjoiIn0sInBvcnRyYWl0X21heF93aWR0aCI6MTAxOCwicG9ydHJhaXRfbWluX3dpZHRoIjo3Njh9" custom_title="Stay Connected" block_template_id="td_block_template_8" f_header_font_family="712" f_header_font_transform="uppercase" f_header_font_weight="500" f_header_font_size="17" border_color="#dd3333" facebook="engmohdbali" youtube="mohdbali" instagram="ARCH3000" manual_count_instagram="1700" manual_count_youtube="11000"]

Latest Articles