تخطّي إلى المحتوى
الذكاء الاصطناعي
العودة إلى الكتابات الذكاء الاصطناعي

الذكاء الاصطناعي المحلي للمبتدئين: من أين تبدأ؟

دليل مبتدئين للنماذج المحلية: Ollama وLM Studio، GGUF (صيغة ملف موحّدة) وMLX (إطار Apple)، ضغط Q4/Q8، تشغيل GPU (المعالج الرسومي) على Mac، وأي نماذج تثبّت أولًا.

ابدأ من هنا

تشغيل نموذج لغة على جهازك يبدو تقنيًا، لكنه أبسط مما تظن. تحتاج إلى ثلاث قرارات: أي تطبيق تستخدم، أي ملف نموذج تنزّل، وهل ذاكرة جهازك كافية لتشغيله براحة.

هذا الدليل للمبتدئين — لمن فتح LM Studio ورأى عشرات إصدارات نفس النموذج وتساءل: ماذا تعني GGUF (اختصار GPT-Generated Unified Format — صيغة ملف موحّدة) وMLX (إطار تعلم الآلة من Apple) وQ4 (ضغط 4 بت) و«Full GPU Offload» (تشغيل النموذج بالكامل على المعالج الرسومي)؟ في النهاية ستعرف ماذا تثبّت أولًا وماذا تتجاهل.

ماذا يعني «نموذج لغة محلي»؟

النموذج المحلي هو نموذج LLM (Large Language Model — نموذج لغة كبير) يعمل على حاسوبك بدل خدمة سحابية مثل ChatGPT. تنزّل النموذج مرة واحدة، ثم تتحدث معه حتى بدون إنترنت. أسئلتك تبقى على جهازك ما لم تُرِد إرسالها.

تطبيقان مجانيان هما الأشهر في هذا المجال: LM Studio (تطبيق سطح مكتب سهل) وOllama (محرك خفيف مع واجهة APIApplication Programming Interface — مدمجة). غالبًا يشغّلان نفس ملفات النماذج. الفرق في طريقة العمل، لا في «جودة سحرية» مختلفة.

الخطوة 1 — اختر أول أداة

إذا كانت هذه أول تجربة لك: ابدأ بـ LM Studio. نزّل التطبيق، تصفّح النماذج بصريًا، اضغط تنزيل، وابدأ المحادثة — دون سطر أوامر.

عندما تحتاج الربط مع برامج أخرى: ثبّت Ollama. يبرز عندما تحتاج Open WebUI أو مساعد برمجة أو سكربتات إلى API (Application Programming Interface — واجهة برمجة تطبيقات) محلي ثابت على المنفذ 11434.

كثير من المستخدمين ذوي الخبرة يبقون على الاثنين: LM Studio للاستكشاف، وOllama للاستخدام اليومي والربط. هذا طبيعي — ليس فشلًا في الاختيار.

الخطوة 2 — افهم اسم النموذج (بدون توتر)

صفحات النماذج تعرض إصدارات كثيرة لنفس «العقل». الاسم يخبرك بأمرين: عائلة النموذج، ومدى ضغط الملف.

GGUF — صيغة ملف موحّدة (GPT-Generated Unified Format)

GGUF اختصار لـ GPT-Generated Unified Format — أي صيغة ملف موحّدة لتشغيل النماذج عبر llama.cpp (ما يستخدمه Ollama وLM Studio غالبًا). عندما ترى GGUF، فكّر: «يعمل في كل مكان — خيار آمن للبداية».

MLX — إطار Apple لتعلم الآلة (Machine Learning Framework)

MLX هو إطار تعلم آلة مفتوح المصدر من Apple لمعالجات Apple Silicon. إصدارات MLX مُحسَّنة لـ Mac بمعالج M. قد تكون سريعة جدًا داخل LM Studio، لكن بيئة Ollama ومعظم الأدوات الخارجية تتوقع GGUF. ابدأ بـ GGUF ما لم تكن تجرب داخل LM Studio فقط.

الضغط — Q4 وQ8 وbf16 (4 بت، 8 بت، 16 بت)

  • Q4_K_M — غالبًا «Q4»، أي ضغط 4 بت — ملف أصغر، ذاكرة أقل، جودة أقل قليلًا. أفضل افتراضي لمعظم الناس.
  • Q8_0 (ضغط 8 بت) — ملف أكبر، جودة أعلى، أبطأ. لمن لديه ذاكرة فائضة.
  • bf16 (Brain Float 16 — أعداد عشرية 16 بت) — الأكبر والأبطأ. تجنّبه حتى تعرف أنك تحتاجه.
  • MoE (Mixture of Experts — مزيج خبراء) مثل A3B — النموذج كبير نظريًا لكن جزءًا منه فقط يعمل مع كل كلمة، فيعطي ذكاءً أفضل دون ذاكرة 70B كاملة.

لا تحتاج كل الإصدارات. اختر ملف Q4 واحد لكل غرض واكتفِ.

الخطوة 3 — هل يعمل على Mac الخاص بي؟

على Apple Silicon، المعالج وGPU (Graphics Processing Unit — المعالج الرسومي) يشاركان نفس الذاكرة («ذاكرة موحّدة»). LM Studio يعرض شارة خضراء «Full GPU Offload Possible» عندما يتوقع أن النموذج مع سياق المحادثة يتسع. الشارة تقدير مفيد — وليست ضمانًا.

قاعدة بسيطة لـ Mac بـ 3264 جيجابايت: النماذج المضغوطة حتى نحو 3035 جيجابايت على القرص غالبًا تعمل براحة. إصدارات bf16 والسياق الطويل جدًا (128K+) تستهلك الذاكرة بسرعة.

  • تحقق من الذاكرة: قائمة Apple ← حول هذا Mac، أو نفّذ system_profiler SPHardwareDataType في Terminal.
  • ابدأ بضغط Q4 — الأنسب للمبتدئين.
  • بعد تحميل النموذج، افتح Activity Monitor ← GPU. إذا ظهر نشاط GPU والجهاز سلس، فأنت على خير.
  • إذا ارتفع صوت المروحة وتقطّع الجهاز، جرّب نموذجًا أصغر أو ضغطًا أقوى (Q4 بدل Q8).

على Intel Mac أو PC ببطاقة NVIDIA، نفس المنطق: اجعل النموذج يتسع في VRAM (Video RAM — ذاكرة البطاقة الرسومية) أو RAM، ابدأ بـ Q4، ثم ارتقِ عند الحاجة.

الخطوة 4 — ثلاثة نماذج لا ثلاثين

صفحات LM Studio تعرض عشرات إصدارات Qwen وGemma وMistral. هذه قائمة للاختيار — وليست قائمة تسوق. مجموعة بداية عملية إذا لديك Mac حديث بـ 32 جيجابايت فأكثر (مع 16 جيجابايت، التزم بنماذج 7B14B):

# للاستخدام اليومي — توازن جودة/حجم (MoE)
ollama pull qwen3.6:35b-a3b-q4_K_M

# للبرمجة والمهام المنظمة
ollama pull qwen3.6:27b-q4_K_M

# محادثة سريعة
ollama pull qwen3.6:27b-mtp-q4_K_M
  • استخدم 35B-A3B Q4 كنموذجك الافتراضي للعمل العام.
  • انتقل إلى 27B Q4 عندما تريد إجابات برمجية أكثر ثباتًا.
  • استخدم نسخة MTP (Multi-Token Prediction — التنبؤ بعدة رموز دفعة واحدة) عندما السرعة أهم من العمق.
  • تجاهل bf16 وMLX حتى تعرف لماذا تحتاجها.

في LM Studio، ابحث عن نفس العائلات واختر Q4_K_M. نزّل نموذج Gemma أو Qwen واحد، جرّبه مساءً، ثم قرّر — لا تكدس خمسة عشر إصدارًا.

لماذا يفضّل المطورون Ollama؟

نقاشات r/LocalLLaMA تكرر نفس الأسباب. التفضيل لـ Ollama غالبًا عن سير العمل — لا لأن LM Studio يشغّل نماذج «أسوأ»:

  • تصميم مفتوح ومناسب للسكربتات — سحب النماذج من Terminal، Docker، CI/CD (Continuous Integration/Continuous Deployment — التكامل والنشر المستمر).
  • REST API (واجهة برمجية عبر HTTP) جاهز — Open WebUI وContinue وCline تتصل دون إعداد إضافي.
  • تحميل/تفريغ تلقائي — يوفر الذاكرة عند مشاركة عدة تطبيقات.
  • يعمل على خوادم Linux بدون واجهة — LM Studio مبني حول GUI (Graphical User Interface — واجهة رسومية).

السرعة الخام غالبًا متقاربة لأن الاثنين يعتمدان llama.cpp. الفروق في الذاكرة، تصميم API (Application Programming Interface — واجهة برمجة تطبيقات)، وعدد العملاء المتزامنين.

لماذا يبقى LM Studio على جهازك؟

  • متصفح نماذج مرئي مرتبط بـ Hugging Face — ترى الحجم قبل التنزيل.
  • منزلقات للإبداع والسياق أثناء المحادثة — ممتاز للتعلّم.
  • أقل احتكاكًا لأول محادثة — بلا أوامر تحفظها.
  • مختبر سريع لمقارنة Q4 وQ8 قبل الالتزام في Ollama.

اختر مسارك

  • أول مساء مع الذكاء المحلي ← LM Studio.
  • ربط واجهة محادثة أو أداة برمجة ← Ollama (+ Open WebUI أو إضافة المحرر).
  • هل Q4 يكفي أم Q8 يستحق القرص؟ ← LM Studio، ثم اسحب الفائز عبر Ollama.
  • أتمتة، Docker، خادم منزلي ← Ollama.
  • غير متأكد ثبّت الاثنين؛ Studio للتصفح، Ollama للإبقاء.

الخلاصة

النماذج المحلية تكافئ الإعداد البسيط: تطبيق واحد للاستكشاف، محرك واحد للربط، و23 نماذج Q4 بدل مستودع إصدارات. تعلّم التسمية مرة، اختر الأدوات حسب عملك الفعلي، وغيّر النموذج فقط عندما تصطدم بحد حقيقي — لا لأن القائمة أضاف شارة جديدة.

مصادر للاطلاع

مراجع هذا الدليل (مراجعة يونيو 2026):