كل أسبوع تقريبًا يظهر اسم جديد، ونموذج أقوى، ووعود أكبر. من يراقب المشهد من الخارج يشعر أن الذكاء الاصطناعي هبط علينا فجأة، كأنه قفزة واحدة سريعة أربكت السوق والناس معًا. وهذا بالضبط هو الانطباع الخاطئ. ما نراه اليوم ليس انفجارًا مفاجئًا، بل نهاية مؤقتة لرحلة طويلة جدًا؛ رحلة بدأت قبل أن يعرف العالم الإنترنت بالشكل الذي نعرفه، وقبل أن تصبح الحواسيب جزءًا عاديًا من حياة الناس.
المشكلة أن كثيرين يتعاملون مع الذكاء الاصطناعي كأنه مجرد ترند تقني جديد: نموذج تطارده اليوم، ثم تستبدله غدًا بآخر أحدث. لكن هذه النظرة السطحية تخفي القصة الحقيقية. الذكاء الاصطناعي لم يتطور فقط لأن المعالجات صارت أسرع، أو لأن الشركات صارت أغنى، أو لأن البيانات تضخمت. تطوره كان، في جوهره، محاولة بشرية متكررة للإجابة عن سؤال صعب جدًا: كيف نجعل الآلة أقرب إلى طريقة الإنسان في الفهم، والتعلم، والاستنتاج، ثم الفعل؟
مرة حاولنا ذلك بالقواعد.
ومرة بالبيانات.
ومرة بالشبكات العصبية.
ثم باللغة، ثم بالصورة، ثم بالسياق، ثم بالأدوات.
وفي كل مرة، لم تكن الآلة وحدها هي التي تتغير. نحن أيضًا كنا نغيّر فكرتنا عن الذكاء نفسه. ما الذي يعنيه أن “تفهم” آلة شيئًا؟ متى نقول إنها تتعلم؟ ومتى يكون ما تفعله مجرد تقليد مقنع، لا فهمًا حقيقيًا؟ هذه ليست أسئلة فلسفية بعيدة عن الواقع كما قد تبدو. هي أسئلة عملية جدًا، لأن كل موجة حماس حول الذكاء الاصطناعي بُنيت أصلًا على إجابة معينة عنها، ثم اصطدمت لاحقًا بحدودها.
لهذا السبب، أفضل طريقة لفهم الذكاء الاصطناعي ليست أن نبدأ من ChatGPT أو من الصور المولدة أو من الوكلاء الذين “يعملون وحدهم”. الأفضل أن نرجع خطوة إلى الوراء. أن ننظر إلى المشهد كقصة تطور، لا كضجيج أدوات. عندها فقط يصبح واضحًا أن الذكاء الاصطناعي لم يطِر فجأة، بل وصل إلى هنا عبر قفزات متراكمة، بعضها كان لامعًا فعلًا، وبعضها كان مبالغًا فيه، وبعضها انتهى بخيبة كبيرة قبل أن يفتح الطريق لما بعده.
هذا المقال لا يحاول أن يطارد كل نموذج جديد، ولا أن يبهرك بأسماء الشركات. هدفه أبسط وأهم: أن يرسم لك الصورة الكبرى بوضوح. كيف بدأت الفكرة؟ لماذا تعثرت أكثر من مرة؟ ما الذي تغيّر في كل مرحلة؟ وكيف وصلنا من أنظمة جامدة مكتوبة بالقواعد إلى نماذج لغوية وذكاء توليدي ووكلاء قادرين على التخطيط والتنفيذ؟ وعبر الطريق كله، سنبقي معنا مثالًا عمليًا واحدًا: صاحب متجر صغير، لأن قيمة هذه الرحلة لا تظهر فعلًا حين نقرأ تاريخها فقط، بل حين نفهم كيف نزلت من المختبر إلى الشغل اليومي.
قبل الذكاء الاصطناعي: كل قفزة تقنية كبيرة كانت توسّع قدرة الإنسان

الذكاء الاصطناعي لم يظهر في فراغ. لفهمه بشكل صحيح، من المفيد أن ننظر إليه لا كأداة منفصلة، بل كحلقة جديدة في سلسلة طويلة من التحولات التقنية التي غيّرت معنى العمل والمعرفة والقرار, وصنعت تاريخ الذكاء الاصطناعي.
انطلاقاً من الأنظمة الخبيرة ووصولاً إلى الوكلاء الذكية..
الثورة الصناعية، مثلًا، لم تكن مجرد اختراع آلات أسرع. ما فعلته فعليًا هو أنها نقلت البشر من اقتصاد قائم على الحرفة والجهد اليدوي إلى عالم تقوده الآلة والإنتاج المنظم والطاقة الميكانيكية. فجأة، لم تعد المشكلة الأساسية: “من يعمل أكثر؟” بل: “كيف نبني نظامًا ينتج أكثر، وبشكل ثابت، وعلى نطاق واسع؟” هذه كانت لحظة مضاعفة العضلات. الآلة هنا وسّعت قدرة الإنسان الجسدية والإنتاجية، وغيرت شكل الاقتصاد والمجتمع معًا.
ثم جاءت الكهرباء، ولم تكن أهميتها في أنها مجرد مصدر طاقة جديد، بل في أنها جعلت تشغيل الأنظمة أكثر مرونة وانتشارًا وقابلية للدمج في الحياة اليومية والصناعة والبنية التحتية. إذا كانت البخار قد صنع قلب المصنع الصناعي المبكر، فالكهرباء جعلت العالم التقني أكثر سيولة واتصالًا واستمرارية. هي القفزة التي لم تكتفِ بتشغيل الآلات، بل أعادت توزيع القوة نفسها داخل المجتمع الحديث.
بعد ذلك دخلنا مرحلة مختلفة تمامًا مع الحاسوب الرقمي. هنا لم تعد الآلة مجرد شيء يضخ القوة أو يكرر الحركة، بل أصبحت آلة عامة قابلة للبرمجة. وهذا فرق جوهري. الماكينة الصناعية تُصمَّم غالبًا لمهمة محددة، أما الحاسوب ففكرته الثورية أنه يستطيع تنفيذ مهام كثيرة جدًا إذا غيّرت التعليمات فقط. في هذه اللحظة انتقلنا من توسيع العضلات إلى توسيع الحساب والتنظيم والمنطق الإجرائي.
ثم جاء الإنترنت ليضيف بعدًا جديدًا: لم يعد الحاسوب جزيرة. صار جزءًا من شبكة. ومع ARPANET في أواخر الستينيات بدأت البنية التي ستتحول لاحقًا إلى الإنترنت الحديث، ومعها تغيّر كل شيء تقريبًا: تبادل المعرفة، تخزين المعلومات، بناء الخدمات، وتدفق البيانات بين البشر والأنظمة والمؤسسات. إذا كانت الثورة الصناعية قد ضاعفت الإنتاج، والحاسوب قد ضاعف المعالجة، فالإنترنت ضاعف الاتصال والوصول والتراكم المعرفي.
هنا يصبح ظهور الذكاء الاصطناعي أكثر منطقية. لأن السؤال لم يعد فقط: كيف ننتج أكثر؟ أو نحسب أسرع؟ أو نتصل أفضل؟ بل: هل يمكن أن نبني أنظمة تساعدنا في الفهم، والتصنيف، والاستنتاج، ثم لاحقًا في التوليد واتخاذ القرار؟ بمعنى آخر: إذا كانت الثورات السابقة قد وسّعت يد الإنسان وعينه وسرعته، فالذكاء الاصطناعي يحاول أن يوسّع شيئًا أصعب بكثير: قدرته على الإدراك والتحليل والتصرف داخل عالم معقد ومتغير.
من سؤال فلسفي إلى مشروع علمي: من تورنج إلى دارتموث
قبل أن يصبح الذكاء الاصطناعي صناعة، كان سؤالًا. وفي كثير من الأحيان، تبدأ التحولات الكبرى بسؤال يبدو بسيطًا أكثر مما ينبغي. سنة 1950، نشر آلان تورنج ورقته الشهيرة Computing Machinery and Intelligence وافتتحها بالسؤال الذي صار لاحقًا أيقونيًا: “Can machines think?” لكنه لم يتوقف عند الجملة بوصفها شعارًا فلسفيًا؛ بل حاول أن يستبدل السؤال الملتبس بسؤال أكثر قابلية للاختبار، عبر ما عُرف لاحقًا بـ اختبار تورنج أو “لعبة التقليد”. الفكرة لم تكن أن نحسم معنى “التفكير” مرة واحدة، بل أن نسأل: هل يمكن لآلة أن تتصرف لغويًا بطريقة تجعل الإنسان يعجز عن تمييزها بسهولة عن إنسان آخر؟
هذه النقطة مهمة لأن الناس كثيرًا ما تتعامل مع اختبار تورنج على أنه مسابقة شعبية أو فكرة إعلامية، بينما أهميته الحقيقية كانت في شيء آخر: نقل النقاش من مستوى التأمل المجرد إلى مستوى يمكن التعامل معه علميًا. لم يقل تورنج إن الآلة “تفكر” بالضرورة كما يفكر الإنسان؛ بل حاول أن يبني طريقة أكثر عملية للاقتراب من السؤال. وهذه النقلة وحدها كانت كافية لتفتح بابًا كاملًا من البحث.
بعدها بست سنوات، جاءت ورشة دارتموث سنة 1956، وهي اللحظة التي يُشار إليها غالبًا بوصفها نقطة التأسيس الرسمية لحقل الذكاء الاصطناعي. هناك لم يعد الموضوع مجرد أسئلة متفرقة حول الآلات واللغة والمنطق، بل صار مشروعًا بحثيًا له اسم واضح: Artificial Intelligence. الرهان كان طموحًا جدًا من البداية: أن جوانب من التعلم والذكاء يمكن وصفها بدقة كافية تسمح ببنائها داخل آلة. من السهل اليوم أن نرى في هذا طموحًا مبالغًا فيه، لكنه كان أيضًا لحظة جريئة جدًا: لأول مرة، لم يعد السؤال “هل يمكن؟” فقط، بل “كيف نبني ذلك؟”.
ومن هنا تقريبًا بدأت القصة الفعلية. ليس لأن المشكلة حُلّت، بل لأن البشر قرروا أن يتعاملوا معها كمشروع هندسي وعلمي طويل المدى، لا كخيال فكري عابر.
ما هو الذكاء الاصطناعي أصلًا؟ ولماذا ليس شيئًا واحدًا؟
واحدة من أكثر المشكلات شيوعًا في الحديث عن الذكاء الاصطناعي أن المصطلح يُستخدم وكأنه يشير إلى تقنية واحدة متماسكة. وهذا غير صحيح. الذكاء الاصطناعي هو مظلة واسعة جدًا تضم مناهج وطبقات وأنظمة مختلفة. بعض هذه الأنظمة يتنبأ، بعضها يصنف، بعضها يتعرف على الأنماط، بعضها يولد محتوى جديدًا، وبعضها ينسق بين الفهم والتنفيذ داخل مسارات عمل معقدة. تقرير المفوضية الأوروبية عن التطور التاريخي للذكاء الاصطناعي يوضح أصلًا أن المجال مرّ عبر مدارس ومقاربات متعددة، لا عبر مسار واحد مستقيم.
ولو أردنا تبسيط الصورة دون تشويهها، يمكن التفكير في الذكاء الاصطناعي عبر ثلاث طبقات وظيفية واسعة: الإدراك، والتفكير، والتنفيذ. الإدراك يعني أن يفهم النظام المدخلات: نصًا، صورة، صوتًا، أو فيديو. التفكير يعني أن يربط ما فهمه بهدف أو قاعدة أو نمط استدلال ليخرج باستنتاج أو قرار أو خطة. أما التنفيذ فيعني أن يتحول هذا كله إلى فعل: استخدام أداة، قراءة قاعدة بيانات، تحديث ملف، إرسال رسالة، أو التحكم في جهاز. هذه ليست مدارس أكاديمية صارمة بقدر ما هي خريطة عملية تساعدنا على فهم أين تقع كل موجة من موجات الذكاء الاصطناعي الحديثة.
هنا أيضًا يظهر خطأ شائع آخر: كثيرون يخلطون بين الذكاء الاصطناعي وتعلم الآلة والتعلم العميق والذكاء التوليدي وكأنها كلمات مترادفة. الأدق أن نقول: الذكاء الاصطناعي هو الإطار الأوسع، وداخله ظهرت مناهج مثل تعلم الآلة، ثم داخله أيضًا تطورت الشبكات العميقة، ومنها خرجت لاحقًا أنظمة الذكاء التوليدي، ثم الأنظمة الوكيلة التي تضيف إلى “العقل” طبقة من الأدوات والذاكرة والتنفيذ. هذه التفرقة ليست ترفًا اصطلاحيًا؛ هي ضرورية لأن الخلط بينها يجعل الناس يسيئون فهم ما الذي تطور فعلًا، وما الذي لم يتطور بعد.
ثلاثة مسارات رئيسية صنعت الذكاء الاصطناعي الحديث
إذا أردنا تبسيط المشهد من دون تشويهه، فهناك ثلاثة مسارات كبرى تداخلت مع الوقت وصنعت ما نسميه اليوم “الذكاء الاصطناعي الحديث”. الأول هو تعلم الآلة والتعلم العميق: هنا لم تعد الفكرة أن نكتب للآلة كل قاعدة يدويًا، بل أن نتركها تتعلم الأنماط من البيانات. الثاني هو الذكاء التوليدي: أي الانتقال من التنبؤ والتصنيف إلى إنتاج شيء جديد أصلًا، مثل نص أو صورة أو صوت. أما الثالث فهو أنظمة الوكلاء، حيث لا يكتفي النظام بالفهم أو التوليد، بل يدخل طبقة من التخطيط واستخدام الأدوات والتنفيذ والمراجعة. ما يبدو اليوم كأنه مشهد واحد متماسك هو في الحقيقة تراكب بين هذه المسارات الثلاثة، وكل واحد منها حل مشكلة مختلفة في زمن مختلف.
المهم هنا ألا نعامل هذه المسارات كأنها مراحل تلغي بعضها. تعلم الآلة لم يختفِ لأن الذكاء التوليدي ظهر، والذكاء التوليدي لم يجعل الوكلاء شيئًا منفصلًا تمامًا عنه. الأصح أن نقول إن كل مسار وسّع قدرات المسار السابق أو أعاد توظيفه في اتجاه جديد. ولهذا، حين ننظر إلى تاريخ الذكاء الاصطناعي كقصة “قفزات”، فنحن لا نقصد أن كل مرحلة ألغت ما قبلها، بل أنها أعادت تعريف ما كان ممكنًا.
ولكي لا يبقى الكلام مجرد تأريخ تقني، سنحتفظ معنا بنفس المثال العملي عبر الطريق كله: صاحب متجر صغير. لأن الذكاء الاصطناعي لا يكشف قيمته الحقيقية عندما نقول إن نموذجًا ما “حقق دقة أعلى” فقط، بل عندما نفهم ماذا غيّر هذا فعليًا في العمل اليومي: في التصنيف، وفي التنبؤ، وفي كتابة المحتوى، وفي اتخاذ القرار، ثم لاحقًا في التنفيذ نفسه.
القفزة الأولى: حين حاولنا كتابة الذكاء بالقواعد

في البدايات، كان التصور السائد بسيطًا ومغرِيًا: إذا كان الذكاء يعني معرفة القواعد، فلماذا لا نكتب هذه القواعد داخل الآلة؟ هكذا صعد ما يُعرف اليوم بـ الذكاء الرمزي أو Symbolic AI، حيث يُفترض أن العالم يمكن تمثيله عبر رموز، وعلاقات، وقواعد من نوع “إذا حدث كذا، فافعل كذا”. هذه الفكرة لم تكن ساذجة كما قد تبدو الآن؛ بل كانت منطقية جدًا في زمن كانت فيه المعرفة تُفهم غالبًا بوصفها شيئًا يمكن ترميزه، خصوصًا في مسائل منطقية أو مغلقة نسبيًا. تقارير تاريخية حديثة عن تطور المجال تشير فعلًا إلى أن الذكاء الاصطناعي المبكر اعتمد بقوة على المقاربات الرمزية والاستدلال القائم على القواعد قبل صعود التعلم الإحصائي والبياني لاحقًا.
هنا ظهرت أيضًا الأنظمة الخبيرة، وهي محاولة طموحة لبناء برامج تتصرف كما لو أنها خبراء داخل نطاق ضيق: التشخيص، التهيئة، الاختيار، أو حل مشكلة معقدة في مجال محدد. من أشهر الأمثلة العملية نظام XCON في شركة Digital Equipment Corporation، والذي استُخدم للمساعدة في تهيئة طلبات الحواسيب المعقدة، وكان يُنظر إليه في الثمانينيات بوصفه مثالًا تجاريًا قويًا على إمكانات الأنظمة الخبيرة. نجاحه كان مهمًا لأنه أظهر أن الذكاء الاصطناعي، في بيئة محددة ومستقرة نسبيًا، يمكن أن يتحول من فكرة بحثية إلى قيمة اقتصادية حقيقية.
وفي المسار نفسه تقريبًا ظهر ELIZA سنة 1966، وهو من أوائل برامج المحادثة التي تركت أثرًا نفسيًا وثقافيًا أكبر من أثرها التقني الفعلي. ELIZA لم يكن “يفهم” اللغة كما نفهمها اليوم حين نتحدث عن نماذج لغوية حديثة؛ كان يعتمد على اكتشاف كلمات مفتاحية داخل الإدخال، ثم يعيد تركيب الرد عبر قواعد تفكيك وإعادة بناء. تقنيًا، كان هذا محدودًا جدًا. لكن الأهم أن الناس مع ذلك شعروا أحيانًا أنهم أمام شيء يفهمهم. وهذه لحظة شديدة الأهمية في تاريخ الذكاء الاصطناعي: ليس فقط لأن البرنامج كان مبكرًا، بل لأنه كشف مبكرًا ميل البشر إلى إسقاط الفهم على أي نظام يتقن شكل الحوار حتى لو لم يملك عمقه.
لو طبقنا هذا على مثال صاحب المتجر، فالصيغة القديمة كانت ستبدو هكذا:
إذا كان المنتج لونه أحمر وحجمه صغير، فصنّفه للأطفال.
إذا احتوت الرسالة على كلمة “إرجاع”، فحوّلها إلى مسار المرتجعات.
إذا تجاوز الطلب مدة معينة، فأرسل تنبيهًا.
كل هذا مفيد… إلى أن يدخل الواقع ويكسر القاعدة. لأن الواقع لا يحترم جداولنا. الرسالة قد تتحدث عن الإرجاع من دون أن تستخدم كلمة “إرجاع”. والمنتج الصغير الأحمر قد يكون مخصصًا للكبار لا للأطفال. هنا يظهر الحد الحقيقي للذكاء الرمزي: هو قوي ما دام العالم منضبطًا، وضعيف جدًا عندما يصبح غامضًا أو مليئًا بالاستثناءات.
الذكاء الاصطناعي لا يصعد دائمًا إلى الأمام: شتاء الذكاء الاصطناعي
واحدة من أكثر الأفكار المضللة عن تاريخ الذكاء الاصطناعي أن الناس تتخيله خطًا صاعدًا بلا توقف. الحقيقة كانت أعقد بكثير. المجال دخل أكثر من مرة في فترات فتور حاد، عُرفت لاحقًا باسم شتاء الذكاء الاصطناعي. السبب لم يكن أن الفكرة كانت خاطئة بالكامل، بل أن الوعود كبرت أسرع من القدرة التقنية الفعلية على تنفيذها. الأنظمة كانت تبهر في العروض المحدودة، ثم تتعثر في الواقع الفوضوي، والتمويل يبدأ بالحماس ثم ينكمش حين لا تتحقق الوعود بالمستوى المتوقع.
من المحطات الرمزية في هذا السياق تقرير لايتهايل عام 1973 في المملكة المتحدة، الذي جاء ليقيّم وضع أبحاث الذكاء الاصطناعي، وانتهى إلى نقد حاد لكثير من الوعود والطموحات غير المدعومة بقدرات عملية كافية في ذلك الوقت. لا يمكن اختزال “شتاء الذكاء الاصطناعي” كله في هذا التقرير وحده، لكنه يُنظر إليه فعلًا كإحدى اللحظات التي ساهمت في تبريد الحماسة المؤسسية والتمويلية تجاه المجال، خصوصًا حين تبيّن أن كثيرًا من مشكلات “الذكاء العام” كانت أعقد بكثير مما افترضه الباحثون الأوائل.
ثم تكرر شيء مشابه في أواخر الثمانينيات وأوائل التسعينيات، عندما انكشف أن الأنظمة الخبيرة، رغم نجاحاتها المهمة، تعاني من مشكلة مزمنة: صيانتها مكلفة، وتوسيعها صعب، ونقلها من بيئة ضيقة إلى أخرى أصعب مما يبدو. هنا برد الحماس مرة ثانية. هذه المحطات مهمة جدًا لأنها تعلمنا درسًا لا يزال صالحًا اليوم: في الذكاء الاصطناعي، الفجوة بين “ما يثير الخيال” و”ما يصمد في الاستخدام الحقيقي” كانت دائمًا أخطر من أي خوارزمية. ولهذا، كل موجة نهوض لاحقة كانت تحتاج شيئًا أكثر من الحماس: كانت تحتاج اختراقًا تقنيًا يغيّر قواعد اللعبة فعلًا.
القفزة الثانية: من القواعد إلى التعلم من البيانات
رد الفعل الحقيقي على حدود المدرسة الرمزية لم يكن التخلي عن الذكاء الاصطناعي، بل تغيير السؤال نفسه. بدل أن نقول: “كيف نكتب كل قاعدة؟” بدأ الباحثون يسألون: “هل يمكن أن تتعلم الآلة الأنماط من الأمثلة والبيانات؟” من هنا صعد تعلم الآلة بوصفه انعطافًا منهجيًا مهمًا. لم تعد الفكرة أن نخبر النظام بكل شيء يدويًا، بل أن نعرض عليه بيانات كافية ليكتشف بنفسه علاقات وأنماطًا تساعده على التنبؤ أو التصنيف أو اتخاذ قرار احتمالي.
هنا برزت عائلات كاملة من الخوارزميات الإحصائية والتنبؤية: مثل الانحدار اللوجستي، وأشجار القرار، وآلات الدعم الشعاعي، وغيرها من الأساليب التي جعلت الحاسوب أكثر قدرة على التعامل مع مسائل من نوع: هل سيشتري هذا العميل؟ هل هذه الرسالة احتيالية؟ هل هذه الصورة أقرب إلى فئة من أخرى؟ ما الذي تغيّر هنا ليس فقط التقنية، بل طبيعة الذكاء نفسه: الآلة لم تعد تحفظ قاعدة واحدة جامدة، بل تبني نموذجًا احتماليًا من البيانات. هذا فرق جوهري.
وبالعودة إلى صاحب المتجر، صار ممكنًا بدلًا من كتابة قواعد يدويًا أن يتعلم النظام من سلوك الزبائن السابقين: من اشترى ماذا، ومن شاهد ماذا ولم يشترِ، ومن استجاب لعروض معينة. النتيجة كانت توصيات أفضل بكثير من قواعد if/then البسيطة. لكن المشكلة الجديدة ظهرت بسرعة: في كثير من الحالات، ما زال البشر مضطرين إلى تحديد الميزات المهمة يدويًا. أي أننا انتقلنا من كتابة القاعدة بالكامل إلى كتابة ما يجب على النظام أن ينتبه له. كان هذا تقدمًا حقيقيًا، لكنه لم يكن نهاية الطريق.

القفزة الثالثة: عندما بدأت الآلة تتعلم التمثيل بنفسها
التحول التالي لم يكن مجرد تحسين إحصائي، بل تغيير أعمق في طريقة التعلم نفسها. مع التعلم العميق، لم يعد التركيز فقط على بناء نموذج يتعلم من البيانات، بل على بناء نماذج قادرة على تعلم التمثيلات نفسها من البيانات الخام. هذا هو الفارق الذي يسيء كثيرون فهمه: القوة هنا لم تأتِ فقط من “شبكات أكبر”، بل من فكرة أن النموذج يمكنه أن يتعلم ما الذي يجب أن يراه أصلًا، بدل أن يظل الإنسان يحدد له الميزات المهمة يدويًا.
محطة AlexNet سنة 2012 تُعد عادة من اللحظات الرمزية الكبرى لهذا التحول. ما جعلها مهمة لم يكن أنها “فازت بمسابقة” فحسب، بل أنها أظهرت بشكل صارخ أن الجمع بين بيانات كبيرة، وشبكات عميقة، وحوسبة GPU قوية يمكن أن يدفع الأداء إلى قفزة واضحة في الرؤية الحاسوبية. هنا بدأ العالم التقني يفهم أن شيئًا جديًا يتغير، وأن التعلم العميق ليس مجرد تحسين تجميلي على ما قبله، بل بداية مدرسة أكثر قدرة على التعامل مع الصور والصوت والنصوص المعقدة.
وفي الوقت نفسه تقريبًا، كانت هناك محطات رمزية أخرى كشفت للناس قوة الآلات بطرق مختلفة. Deep Blue مثلًا هزم غاري كاسباروف، بطل العالم في الشطرنج، في مباراة إعادة عام 1997. كان ذلك حدثًا رمزيًا ضخمًا، لكنه يمثل نوعًا مختلفًا من القوة: نظام شديد التخصص، مبني لهدف محدد جدًا، لا “ذكاء عام” بالمعنى الذي قد يتخيله الناس. بعده بسنوات، جاء AlphaGo ليُحدث صدمة أعمق، لأن لعبة Go كانت تُعد أصعب بكثير على الأساليب التقليدية، ولأن النظام جمع بين الشبكات العصبية والبحث بطريقة بدت أقرب إلى اختراق نوعي في طبيعة القدرة نفسها، لا مجرد زيادة في القوة الحسابية.
بالنسبة لصاحب المتجر، هذه القفزة تعني شيئًا بسيطًا جدًا ومهمًا جدًا في الوقت نفسه: صور المنتجات لم تعد مجرد ملفات تحتاج إلى تصنيف يدوي مرهق، بل صارت شيئًا يمكن للنظام أن يفهمه بصريًا بدرجة أفضل. قميص، فستان، حذاء، إضاءة استوديو، خلفية، طابع بصري… كثير من هذا بدأ يصبح ممكنًا آليًا. لكن حتى هنا، بقيت مشكلة كبيرة قائمة: اللغة الطويلة، والسياق الممتد، والعلاقات البعيدة داخل النصوص. الآلة صارت ترى أفضل، لكنها لم تصبح بعد “قارئًا” ممتازًا للنصوص الطويلة.
القفزة الرابعة: Transformer — حين توقفت الآلة عن نسيان بداية الجملة
هنا وصلنا إلى واحدة من أهم نقاط التحول في تاريخ الذكاء الاصطناعي الحديث. قبل Transformer، كانت النماذج التي تتعامل مع اللغة تقرأ النص على نحو أقرب إلى السلسلة: كلمة وراء كلمة، خطوة وراء خطوة. وهذا جعلها أفضل من الأنظمة القديمة بكثير، لكنه ترك مشكلة مزمنة: كلما طال النص، صار الاحتفاظ بالعلاقات البعيدة أصعب، وصار التدريب أبطأ، وصار فهم السياق الطويل أكثر هشاشة.
ثم جاءت الفكرة التي غيّرت هذا كله: بدل أن يقرأ النموذج النص كلمة كلمة فقط، لماذا لا ينظر إلى الجملة أو المقطع كشبكة علاقات في اللحظة نفسها؟ هنا ظهر مفهوم الانتباه الذاتي، ومعه بنية Transformer. فجأة صار ممكنًا أن “يرى” النموذج الكلمات معًا، وأن يقدّر أيها أهم بالنسبة لأيها، وأن يربط بين أجزاء بعيدة من النص دون أن يضيع أول الكلام قبل أن يصل إلى آخره.
هذه النقلة تبدو تقنية، لكنها في الحقيقة أعادت تعريف ما يعنيه “فهم النص” داخل النماذج. قبلها، كانت الآلة تتعامل مع اللغة كشيء زمني متتابع إلى حد كبير. بعدها، صارت تتعامل معها أيضًا كشيء علائقي: شبكة من الإشارات والسياقات والمرجعيات. وهذا هو السبب الحقيقي وراء أن النماذج اللغوية الحديثة لم تعد جيدة فقط في إكمال الجمل، بل في التلخيص، وإعادة الصياغة، واستخراج المعنى، وربط أجزاء متباعدة من النص.
وبالنسبة لصاحب المتجر، هذه لحظة شديدة العملية. قبل هذه القفزة، كانت الأوصاف الطويلة، وسياسات الإرجاع، والاستثناءات، والشروط، كثيرًا ما تتفكك داخل النظام أو تضيع منها تفاصيل مهمة. بعد هذه القفزة، صار ممكنًا أن يأخذ النموذج وصفًا فوضويًا لمنتج، مع مقاسات وخامة وتنبيهات وشروط، ثم يعيده في صيغة منظمة وواضحة ومتسقة. ليس لأنه “حفظ” النص حرفيًا، بل لأنه صار أفضل بكثير في فهم العلاقات داخله.
ومن هنا تقريبًا تبدأ المرحلة التي يخلطها كثير من الناس مع “بداية الذكاء الاصطناعي” كله. والحقيقة أنها ليست البداية، بل بداية طور جديد فقط: طور أصبحت فيه اللغة نفسها واجهة تشغيل للمعرفة والعمل.
وهنا يبدأ سؤال أعمق: إذا كانت نماذج اللغة الكبيرة تبدو قادرة على الشرح والتحليل والتخطيط، فكيف تعمل أصلًا؟ هذا ما نفصله في مقال مستقل عن كيف يتدرّب LLM، وكيف يقرأ، ولماذا يبدو كأنه يفهم.
القفزة الخامسة: من الفهم إلى التوليد — عندما بدأت الآلة تنتج شيئًا جديدًا
حتى هذه النقطة، كان التقدم المثير في الذكاء الاصطناعي يدور غالبًا حول الفهم والتنبؤ والتصنيف. هل هذه صورة لقطة أم كلب؟ هل هذا العميل قد يشتري أم لا؟ ما الكلمة التالية المرجحة؟ لكن مع الذكاء التوليدي، تغير السؤال نفسه. لم يعد المطلوب فقط أن تعرف الآلة ما الموجود، بل أن تنتج شيئًا لم يكن موجودًا أصلًا: نصًا، صورة، صوتًا، فيديو، أو شيفرة.
هذه القفزة هي التي جعلت الذكاء الاصطناعي يدخل وعي الناس اليومي بقوة. لأن الإنسان العادي قد لا يهتم كثيرًا بنموذج يرفع دقة التصنيف من 92% إلى 95%، لكنه ينتبه فورًا عندما يكتب وصفًا قصيرًا فتحصل أمامه صورة كاملة، أو يطلب فقرة فيحصل على نص متماسك، أو يسلم النظام فكرة إعلانية فيخرج له نصًا وصورة وصوتًا في دقائق.
لكن المهم هنا ألا نسقط في الوهم الشائع: الذكاء التوليدي لم يأتِ من فراغ، ولم يكن “قفزة سحرية” بلا مقدمات. هو ثمرة مباشرة لتراكمات سبقتْه: تمثيل المعنى، وتحسن نماذج اللغة، والبنى العميقة، وزيادة الحوسبة، وتطور النماذج البصرية والصوتية. ما حدث ببساطة أن هذه الخيوط المتفرقة بدأت تجتمع في نقطة واحدة.
هنا أيضًا يظهر سوء فهم شائع آخر. كثيرون يتعاملون مع الذكاء التوليدي كأنه مرادف للدقة أو الحقيقة، بينما هو في جوهره نظام بارع في إنتاج مخرجات مقنعة استنادًا إلى أنماط تعلمها. وهذا ما يفسر في الوقت نفسه سبب انبهار الناس به، وسبب مشكلة الهلوسة التي صارت جزءًا من النقاش الجاد حوله. النموذج قد يعطيك شيئًا ممتازًا، لكنه قد يخترع أيضًا بثقة عالية إذا تُرك بلا مرجعية أو تحقق.
ولهذا ظهرت لاحقًا طبقات عملية مثل:
- RAG عندما تريد ربط التوليد بمصادرك بدل ذاكرة النموذج وحدها
- Fine-tuning عندما تريد سلوكًا أو أسلوبًا أكثر تخصيصًا
- In-context learning عندما تريد توجيهًا سريعًا داخل الطلب نفسه
هذه النقطة مهمة لأنها تذكّرنا أن الذكاء التوليدي ليس “قدرة كاملة بذاته”، بل طبقة قوية جدًا تحتاج إلى ضبط بحسب المهمة. صاحب المتجر لا يستفيد منه لأنه مبهر فقط، بل لأنه يستطيع أن يحول ست مهام متفرقة — وصف، إعلان، صورة، نص ترويجي، رد، وصياغة — إلى مسار أسرع وأكثر اتساقًا، مع بقاء المراجعة البشرية كطبقة لازمة لا كترف.
وإذا أردت التعمق أكثر في هذه المرحلة تحديدًا، فالمقال التالي يشرح كيف تطور الذكاء التوليدي من فهم الأنماط إلى إنتاج النص والصورة والصوت والفيديو.

القفزة السادسة: من المساعد إلى الوكيل — عندما لم يعد الذكاء الاصطناعي يكتفي بالكلام
لو توقفت القصة عند الذكاء التوليدي، لكنا أمام أدوات قوية جدًا، لكنها ما زالت في النهاية “تنتج” عندما تطلب منها، ثم تنتظر الطلب التالي. التحول الأحدث والأخطر حصل حين بدأنا نربط هذه النماذج بالأدوات، والذاكرة، وقواعد العمل، ومسارات التنفيذ. هنا لم يعد السؤال: هل يستطيع النظام أن يشرح أو يولد؟ بل: هل يستطيع أن يأخذ هدفًا، يجزئه، يستخدم الأدوات المناسبة، ثم يعود بنتيجة قابلة للمراجعة؟
هذه هي اللحظة التي بدأت فيها فكرة الوكلاء أو Agentic Systems تأخذ شكلًا عمليًا. الفرق بين مساعد ذكي ووكيل ذكي ليس في أن الثاني “أكثر بلاغة” أو “أقوى نموذجًا” بالضرورة، بل في أنه يعمل داخل حلقة تشغيل مختلفة. المساعد يجيب. الوكيل يخطط، يختار، ينفذ، ويراجع. وهذه نقلة كبيرة جدًا، لأنها تنقل الذكاء الاصطناعي من مساحة الحوار إلى مساحة الفعل.
لكن يجب أن نكون دقيقين هنا أيضًا. الوكيل ليس “ذكاءً خارقًا” يستغني عن البشر، ولا جنيًا تقنيًا يعرف ما نريده من نصف جملة. هو نظام يحتاج إلى:
- هدف واضح
- أدوات محددة
- صلاحيات مضبوطة
- ذاكرة مناسبة
- وشروط توقف ومراجعة
من دون ذلك، قد يبدو ذكيًا في العرض، لكنه يتحول بسرعة إلى مصدر فوضى.
وفي مثال صاحب المتجر، الفارق واضح جدًا. المساعد يمكن أن يكتب له وصفًا ممتازًا، أو يقترح ردًا جيدًا، أو يلخص سياسة ما. أما الوكيل فيمكن أن يقرأ ملف المنتجات، ويطابق الصور بالأوصاف، ويجلب الأسعار من جدول، ويجهز تقريرًا بالفروقات، ثم يطلب منه الموافقة قبل النشر. هنا لم يعد الذكاء الاصطناعي “ينصح” فقط، بل دخل فعلًا في سير العمل.
وهذه هي اللحظة التي تفسر كثيرًا من الضجيج الحالي حول الذكاء الاصطناعي. ليس لأن النماذج صارت “تعقل” أخيرًا كما يحب البعض أن يتخيل، بل لأننا بدأنا نمنحها أيدي بعد أن كانت تملك عقلًا لغويًا فقط.
ما الذي يسيء الناس فهمه اليوم في الذكاء الاصطناعي؟
أكبر سوء فهم اليوم ليس تقنيًا، بل تصوري. كثير من الناس يتعاملون مع الذكاء الاصطناعي كأنه كتلة واحدة: إمّا أنه “يفهم مثل الإنسان”، أو أنه “خدعة كاملة”. والحقيقة، كالعادة، أكثر تعقيدًا من الطرفين.
ليس صحيحًا أن كل نجاح لغوي يعني فهمًا بشريًا. وليس صحيحًا أيضًا أن كل ما تفعله النماذج مجرد تقليد فارغ بلا قيمة. بين هذين الطرفين توجد منطقة واسعة جدًا من القدرات الحقيقية: التنبؤ، التمثيل، الربط، التوليد، المساعدة، وأحيانًا التنسيق والتنفيذ تحت شروط واضحة. المشكلة تبدأ حين نحمّل النظام أكثر مما صُمم له، أو حين نأخذ واجهة محادثة مقنعة وننسب إليها تلقائيًا نوعًا من الوعي أو الفهم الكامل للعالم.
وسوء الفهم الثاني هو أن الناس تظن أن الذكاء الاصطناعي يتقدم دائمًا على شكل “أفضل نموذج جديد”. بينما التاريخ الذي مررنا به يقول شيئًا آخر: التغيرات الكبرى لم تكن فقط في الأسماء، بل في نوعية القفزة نفسها. الانتقال من القواعد إلى التعلم كان قفزة. ومن التعلم اليدوي للميزات إلى التعلم العميق كان قفزة. ومن التسلسل إلى الانتباه كان قفزة. ومن الفهم إلى التوليد كان قفزة. ومن التوليد إلى التنفيذ كان قفزة. من يطارد النماذج فقط يرى الضجيج. من يفهم القفزة يرى الاتجاه.
أما سوء الفهم الثالث، وربما الأخطر عمليًا، فهو الاعتقاد أن الاستقلالية تعني بالضرورة أن النظام صار أكثر “ذكاءً” بمعنى فلسفي أو إنساني. أحيانًا ما نسميه استقلالية ليس إلا ربطًا أفضل بين نموذج لغوي وأدوات وذاكرة وسير عمل. هذا بحد ذاته إنجاز مهم جدًا، لكنه ليس الشيء نفسه الذي يتخيله الناس عندما يسمعون كلمات مثل AGI أو “ذكاء يفكر مثلنا”. ومن الأفضل أن نبقي هذا الفرق واضحًا، لأن كثيرًا من المبالغة الحالية يولد من الخلط بين القدرة التشغيلية والادعاء الفلسفي.
وبعد فهم هذه النقلة، ننتقل عمليًا إلى سؤالين أهم: كيف نبني وكيلًا مضبوطًا بالأهداف والأدوات والذاكرة؟ وكيف نطوره لاحقًا إلى منظومة وكلاء تعمل معًا تحت إشراف مدير ووكلاء متخصصين؟
لماذا تهم هذه الرحلة فعلًا؟

لأنك إذا رأيت الذكاء الاصطناعي كموضة، ستتعب سريعًا من مطاردة الأدوات. أما إذا رأيته كتطور تاريخي متراكم، ستبدأ في طرح الأسئلة الصحيحة: ما القفزة التي نعيشها الآن؟ ما نوع المشكلات التي أصبحت قابلة للحل فعلًا؟ ما الذي ما زال هشًا؟ ومتى أحتاج نموذجًا يشرح، ومتى أحتاج نظامًا ينفذ، ومتى أحتاج ببساطة إلى إنسان يعرف أين يوقف كل هذا؟
هذه الأسئلة هي التي تهم صاحب المتجر، والمبرمج، وصاحب الشركة، وصانع المحتوى، والباحث، وكل من يحاول أن يفهم ما الذي تغيّر فعلًا. لأن الذكاء الاصطناعي لم يعد قصة مختبرات فقط. لكنه أيضًا لم يصبح سحرًا. هو طبقات من المحاولات البشرية لبناء أنظمة تقترب من بعض جوانب الإدراك والقرار والعمل، وكل طبقة منها تفتح إمكانًا جديدًا وتخلق في الوقت نفسه نوعًا جديدًا من الوهم إذا فُهمت بشكل سطحي.
في النهاية، الذكاء الاصطناعي لم يهبط علينا فجأة، ولم يصل إلى ما هو عليه لأن شركة واحدة أطلقت نموذجًا لامعًا. ما نراه اليوم هو حصيلة عقود من المحاولات: من القواعد الصلبة، إلى التعلم من البيانات، إلى الشبكات العميقة، إلى الذاكرة والسياق، إلى التوليد، إلى الوكلاء. لهذا السبب، أفضل طريقة للتعامل معه ليست أن تسأل كل مرة: ما أحدث أداة؟ بل أن تسأل: ما نوع القدرة التي ظهرت هنا؟ وما الذي تعنيه لي فعليًا في العمل والقرار والفهم؟
وهنا تبدأ بقية السلسلة بشكل طبيعي. لأن الصورة الكبرى أصبحت أوضح: بعد أن فهمنا كيف وصلنا إلى هذه اللحظة، يمكننا أن نقترب أكثر من كل طبقة على حدة — من الذكاء التوليدي، إلى عقل اللغة، إلى الوكيل، ثم إلى الأنظمة الوكيلة الكاملة.



