مايكل تشن | خبير استراتيجيات المحتوى | 6 ديسمبر 2023
في الثقافة الشعبية، يحظى الذكاء الاصطناعي أحيانًا بسمعة سيئة. تُظهر الأفلام أنها الخطوة الأولى على الطريق نحو نهاية عالم الروبوت، في حين أن الأخبار مليئة بقصص حول طريقة احتلال الذكاء الاصطناعي لجميع وظائفنا. تكمن الحقيقة في أن الذكاء الاصطناعي كان موجودًا لفترة من الوقت، ومن المحتمل ألا يكون أي من هذه السيناريوهات الأفضل والأسوأ وشيكًا.
في الأساس، يستخدم الذكاء الاصطناعي البيانات لإجراء التنبؤات. قد تدعم هذه الإمكانية نصائح "قد تحبها أيضًا" حول ��دمات البث، لكنها أيضًا وراء روبوتات الدردشة القادرة على فهم استعلامات اللغة الطبيعية والتنبؤ بالإجابة والتطبيقات الصحيحة التي تنظر إلى الصورة وتستخدم التعرُّف على الوجه لاقتراح مَن في الصورة. مع ذلك، يتطلب الوصول إلى هذه التنبؤات تدريبًا فعالاً على نموذج الذكاء الاصطناعي، وقد تتطلب التطبيقات الأحدث التي تعتمد على الذكاء الاصطناعي أساليب مختلفة قليلاً للتعلم.
في جوهرها، يمثل نموذج الذكاء الاصطناعي مجموعة من الخوارزميات المحددة والبيانات المستخدمة لتدريب هذه الخوارزميات حتى تتمكن من إجراء التنبؤات الأدق. في بعض الحالات، يستخدم النموذج البسيط خوارزمية واحدة فقط، لذلك؛ قد يتداخل المصطلحان، لكن النموذج نفسه هو المخرجات بعد التدريب.
بحس رياضي، يمكن اعتبار الخوارزمية معادلة مع معاملات غير محددة. يأتي النموذج معًا عندما تستوعب الخوارزميات المحددة مجموعات البيانات لتحديد قيم المعامل الأكثر ملاءمة، وبالتالي إنشاء نموذج للتنبؤات. يشير مصطلح "تدريب نموذج الذكاء الاصطناعي" إلى هذه العملية: تغذية بيانات الخوارزمية، وفحص النتائج، وتعديل مخرجات النموذج لزيادة الدقة والفعالية. للقيام بذلك، تحتاج الخوارزميات إلى كميات هائلة من البيانات التي تسجل مجموعة كاملة من البيانات الواردة.
يجب أن تتعامل أوجه الخلل والمفاجآت وأوجه عدم الاتساق والأنماط غير المنطقية في للوهلة الأولى...الخوارزميات مع كل هذه القيم وأكثر، بشكل متكرر، عبر جميع مجموعات البيانات الواردة. تمثل هذه العملية أساس التعلم—القدرة في التعرُّف على الأنماط وفهم السياق واتخاذ القرارات المناسبة. مع ما يكفي من التدريب على نموذج الذكاء الاصطناعي، تمثل مجموعة الخوارزميات داخل النموذج مؤشرًا رياضيًا لموقف معين يبني في تفاوت غير متوقعة مع زيادة إمكانية التنبؤ إلى أقصى حد.
النقاط الرئيسة
يمثل تدريب نموذج الذكاء الاصطناعي عملية تكرارية يعتمد نجاحه على جودة المدخلات وعمقها بالإضافة إلى قدرة المدربين على تحديد أوجه القصور والتعويض عنها. يتعامل علماء البيانات عادةً مع عملية التدريب، على الرغم من أنه حتى مستخدمو الأعمال يمكن أن يشاركوا في بعض البيئات منخفضة التعليمات البرمجية/دون تعليمات برمجية. في الواقع، فإن دورة المعالجة والمراقبة وتقديم الملاحظات والتحسين تشبه تعليم الطفل مهارة جديدة. باستخدام تدريب نموذج الذكاء الاصطناعي، يتمثل الهدف في إنشاء نموذج رياضي ينشئ مخرجات بدقة مع موازنة العديد من المُتغيرات وأوجه الخلل والمضاعفات الممكنة المختلفة في البيانات. عندما تفكر في ذلك، تعرض تربية الأطفال رحلة مماثلة—لكن أكثر—فوضى.
فكِّر كيف يتعلم الأطفال مهارة. على سبيل المثال، دعنا نقول أنك تريد تعليم طفل تحديد الفَرق بين الكلاب والقطط. يبدأ ذلك بالصور الرئيسة والتشجيع. يتم تقديم المزيد من المتغيرات فيما بعد، مع تفاصيل مثل متوسط الأحجام، والنباح مقابل التموء، وأنماط السلوك. استنادًا إلى ما قد يكافحه الطفل، يمكنك التركيز أكثر على مجال معين للمساعدة في تسهيل التعلم. في نهاية هذه العملية، يجب أن يكون الطفل قادرًا على تحديد جميع أنواع الكلاب والقطط، من الحيوانات الأليفة المنزلية الشائعة إلى أنواع الحياة البرية.
إن تدريب نموذج الذكاء الاصطناعي مشابه.
الذكاء الاصطناعي: حدد الخوارزميات ومجموعة بيانات التدريب الأولي للنموذج.
الطفل: استخدم الصور الرئيسة لتحديد الفروق العامة بين الكلب والقطة.
الذكاء الاصطناعي: تقييم دقة المخرجات وضبط النموذج لتقليل بعض حالات عدم الدقة أو التخلص منها.
الطفل: تقديم الثناء أو التصحيحات بناءً على الإجابات.
الذكاء الاصطناعي: توفير مجموعات بيانات إضافية بمدخلات مُتنوعة مُحددة لتخصيص النموذج وضبطه.
الطفل: تمييز السمات والأشكال والأحجام المختلفة كجزء من عملية التعلم.
كما هو الحال مع الأطفال، يمكن أن يؤثر التدريب الأولي على نموذج الذكاء الاصطناعي بشكل كبير على ما يحدث مستقبلاً—وإذا كانت توجد حاجة إلى مزيد من الدروس لإطلاق العنان للتأثيرات السيئة. يسلط هذا الضوء على أهمية مصادر بيانات الجودة، سواء للتدريب الأولي أو التعلم المُتكرر المستمر حتى بعد إطلاق النموذج.
تستفيد معظم المؤسسات بالفعل من الذكاء الاصطناعي في عمليات سير العمل والعمليات، وذلك بفضل التطبيقات التي تنشئ تحليلات أو تسلط الضوء على أوجه خلل البيانات أو تستخدم التعرُّف على النصوص ومعالجة اللغة الطبيعية. فكر في نسخ إيصالات الورقية والمستندات إلى سجلات البيانات على سبيل المثال. مع ذلك، تتطلع العديد من المؤسسات إلى تطوير نماذج الذكاء الاصطناعي بغرض تلبية حاجة ملحة ومحددة. قد تكشف عملية التطوير نفسها عن مستويات أعمق من المزايا، من القيمة قصيرة الأجل، مثل العمليات المتسارعة وصولاً إلى المكاسب طويلة الأجل، مثل الكشف عن الرؤى الخفية سابقًا أو ربما حتى إطلاق منتج أو خدمة جديدة.
ينبع السبب الأساس للاستثمار في بنية تحتية قادرة على دعم الذكاء الاصطناعي من طريقة نمو الشركات. ببساطة، تتوفر البيانات في كل مكان. مع وجود الكثير من البيانات الواردة من جميع الاتجاهات، يمكن إنشاء رؤى جديدة لكل جزء من المؤسسة تقريبًا، بما في ذلك العمليات الداخلية وأداء المبيعات وفِرق التسويق. مع أخذ ذلك في الاعتبار، يتيح التدريب المناسب والتطبيق المدروس للذكاء الاصطناعي توفير قيمة الأعمال في أي ظرف تقريبًا.
مع مراعاة طريقة تدريب المؤسسة على الذكاء الاصطناعي لتحقيق أقصى فائدة، تتمثل الخطوة الأولى في تحديد المدخلات وما يصنع قرارًا قويًا. على سبيل المثال، ضع في اعتبارك سلسلة توريد التصنيع. بمجرد توفر جميع البيانات ذات الصلة لنظام الذكاء الاصطناعي المُدرب بشكل صحيح، يمكنه حساب تكاليف الشحن والتنبؤ بأوقات الشحن ومعدلات الجودة/العيب والتوصية بتغييرات الأسعار بناءً على ظروف السوق وتنفيذ العديد من المهام الأخرى. إن الجمع بين أحجام البيانات الواردة الكثيفة والحاجة إلى قرارات قائمة على البيانات يجعل سلاسل التوريد جاهزة لحل مشكلات الذكاء الاصطناعي. في المقابل، في الحالات التي تظل فيها المهارات الشخصية أولوية قصوى، يمكن للذكاء الاصطناعي توفير معلومات داعمة لكن من غير المرجح أن يقدم تغييرًا ثوريًا. ومن الأمثلة على ذلك تقييم المدير لأداء الموظف أثناء المراجعات السنوية. في هذه الحالة، قد يسهل الذكاء الاصطناعي جمع المقاييس، لكنه لا يمكنه استبدال التقييمات التي تم إجراؤها استنادًا إلى التفاعل بين البشر وبعضهم.
للحصول على أقصى استفادة من استثمار الذكاء الاصطناعي، يجب على المؤسسات مراعاة ما يلي:
من خلال تحديد هذه المعايير، يمكن للمؤسسات تحديد مجالات العمل الأكثر احتمالاً للاستفادة من الذكاء الاصطناعي، ثم البدء في اتخاذ خطوات لجعل هذه الأمور حقيقة واقعة.
في حين أن كل مشروع يأتي مع تحدياته ومتطلباته الخاصة، تظل العملية العامة لتدريب نماذج الذكاء الاصطناعي نفسها.
تشتمل هذه الخطوات الخمس على نظرة عامة لتدريب نموذج الذكاء الاصطناعي.
إعداد البيانات: يبدأ تدريب نموذج الذكاء الاصطناعي الناجح ببيانات ذات جودة تمثل بدقة واتساق مواقف أصلية ومن العالم الحقيقي. دون ذلك، فإن النتائج المترتبة على ذلك لا معنى لها. لتحقيق النجاح، يجب على فِرق المشروع تنظيم مصادر البيانات المناسبة، وبناء العمليات والبنية التحتية لجمع البيانات اليدوية والآلية، وإنشاء عمليات التنقيح/التحويل المناسبة.
تحديد نموذج تدريب: إذا كان تنظيم البيانات يوفر الأساس للمشروع، فينشئ تحديد النموذج الآلية. تتضمن مُتغيرات هذا القرار تحديد معلمات المشروع وأهدافه واختيار البنية وتحديد خوارزميات النموذج. نظرًا إلى أن نماذج التدريب المُختلفة تتطلب كميات مختلفة من الموارد، يجب تقييم هذه العوامل مقابل العناصر العملية مثل متطلبات الحوسبة والمواعيد النهائية والتكاليف والتعقيد.
إجراء التدريب الأولي: كما هو الحال مع المثال أعلاه في تعليم طفل أن يحي إلى قطة من كلب، يبدأ تدريب نموذج الذكاء الاصطناعي بالأسس. يمكن أن يؤدي استخدام مجموعة بيانات واسعة جدًا أو مُعقدة جدًا لخوارزمية أو نوع نموذج خاطئ إلى نظام يعالج البيانات ببساطة بدلاً من التعلم والتحسين. خلال التدريب الأولي، يجب أن يركز علماء البيانات في الحصول على نتائج ضمن المعلمات المتوقعة أثناء مراقبة الأخطاء التي تخترق الخوارزمية. من خلال التدريب دون تجاوز، يمكن للنماذج أن تتحسن بشكل منهجي في خطوات ثابتة ومضمونة.
تدقيق التدريب: بمجرد اجتياز النموذج مرحلة التدريب الأولية، يتم إنشاء النتائج المتوقعة بشكل موثوق عبر معايير رئيسة. يمثل التحقق من التدريب المرحلة التالية. قرر الخبراء هنا تحدي النموذج بشكل مناسب في محاولة للكشف عن المشكلات أو المفاجآت أو الثغرات في الخوارزمية. تستخدم هذه المرحلة مجموعة مُنفصلة من مجموعات البيانات من المرحلة الأولية، بشكل عام مع زيادة الاتساع والتعقيد مقابل مجموعات بيانات التدريب.
مع تشغيل علماء البيانات تصريحات باستخدام مجموعات البيانات هذه، يقيّمون أداء النموذج. في حين أن دقة الإخراج هامة، تكون العملية نفسها بنفس القدر من الأهمية. تتضمن أهم أولويات العملية متغيرات مثل الدقة والنسبة المئوية للتنبؤات الدقيقة والاستدعاء والنسبة المئوية لتحديد الفئة الصحيح. في بعض الحالات، يمكن الحكم على النتائج بقيمة المقياس. على سبيل المثال، مجموع نقاط F1 هو مقياس مُخصص لنماذج التصنيف التي تتضمن الأوزان من أنواع مختلفة من نتائج إيجابية/سلبية خاطئة، مما يسمح بتفسير أشمل لنجاح النموذج.
اختبار النموذج: بمجرد التحقق من صحة النموذج باستخدام مجموعات بيانات مُنسقة وملائمة الغرض، يمكن استخدام البيانات المباشرة لاختبار الأداء والدقة. يجب سحب مجموعات البيانات لهذه المرحلة من سيناريوهات من العالم الحقيقي، وهي خطوة مأثورة لـ "سحب الدعم" للسماح للنموذج بالعمل بمفرده. إذا كان النموذج يوفر نتائج دقيقة—والأهم من ذلك، متوقعة—مع بيانات الاختبار، فيكون جاهز للعمل. إذا أظهر النموذج أوجه القصور بأي شكل من الأشكال، تتكرر عملية التدريب حتى يفي النموذج بمعايير الأداء أو يتجاوزها.
في حين أن بدء العمل مرحلة بارزة، فإن تحقيق هذه المرحلة لا يعني نهاية تدريب النموذج. اعتمادًا على النموذج، قد تكون كل مجموعة بيانات تتم معالجتها "درسًا" آخر للذكاء الاصطناعي، مما يؤدي إلى مزيد من التحسين والتعزيز للخوارزمية. يجب أن يواصل علماء البيانات مراقبة الأداء والنتائج، خاصةً عندما يتعامل النموذج مع بيانات غير متوقعة. في حالة ظهور نتائج غير دقيقة، حتى في حالات نادرة فحسب، قد يحتاج النموذج إلى مزيد من التعديل حتى لا يفسد الناتج المستقبلي.
يأتي تدريب الذكاء الاصطناعي في العديد من الأشكال المختلفة التي تتراوح بين التعقيد وأنواع النتائج والإمكانات وقوة الحوسبة. يمكن لطريقة واحدة استخدام موارد أكثر من اللازم، بينما في حالات أخرى قد توفر طريقة استجابة ثنائية كما هو الحال في نعم أو لا للموافقة على القرض، وعندما يتطلب الوضع نتيجة أكثر نوعية، مثل "لا" شرطية حتى يتم توفير المزيد من الوثائق.
يجب أن يكون اختيار الطريقة المستخدمة لنموذج الذكاء الاصطناعي عاملاً في كل من الأهداف والموارد؛ قد تتطلب المغامرة إلى الأمام دون تخطيط دقيق إعادة تشغيل فِرق علم البيانات من البداية، مما يهدر الوقت والمال.
في حين تستخدم بعض نماذج الذكاء الاصطناعي القواعد والمدخلات لاتخاذ القرارات، توفر الشبكات العصبية العميقة القدرة على التعامل مع القرارات المعقدة بناءً على علاقات البيانات المتنوعة. تعمل الشبكات العصبية العميقة مع طبقات عديدة تحدد الأنماط والعلاقات المرجحة بين نقاط البيانات لإجراء مخرجات تنبؤية أو تقييمات مستنيرة. تتضمن أمثلة الشبكات العصبية العميقة مساعدين عاملين بالصوت مثل Siri من Apple أو Alexa من Amazon.
في الإحصاءات، يتم استخدام الانحدار الخطي لتحديد العلاقة بين المدخلات والمخرجات. في أبسط أشكاله، يمكن تمثيل ذلك بالصيغة الجبرية y = Ax + B. يستخدم هذا النموذج مجموعة بيانات لإنشاء تلك المعادلة استنادًا إلى المدخلات والمخرجات ومعاملات المتغيرات المحتملة. يفترض النموذج النهائي المستخدم للتنبؤ وجود علاقة خطية بين المدخلات والمخرجات. مثال على حالة استخدام الانحدار الخطي في تقدير المبيعات على أساس بيانات المبيعات السابقة.
مأخوذ من مجال الإحصاءات، بمثل الانحدار اللوجستي نموذج فعَّال للمواقف الثنائية. يستند الانحدار اللوجستي على وظيفة لوجستية، وهي معادلة ذات منحنى S تستخدم غالبًا لحساب الاحتمال. في حالة نمذجة الذكاء الاصطناعي، يحدد الانحدار اللوجستي الاحتمال ويقدم نتيجة ثنائية لإجراء التنبؤات في نهاية المطاف أو اتخاذ قرار، على سبيل المثال، إذا كان يجب اعتماد مقدم الطلب للحصول على قرض. يأتي مثال على حالة استخدام الانحدار اللوجستي في تطبيق للإدارة المالية يكشف عن الاحتيال.
يتمتع معظم الناس بخبرة في أشجار القرار، حتى خارج الذكاء الاصطناعي. تعمل أشجار القرارات بشكل مشابه لنقاط التوصيل في المخططات الانسيابية. في التعلم الآلي، تغذي عمليات التدريب الشجرة من خلال البيانات المتكررة لتحديد وقت إضافة نقاط التوصيل ومكان إرسال مسارات نقاط التوصيل المختلفة. يأتي مثال على حالة استخدام أشجار القرارات في اعتماد القرض المالي.
يمكن أن تصبح أشجار القرار أكثر ملاءمة لمجموعات التدريب الخاصة بها من خلال إنشاء عمق كبير للغاية. تعوض تقنية الغابات العشوائية عن ذلك من خلال الجمع بين مجموعة من أشجار القرار—ومن ثم مصطلح "الغابات"—وإيجاد أكبر توافق في الآراء أو متوسط مرجح في النتائج. يأتي مثال على حالة استخدام الغابات العشوائية في التنبؤ بسلوك العميل استنادًا إلى مجموعة متنوعة من أشجار القرارات عبر عناصر مختلفة من ملف تعريف العميل.
من جانب تعليم الطفل، فإن التعلم الاستقرائي يعادل جعل طفلك يمر بمناهج محددة مع دروس نظامية. بالنسبة إلى نمذجة الذكاء الاصطنا��ي، يعني ذلك استخدام مجموعات بيانات التدريب المحددة والمعلمات المحددة لتدريب النموذج، مع عمل علماء البيانات بصفتهم معلمين كما في المثال في تنظيم مجموعات بيانات التدريب وتشغيل مجموعات بيانات الاختبار وتوفير ملاحظات النموذج. يأتي مثال على حالة استخدام التعلم الاستقرائي في العثور على خلايا غير طبيعية في الأشعة السينية للرئة. تتمثل مجموعة بيانات التدريب في الأشعة السينية مع تشوهات وبدونها وإخبار النموذج ما الفرق بينهما.
استمرارًا لقياس تعليم الطفل، يظهر التعلم الاستنتاجي بأنه يشبه فلسفة مونتيسوري، إذ يتم تقديم الأطفال مع مجموعة من الاحتمالات وحرية توجيه الذات على أساس فضولهم. بالنسبة إلى نمذجة الذكاء الاصطناعي، يعني ذلك استيعاب مجموعة بيانات غير مُسماة دون معلمات أو أهداف—يعود الأمر إلى الذكاء الاصطناعي لتحديد الأنماط في البيانات. يأتي مثال على حالة استخدام التعلم الاستنتاجي في بائع تجزئة يقوم بتغذية بيانات المبيعات ربع السنوية لنموذج الذكاء الاصطناعي بهدف العثور على الارتباطات في سلوك العميل.
إذا كنت قد عززت في أي وقت مضى السلوك المطلوب بمكافآت، فقد شاركت في التعلم بالتعزيز. على مستوى الذكاء الاصطناعي، يبدأ التعلم بالتعزيز بالقرارات التجريبية التي تؤدي إلى تعزيز إيجابي أو سلبي. بعد مرور الوقت، يتعلم الذكاء الاصطناعي أفضل القرارات، كما هو الحال في القرارات الأدق أو الأكثر نجاحًا، للتعامل مع الموقف وتحقيق أقصى قدر من التعزيز الإيجابي. يأتي مثال على حالة استخدام التعلم بالتعزيز في قائمة اقتراحات "قد ترغب أيضًا" المقدمة من YouTube على أساس سجل المشاهدات.
قد ينجح نموذج الذكاء الاصطناعي عند تطبيقه على موقف مختلف. يشير نقل التعلم إلى طريقة استخدام نموذج الذكاء الاصطناعي الحالي بصفته نقطة بداية لنموذج جديد. تعمل إعادة الصياغة هذه بشكل أفضل عندما يتعامل النموذج الحالي مع سيناريو عام؛ قد يكون من الصعب إعادة التدريب على أي شيء محدد للغاية. يأتي مثال على حالة استخدام نقل التعلم في نموذج ذكاء اصطناعي جديد لنوع مُحدد من تصنيف الصور استنادًا إلى معلمات من نموذج تصنيف صور موجود.
باستخدام مبادئ كل من التعلم الاستقرائي والاستنتاجي، يبدأ التعلم الاستنتاجي بتدريب النموذج على مجموعة صغيرة من مجموعات البيانات المسماة. من تلك النقطة، يستخدم النموذج مجموعات بيانات غير مُسماة وغير منسقة لتحسين الأنماط وإنشاء رؤى غير متوقعة. بشكل عام، يستخدم التعلم شبه الاستقرائي مجموعات البيانات المسماة فحسب للخطوات القليلة الأولى، مثل عجلات التدريب. بعد ذلك، تعتمد العملية بشكل كبير على البيانات غير المُسماة. يأتي مثال على حالة استخدام التعلم شبه الاستقرائي في نموذج تصنيف النص، والذي يستخدم مجموعة مُنسقة لإنشاء المعلمات الرئيسة قبل التغذية بكميات كبيرة من المستندات النصية الاستنتاجية.
تمثل النماذج التوليدية طريقة ذكاء اصطناعي استنتاجية تستخدم نماذج كبيرة جدًا لمجموعات البيانات لتكوين مخرجات موجهة. تأتي أمثلة ذلك في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي استنادًا إلى بيانات التعريف الخاصة بأرشيف صور أو نص تنبؤي استنادًا إلى قاعدة بيانات من الجمل المكتوبة. بدلاً من مجرد تصنيف البيانات في مخرجاتها، يمكن أن تستغرق النتائج من النماذج العامة الآلاف وربما الملايين من البيانات النموذجية لمعرفة المخرجات الأصلية وإنشائها. يأتي مثال على حالة استخدام نموذج توليدي في روبوت محادثة، مثل ChatGPT.
لكي يتم تدريب نموذج الذكاء الاصطناعي بشكل صحيح، فإنه يحتاج إلى بيانات—الكثير من البيانات. في الواقع، تعد البيانات العنصر الأهم في تدريب نموذج الذكاء الاصطناعي. دونها، لا يمكن للنموذج ببساطة أن يتعلم. دون بيانات عالية الجودة، يتعلم النموذج الأشياء الخاطئة. بالتالي، يختار علماء البيانات مجموعات بيانات لمشروعاتهم بقصد واهتمام.
يجب أن تتضمن معالجة مجموعة البيانات العوامل التالية للتدريب الأمثل لنموذج الذكاء الاصطناعي:
يأتي تدريب نموذج الذكاء الاصطناعي مع تحدياته الفريدة. تكون بعضًا من هذه في البنية التحتية—اللوجستية، وقوة الحوسبة، والاعتبارات العملية الأخرى من البداية إلى النهاية. تتطلب التحديات الأخرى تفحصًا من جانب علماء البيانات، مثل تطوير فهم طريقة تخفيف التحيزات والحفاظ على هدف النظام الناتج.
يجب أن تكون التحديات التالية اعتبارات في أي مبادرة تدريب نموذج ذكاء اصطناعي:
التحيز في البيانات: للحصول على نتائج دقيقة من نموذج الذكاء الاصطناعي، يتطلب التدريب بيانات عالية الجودة. للتخفيف من التحيز في البيانات، يجب على علماء البيانات فحص مصادر البيانات بدقة قبل تنظيم مجموعات بيانات التدريب.
البيانات السليمة: تتطلب مجموعات بيانات التدريب كميات كبيرة من البيانات التي تمثل التنوع والدقة المناسبين. لا يتطلب هذا الأمر من الفِرق تنظيم كميات كبيرة من بيانات الجودة فحسب، بل يأتي مع العديد من الاعتبارات العملية. تزداد صعوبة التخزين والتنقيح/التحويل والمعالجة ومراقبة الجودة العامة مع زيادة حجم مجموعة البيانات.
متطلبات البنية التحتية وقوة الحوسبة: كلما زاد تعقيد نموذج الذكاء الاصطناعي، زادت الحاجة إلى دعم البنية التحتية وقوة الحوسبة. يجب مراعاة التطبيق العملي لتشغيل النموذج، بدءًا من التدريب حتى بدء التنفيذ، عند اختيار طريقة النموذج. إذا كان نوع النموذج يتطلب موارد أكثر مما هو ممكن للتقديم، فينهار المشروع بأكمله.
التجهيز الزائد: عندما يتم ضبط نموذج الذكاء الاصطناعي بشكل مُفرط في مجموعات بيانات التدريب، يمكنه التقييد بتلك التفاصيل بدلاً من القدرة على التعامل مع التنوع والمفاجآت. تُعرف هذه الظاهرة باسم "التجهيز الزائد"، وتمنع التنبؤات الدقيقة في المستقبل. يأتي مثال على التجهيز الزائد في عندما تنتج مجموعة بيانات التدريب دقة 99%، لكن مجموعة البيانات في العالم الحقيقي تنتج دقة 75% إلى 85% فقط. لاحظ أن الدقة المتصورة في الذكاء الاصطناعي تشير إلى مدى جودة أداء النظام من ناحية الدقة استنادًا إلى إمكاناته الحالية. إنها الدقة التي تتم ملاحظتها أو تجربتها من المستخدمين أو أصحاب المصلحة. من ناحية أخرى، تشير الدقة المحتملة في الذكاء الاصطناعي إلى أقصى مستوى من الدقة يمكن للنظام تحقيقه في الظروف المثالية، مع الموارد المثلى. يعد فهم الفَرق بين الدقة المتصورة والدقة المحتملة أمرًا هامًا في تقييم أداء نظام الذكاء الاصطناعي وتحديد مجالات التحسين أو التطوير المستقبلي.
يتم استخدام مصطلحي "التجهيز الزائد" و"التدريب الزائد" غالبًا بالتبادل، لكن لديها معنيين مختلفين. يمثل التجهيز الزائد كما نوقش في عندما يؤدي الذكاء الاصطناعي أداءً جيدًا للغاية على بيانات التدريب الخاصة به، لكنه يفشل في التعميم بشكل جيد على البيانات الجديدة. يكون التدريب الزائد عندما تم تدريب نموذج بشكل مُفرط، مما أدى إلى ضعف الأداء على كل من بيانات التدريب والبيانات الجديدة. يمكن أن يحدث التدريب الزائد عندما يتم تدريب نموذج لفترة طويلة جدًا أو مع الكثير من التعقيد، مما يتسبب في النضال وصولاً إلى التعميم. يجب تجنب كلتا المشكلتين في عملية التدريب النموذجية.
إمكانية التفسير: تتمثل إحدى المشكلات البارزة في نمذجة الذكاء الاصطناعي في عدم إمكانية التفسير حول طريقة اتخاذ القرارات. يمكن للمستخدمين إجراء استنتاجات بناءً على المخرجات، لكن قد تظل أسباب النموذج مبهمة. أنشئ بعض المطورين أدوات لسد هذه الفجوة، بما في ذلك النماذج المصممة لتحقيق إمكانية تفسير أكثر شفافية. مع ذلك، يختلف التنفيذ وقابلية الاستخدام والتفاصيل وإمكانية الوصول لكل من المدخلات والمخرجات.
على الرغم من أن الذكاء الاصطناعي كان موجودًا بشكل ما منذ بزوغ عصر الحوسبة، إلا أن التطورات في الخوارزميات، وقوة وحدة المعالجة المركزية، وقوة وحدة معالجة الرسومات (GPU)، ومشاركة الموارد المستندة إلى السحابة دفعت الذكاء الاصطناعي بشكل كبير نحو الأمام على مدار العقدين الماضيين. يتم تضمين الذكاء الاصطناعي في العديد من التطبيقات التي يستخدمها العديد من المستخدمين دون تحقيق ذلك. عند تُشغل الموسيقى، تأتي قوائم التشغيل المُخصصة من الذكاء الاصطناعي الذي يحلل الأغاني والفنانين المفضلين لديك. عند كتابة رسالة نصية، يقدم الذكاء الاصطناعي اقتراحات تنبؤية تستند إلى كلماتك شائعة الاستخدام. إذا وجدت برنامجًا تلفزيونيًا جديدًا تحبه بفضل توصية آلية، فيرج الفضل إلى الذكاء الاصطناعي.
هذا هو وقت الذكاء الاصطناعي، لكن ما الذي يكمن في الأُفق؟
تعتمد إمكانات الذكاء الاصطناعي على الإمكانات المُتطورة لتدريب النماذج. دعونا نلقي نظرة على الإمكانيات المستقبلية في تدريب نموذج الذكاء الاصطناعي.
إذا كان الأمر يبدو أن ابتكارات الذكاء الاصطناعي قد تطورت بشكل كبير، فيوجد سبب وجيه لذلك: لقد جعل انفجار البيانات والاتصال على مدار العقد الماضي من الأسهل بكثير تدريب أنظمة الذكاء الاصطناعي كما سمح بإنجاز نماذج مُعقدة، وإضافة الخوارزميات الجديدة والمحسنة إلى النجاح. بسبب ذلك، صار يبدو عدد من الأهداف السامية ممكنًا خلال العقد المقبل، بما في ذلك التفكير العميق، إذ يكتسب الذكاء الاصطناعي القدرة على فهم الطريقة وراء المواقف وسبب ذلك؛ وزيادة كفاءة التدريب باستخدام مجموعات بيانات أصغر؛ كما نمت نماذج أكثر كفاءة وأدق من التعلم الاستنتاجي.
بالنسبة إلى الأشخاص، تزيد المهارات القابلة للنقل من قابلية التوظيف والإنتاجية من خلال تسهيل البدء في مهمة جديدة. ينطبق الشيء نفسه على نقل التعلم في الذكاء الاصطناعي. مع ذلك، لا يزال التعلم الفعَّال للتحويل يواجه عددًا من التحديات. في الوقت الحالي، يعمل نقل التعلم بشكل أفضل في مجالات مماثلة على الفور للنموذج الأصلي، مما يحد من استخدامه. يتطلب توسيع إمكانات نقل التعلم المزيد من قوة الحوسبة والموارد لدعم التعقيد الأكبر لإعادة التدريب. دون ابتكارات في الكفاءة والمعالجة، قد يكون من الأسهل ببساطة إنشاء نموذج من البداية.
ربما تكون أقوى سمة للذكاء الاصطناعي في قدرته على أداء المهام أسرع وأدق من البشر، مما يخفف من موظفي الشحن والمحاسبين وغيرهم في أداء المهام المتكررة. بطبيعة الحال، يتطلب الوصول إلى هذه النقطة الوقت والجهد في تنظيم مجموعات البيانات ومراقبة المخرجات وتعديل النموذج.
يمكن لمجموعة مُتنوعة من أدوات تدريب نموذج الذكاء الاصطناعي تسريع عملية التطوير والتدريب. تشمل هذه الأدوات مكتبات النماذج التي تم إنشاؤها مُسبقًا، وأطر العمل مفتوحة المصدر، ومساعدي الترميز والبيئة، وتعزيز التدرج. يعتمد البعض على نوع النموذج المستخدم بينما يتطلب البعض الآخر معايير معينة لموارد الحوسبة.
لتحديد الأداة أو الأدوات التي تعمل بشكل أفضل لمشروعك، يمكنك تجميع إجابات للأسئلة التالية:
يمكن أن تساعد هذه الإجابات في إنشاء قائمة قصيرة من الأدوات الفعَّالة لمساعدة عملية تدريب نموذج الذكاء الاصطناعي.
يمكن أن يكون تدريب نماذج الذكاء الاصطناعي المُعقدة مبادرة كثيفة الموارد، إذ تنسِّق مئات وربما آلاف من الخدمات المستقلة المعلومات وتشاركها. توفر البنية التحتية من Oracle Cloud (OCI) وحدات معالجة الرسومات المتصلة عبر شبكة إيثرنت عالية الأداء لتوفير الوقت والمال للعملاء مع زيادة التوافر والاستقرار إلى أقصى حد. باستخدام OCI، يحصل العملاء على اتصالات بسيطة وسريعة لدعم التدريب ونشر النماذج المُعقدة للغاية على نطاق واسع.
تم بناء التكوينات الأساسية للتعلم الآلي للذكاء الاصطناعي على قواعد واحتمالات مكثفة قائمة على حسابات عالية القدرة. ينافس الكمبيوتر الفائق ديب بلو (Deep Blue) في بطولات الشطرنج ذات المستوى العالمي بهذه الطريقة. مع ذلك، تطور الذكاء الاصطناعي إلى ما هو أبعد من استخدام القواعد المدعومة بالبيانات الخارجية؛ بدلاً من ذلك تركز نماذج الذكاء الاصطناعي الآن على إنشاء رؤى داخلية من خلال التدريب من خلال كميات كبيرة من مجموعات البيانات. في حين لا تزال بعض نماذج الذكاء الاصطناعي تستخدم أشجار القرارات المستندة إلى القواعد، تدعم نماذج أخرى العمليات والتنبؤات المُعقدة بفضل الشبكات العصبية.
يظهر التقدم في الذكاء الاصطناعي مدهش، لكن يعتمد مستقبل هذه التكنولوجيا على التدريب عالي الجودة.
ترغب المؤسسات التي تضطلع بتدريب نموذجي، على أي مستوى في ضمان توثيق مجموعات البيانات ذات الصلة والمعارف المؤسسية توثيقًا جيدًا. تكون إحدى الطرق الرائعة لتحقيق ذلك في مركز التميز للذكاء الاصطناعي، الذي يوفر مزايا لا تعد ولا تحصى تتجاوز دعم التدريب.
ما المقصود بالتدريب على نموذج الذكاء الاصطناعي؟
يمثل تدريب نموذج الذكاء الاصطناعي عملية تغذية مجموعات بيانات مُنسقة لنموذج الذكاء الاصطناعي لتطوير دقة مخرجاته. قد تكون العملية طويلة، اعتمادًا على تعقيد نموذج الذكاء الاصطناعي، وجودة مجموعات بيانات التدريب، وحجم بيانات التدريب. بمجرد اجتياز عملية التدريب لمعيار للنجاحات المتوقعة، يواصل علماء البيانات مراقبة النتائج. إذا انخفضت الدقة أو واجه النموذج صعوبة في التعامل مع أنواع معينة من المواقف، فقد يتطلب النموذج مزيدًا من التدريب.
أين يمكنني تدريب نموذج الذكاء الاصطناعي؟
يمكن لأي شخص لديه إمكانية الوصول إلى الأدوات المناسبة تدريب نموذج الذكاء الاصطناعي باستخدام أي جهاز كمبيوتر، بافتراض أن لديه إمكانية الوصول إلى البيانات المطلوبة. تتضمن الخطوات تحديد المشكلة وتحديد نموذج التدريب والعثور على مجموعات بيانات التدريب وتشغيل عمليات التدريب. يمكن أن يكون هذا على نطاق صغير أو محلي أو على نطاق مؤسسي كبير حسب نطاق المشروع والموارد المتاحة. يمكن للمطورين الجُدد أو المُستقلين الاستفادة من الخدمات السحابية التي توفر موارد وحدة المعالجة المركزية (CPU) عبر مجموعة متنوعة من لغات البرمجة وإخراج الجغرافيا من المعادلة.
كم تبلغ تكلفة تدريب نماذج الذكاء الاصطناعي؟
تعتمد تكلفة تدريب نموذج الذكاء الاصطناعي على نطاق المشروع. على مستوى المجال، التكاليف تستمر في الاتجاه التنازلي، إذ توفر قوة CPU/GPU والوصول السحابي المزيد من الموارد. في الواقع، كان متوسط تكلفة التدريب لمشروع صغير، مثل تصنيف الصور 1000 دولار في عام 2017، لكن 5 دولارات فقط في عام 2022، وفقًا إلى مؤشر الذكاء الاصطناعي لمعهد الذكاء الاصطناعي الذي يركز على الإنسان في ستانفورد.
بالمقارنة، تتزايد بالفعل تكلفة مشروعات الذكاء الاصطناعي للمؤسسات الكبيرة. على سبيل المثال، قد يتطلب شيء مثل التدريب على ChatGPT موازنة تقدر بـ 3 ملايين دولار إلى 5 ملايين دولار. يرجع هذا التفاوت إلى تعقيد المشروعات وحقيقة أن الموارد المتزايدة تجعل المشروعات متزايدة التعقيد وغير المُقيدة بحدود متاحة—إذا كنت تستطيع تحمل تكاليفها.
كيف يمكن تعلُّم نمذجة الذكاء الاصطناعي؟
لمعرفة كيفية إجراء التدريب على نموذج الذكاء الاصطناعي، يلزم توفير التثقيف الرسمي أو التدريب أثناء العمل. بمجرد امتلاك الخبرة، ابدأ بالخطوات الأربع التي ينطوي عليها إنشاء نموذج الذكاء الاصطناعي.
ما الأنواع الأربعة لنماذج الذكاء الاصطناعي؟
بشكل عام، تتمثل الأنواع الأربعة لنماذج الذكاء الاصطناعي فيما يلي:
يستخدم بعض علماء البيانات أيضًا نقل التعلم، إذ يمثل نموذج الذكاء الاصطناعي الحالي نقطة بداية لنموذج جديد، والتعلم شبه الاستقرائي، والذي يمزج التعلم الاستقرائي والاستنتاجي.