كشفت وثائق قضائية جديدة، أُفرج عنها في سياق قضية حقوق الطبع والنشر بين شركة Kadrey وميتا، عن هوس قادة ميتا بـ الذكاء الاصطناعي وسعيها الى التفوق على نموذج GPT-4 من OpenAI أثناء تطوير نموذج الذكاء الاصطناعي المفتوح Llama 3.
وأظهرت الوثائق رسائل داخلية تعود إلى أكتوبر 2023، حيث قال أحمد الدحل، نائب رئيس الذكاء الاصطناعي التوليدي في ميتا، لأحد الباحثين: “هدفنا يجب أن يكون GPT-4، لدينا 64 ألف وحدة معالجة رسومية (GPU) قادمة! علينا أن نتعلم كيفية بناء نموذج متقدم والفوز في هذا السباق.”
منافسة شرسة وسقف طموحات ميتا مرتفع
رغم أن ميتا أطلقت نماذج ذكاء اصطناعي مفتوحة المصدر، إلا أن الرسائل المسربة تكشف أن تركيز الشركة الأساسي كان على التفوق على المنافسين الذين يحتفظون بنماذجهم مغلقة، مثل OpenAI وAnthropic، بدلًا من التنافس مع الشركات التي تقدم نماذج مفتوحة مثل Mistral.
وفي إحدى الرسائل، قلل الدحل من شأن شركة Mistral الفرنسية، المنافس الرئيسي لميتا في مجال النماذج المفتوحة، قائلًا: “Mistral لا تُقارن بنا، يجب أن نكون قادرين على تقديم ما هو أفضل.”
تجاوزات أخلاقية في سباق التفوق؟
وكشفت الوثائق أن بعض قادة ميتا كانوا على استعداد لتجاوز الحدود الأخلاقية، حيث ناقش الدحل مع زميله هوغو توفرون إمكانية استخدام مجموعة بيانات من منصة LibGen، المعروفة باحتوائها على أعمال محمية بحقوق الطبع والنشر من دور نشر تعليمية كبرى.
ويبدو أن تحسين جودة بيانات التدريب كان يشكل تحديًا أساسيًا، إذ اعترف باحثو ميتا بأن مزيج البيانات المستخدم في تدريب Llama 2 كان سيئًا، وفق ما ورد في الوثائق.
زوكربيرج ووعود الهيمنة في 2025
وفي رسالة داخلية تعود إلى يوليو 2024، أكد مارك زوكربيرج، الرئيس التنفيذي لميتا، أن الشركة ستهيمن على مجال الذكاء الاصطناعي قريبًا، قائلًا “في هذا العام، تنافس نماذج Llama 3 النماذج الأكثر تقدمًا وتتفوّق في بعض المجالات، وبدءًا من العام المقبل، نتوقع أن تصبح نماذج Llama المستقبلية الأكثر تقدمًا في المجال.”
وأطلقت ميتا رسميًا نماذج Llama 3 في أبريل 2024، حيث نجحت في منافسة النماذج المغلقة من OpenAI وجوجل وAnthropic، وتفوقت على النماذج المفتوحة من Mistral، ومع ذلك، فإن البيانات المستخدمة في تدريب هذه النماذج أصبحت الآن تحت مجهر التحقيقات القانونية.
ضغوط واتهامات قانونية تهدد ميتا
تسلط هذه الوثائق الضوء على الضغوط الكبيرة التي تواجهها ميتا للتفوق في سباق الذكاء الاصطناعي، لكنها تكشف أيضًا عن تحديات قانونية وأخلاقية خطيرة، إذ تواجه الشركة اتهامات باستخدام بيانات محمية بحقوق الطبع والنشر دون إذن، مما قد يعرّض نماذجها المفتوحة لخطر قانوني كبير في المستقبل.