القاهرة: الأمير كمال فرج.
في خطوة تكشف عن التكاليف الخفية لثورة الذكاء الاصطناعي، وفي استعارة صارخة لتدمير الصناعة الفنية، كشف تقرير حديث عن الأساليب التي اتبعتها شركة Anthropic لجمع البيانات اللازمة لتدريب نموذجها للذكاء الاصطناعي Cloud.
لم يقتصر الأمر على مجرد الاستفادة من ملايين الكتب المحمية بحقوق الطبع والنشر، بل تجاوزتها إلى التدمير المادي لتلك الأعمال.
ذكرت مجلة Ars Technica، إن "شركة Anthropic المدعومة من Google لم تكتفِ بالاقتباس من ملايين الكتب المحمية بحقوق الطبع والنشر، وهي ممارسة محفوفة بالمشكلات الأخلاقية والقانونية بحد ذاتها. بل قامت بقطع صفحات الكتب من أغلفتها، ومسحها ضوئيًا لتحويلها إلى ملفات رقمية، ثم تخلصت من ملايين الصفحات الأصلية لتلك النصوص.
إن القول بأن الذكاء الاصطناعي "التهم" هذه الكتب ليس مجرد تعبير بلاغي، بل وصف دقيق لما حدث.
كُشفت هذه الممارسة في حكم قضائي يتعلق بحقوق الطبع والنشر صدر يوم الاثنين، والذي شكل انتصاراً كبيراً لشركة Anthropic وصناعة التكنولوجيا المتعطشة للبيانات بشكل عام. ووجد القاضي الذي ترأس القضية، قاضي المحكمة الجزئية الأمريكية ويليام ألسوب، أن Anthropic يمكنها تدريب نماذجها اللغوية الكبيرة على الكتب التي اشترتها بشكل قانوني، حتى بدون الحصول على إذن صريح من المؤلفين.
يعود هذا القرار، جزئياً، إلى طريقة Anthropic في مسح الكتب المدمرة - والتي ليست هي الشركة الأولى التي تستخدمها، وفقًا لـ Ars Technica، ولكنها ملحوظة بسبب حجمها الهائل.
باختصار، تستفيد هذه الممارسة من مفهوم قانوني يُعرف باسم "مبدأ البيع الأول" first-sale doctrine، والذي يسمح للمشتري بفعل ما يشاء بمشترياته دون تدخل صاحب حقوق الطبع والنشر. هذا المبدأ هو ما يسمح بوجود سوق الكتب المستعملة؛ وإلا فإن ناشر الكتاب، على سبيل المثال، قد يطالب بحصة أو يمنع إعادة بيع كتبه.
لكن شركات الذكاء الاصطناعي استخدمت هذا المبدأ بسوء نية. فوفقًا للوثائق القضائية، وظفت Anthropic رئيس الشراكات السابق في مشروع Google لمسح الكتب، توم تورفي، في فبراير 2024 للحصول على "جميع كتب العالم" دون الوقوع في "صعوبات قانونية/عملية/تجارية"، كما وصفها الرئيس التنفيذي لـ Anthropic داريو أمودي، وفقًا للملف.
وتوصل تورفي إلى حل بديل: بشراء الكتب المادية، ستكون Anthropic محمية بمبدأ البيع الأول ولن تضطر بعد الآن إلى الحصول على ترخيص. كما أن إزالة الصفحات سمح بمسح أسهل وأرخص.
وبما أن Anthropic استخدمت الكتب الممسوحة ضوئيًا داخليًا فقط وتخلصت من النسخ بعد ذلك، فقد وجد القاضي أن هذه العملية تشبه "الحفاظ على المساحة"، مما يعني أنها "تحويلية" وبالتالي، فهي قانونيًا مقبولة.
بالطبع، إنها طريقة التفاف مشبوهة ونفاق صارخ. فعندما بدأت Anthropic عملها لأول مرة، سلكت الشركة مسارًا أكثر عديمي الضمير، وهو تنزيل ملايين الكتب المقرصنة لتغذية ذكائها الاصطناعي. كما فعلت Meta ذلك أيضًا مع ملايين الكتب المقرصنة، وتخضع حاليًا لدعوى قضائية من قبل مجموعة من المؤلفين بسبب ذلك.
إنها أيضًا طريقة تتسم بالكسل والإهمال. فكما تشير الصحيفة، لقد ابتكر العديد من أمناء المحفوظات أساليب مختلفة لمسح الكتب بكميات كبيرة دون الحاجة إلى تدمير أو تغيير النسخ الأصلية، بما في ذلك أرشيف الإنترنت ومشروع Google الخاص بالكتب (والذي كان قبل وقت ليس ببعيد موضوع معركة كبرى خاصة به حول حقوق الطبع والنشر).
لكن كل هذا لتوفير بعض الدولارات - وللحصول على تلك البيانات التدريبية الثمينة للغاية. وبالفعل، فإن صناعة الذكاء الاصطناعي بدأت تنفد منها المصادر عالية الجودة لتغذية نماذجها - ليس أقلها أنها قضت كل هذا الوقت في تدمير المصادر التي تعتمد عليها بشكل قصير النظر - لذا فإن الإضرار ببعض المؤلفين وإرسال بعض الكتب إلى آلة التقطيع هو، بالنسبة لشركات التكنولوجيا الكبرى، ثمن زهيد.