في تطور جديد يسلّط الضوء على تسارع قدرات الذكاء الاصطناعي التوليدي، قدمت Google نسخة متقدمة من نموذجها الشهير Veo لتوليد الفيديوهات، بإصدار ثالث يحمل قفزة نوعية في دمج المؤثرات الصوتية الواقعية داخل مقاطع الفيديو المولّدة بالكامل بواسطة الذكاء الاصطناعي.
النموذج الجديد، Veo 3، الذي كشفت عن جوجل هذا الأسبوع في مؤتمر I/O، لا يكتفي فقط بإنتاج مشاهد بصرية غنية التفاصيل بل بات قادرًا على توليد أصوات بيئية مقنعة تُضاف بدقة إلى الفيديو، ما يعزز من الإيهام الواقعي ويزيد من قوة التأثير العاطفي للمحتوى.
ما يثير الانتباه هو أن هذه التقنية الجديدة تُستخدم لإنشاء مقاطع فيديو تتجاوز المألوف، حيث تدمج مشاهد “سريالية” وغير تقليدية بأصوات محاكية تمامًا للواقع، مثل أصوات الرياح، الماء، الخطوات، وحتى المحادثات البشرية بواقعية مرعبة.
هذه الميزة تُعد بمثابة حلم لمصممي المحتوى والإعلانات الترويجية، ولكنها في الوقت ذاته تفتح الباب على مصراعيه أمام موجة جديدة من المحتوى المزيف أو المضلل.
الخبراء أشاروا إلى أن Veo 3 قد يشكل نقطة تحوّل في كيفية إنتاج الفيديوهات الرقمية، حيث لم تعد هناك حاجة لمعدات تصوير حقيقية أو تسجيل صوتي خارجي.
يكفي وصف المشهد بالكلمات حتى يولّد الذكاء الاصطناعي فيديو كامل بصوت وصورة بجودة تقترب من الواقع.
لكن وسط الإعجاب التقني، عبّر البعض عن قلقهم من الاستخدامات غير الأخلاقية لهذه التقنية.
فالقدرة على إنشاء محتوى يبدو حقيقيًا تمامًا قد تُستخدم لتضليل الجمهور، أو إنشاء مقاطع فيديو دعائية خادعة، أو حتى استنساخ مشاهد “ملعونة” وغير مرغوب فيها بشكل متعمد.
Google لم تُعلن رسميًا عن توفّر Veo 3 للعامة بعد، لكن الاستعراضات المبكرة للنموذج أثارت الكثير من النقاشات حول ما إذا كانت هذه القدرات التقنية المتقدمة تمثل تقدمًا حتميًا أم تهديدًا محتملًا للمصداقية البصرية في عصر الذكاء الاصطناعي.
Veo 3 لا يمثّل فقط تطورًا في تقنيات إنتاج الفيديو، بل يطرح سؤالًا جوهريًا عن حدود ما يمكن تصديقه بصريًا وسمعيًا في عصر تتحول فيه كل فكرة إلى “واقع مصنّع” بكبسة زر.