تشارك أشليشا كيف يمكن للشركات الاستفادة من قوة الذكاء الاصطناعي ، ولا سيما LLMs في تكنولوجيا الصوت لتحويل التجارب القائمة على الموسيقى
بدءًا من إخطارك بالإصدار الجديد لفنانك المفضل وحتى إطلاعك على السرعة في التدوينات الصوتية التي تتابعها وحتى تشغيل التهويدات لأطفالك وقت النوم ، يساعدك المساعدون الصوتيون (VAs) مثل Siri و Alexa و Google Assistant في جميع هذه المهام ، و أكثر.
الذكاء الاصطناعي (AI) هو جوهر هذه الثورة ، مما يمكّن هؤلاء المساعدين الصوتيين من فهم أوامر المستخدمين وتنفيذها بأكثر الطرق ملاءمةً ودقةً وذات طابع شخصي. في مجال الترفيه – وخاصة الموسيقى – أحدثت التطورات الحديثة في الذكاء الاصطناعي ، ولا سيما نماذج اللغات الكبيرة (LLMs) مثل OpenAI’s GPT 3.5 ، تحولًا في تجربة المستخدم للمساعدين الصوتيين.
تقود Ashlesha Kadam فريق المنتج التقني العالمي لتجارب الموسيقى المستندة إلى الذكاء الاصطناعي على المساعدين الصوتيين لأفضل خدمة بث الموسيقى ، وقد عملت على نطاق واسع على تطوير أحد أكثر المساعدين الصوتيين استخدامًا على نطاق واسع ، وقدمت براءتي اختراع في مجال المساعدين الصوتيين والذكاء الاصطناعي. هي تشاركنا وجهة نظرها.
الوضع الحالي للمساعدين الصوتيين المدعومين بالذكاء الاصطناعي للترفيه
يتحدث Kadam عن كيفية استخدام المساعدين الصوتيين للذكاء الاصطناعي اليوم للتجارب الموسيقية ، “يستخدم المساعدون الصوتيون الذكاء الاصطناعي حاليًا على نطاق واسع لإنشاء تجربة مفيدة ومسلية وممتعة لمستخدميها”.
تعتمد أدوات المساعدة الصوتية على معالجة اللغة الطبيعية لفهم أوامر المستخدم وتنفيذها بشكل صحيح. يوضح Kadam ، “على سبيل المثال ، قد يطلب المستخدم الذي يستمع إلى أغنية من المساعد الصوتي” تشغيل النسخة الصوتية من هذا “ويكتشف المساعد الصوتي ما يعنيه” هذا “. أو عندما يقول المستخدم “play divide” ، يعرف المساعد الصوتي أن Divide هو اسم ألبوم موسيقي شهير من تأليف Ed Sheeran وليس المرجع الرياضي “.
تم استخدام الذكاء الاصطناعي أيضًا لفترة من الوقت لتقديم توصيات موسيقية أكثر تخصيصًا وجاذبية. شارك Kadam مثالاً عن كيفية قيام الذكاء الاصطناعي بتفعيل التوصيات المتعلقة بالمساعدين الصوتيين – “في بعض الأحيان ، يقدم المستخدمون طلبات غامضة مثل” تشغيل بعض الموسيقى “. من الممكن معرفة ما يجب تشغيله لكل مستخدم بناءً على ذوقه الموسيقي باستخدام الذكاء الاصطناعي. “على سبيل المثال ، قد يرغب المستخدم في الاستماع إلى شيء أكثر تفاؤلاً في الصباح مقابل شيء أكثر استرخاءً في نهاية اليوم. وأضافت أن العثور على التوصية المناسبة لكل فرد في الوقت المناسب ممكن باستخدام الذكاء الاصطناعي.
تأثير الذكاء الاصطناعي المتقدم والماجستير على المستخدمين
تتمتع نماذج اللغات الكبيرة (LLMs) بفهم غير مسبوق للغة الطبيعية والسياق الذي يساعد في إنشاء تطبيقات جديدة ومثيرة للترفيه عبر المساعدين الصوتيين.
حددت كدم أن ما تعتقد أنه أحد أكبر التغييرات الإيجابية مع LLMs – “يمكن للـ LLM ، إلى جانب الاستخدام الحالي للذكاء الاصطناعي ، إجراء محادثات مع المساعدين الصوتيين أكثر طبيعية وشبيهة بالبشر. على سبيل المثال ، يمكنك أن تطلب من مساعد صوتي إنشاء قائمة تشغيل للجري الصباحي اليومي الذي يحتوي على أحدث أغاني البوب المبهجة ، مع المزيد من الموسيقى مثل Drake ولكن لا يوجد Ed Sheeran ، ويحتوي على موسيقى إنجليزية وهندية ، ويستمر لمدة 90 دقيقة على الأقل “.
اليوم ، لا يتم دعم أي من هذه الطلبات بسلاسة على أي من المساعدين الصوتيين السائدين في الولايات المتحدة ، ولكن هذه الاحتمالات جارية مع أحدث التطورات في LLM.
يمكن أن تسمح أحدث تطورات الذكاء الاصطناعي للمساعدين الصوتيين بفهم الحالة المزاجية والحالات العاطفية المحددة للمستخدمين ، وما هو النشاط الذي يؤدونه وما هي الموسيقى التي يحبونها وما يكرهونها ، لإنشاء تجربة موسيقية مصممة بشكل مثالي لهم.
علاوة على ذلك ، من خلال الجمع بين الجودة العالية للتوصيات الموسيقية والتجارب متعددة الوسائط (عبر الشاشات التي تعمل باللمس ، على سبيل المثال) و AR (الواقع المعزز) ، يمكن للمساعدين الصوتيين إنشاء تجارب موسيقية غنية وغامرة. وأضاف الخبير: “فكر في أن تكون قادرًا على حضور حفلة افتراضية لفنانك المفضل ، مع القدرة على تجربة الحفلة الموسيقية ومسرحها ، وأنت مرتاح في غرفة المعيشة الخاصة بك”.
أقام عدد قليل من الفنانين مثل ترافيس سكوت وأريانا غراندي حفلات موسيقية افتراضية خلال حقبة إغلاق Covid-19 لمواصلة التواصل مع معجبيهم من خلال الاستفادة من AR.
أوجه القصور والمخاطر
مثل أي عرض آخر قائم على التعلم الآلي ، فإن LLM أيضًا عرضة للتحيزات اعتمادًا على البيانات التي يتم تدريبها عليها.
يسلط Kadam الضوء على بعض أوجه القصور الأخرى في فعالية LLM حول حالات استخدام الموسيقى – “مثل أي نماذج أخرى ، تعتمد LLMs على البيانات النصية التي تم تدريبهم عليها. لا يمكنهم تحليل الألحان والتناغمات الموسيقية خارج الصندوق ، ولا فهم نظرية الموسيقى والتأليف “.
عيب آخر مهم يجب أخذه في الاعتبار هو أن صناعة الموسيقى تتطور بسرعة. قد يكون الاتجاه السائد اليوم قديمًا في غضون أيام قليلة. عادة ما يتم تدريب LLMs حتى وقت معين ، ومن المكلف إعادة تدريبهم بشكل متكرر. ونتيجة لذلك ، قد لا تساعد LLMs في اكتشاف ما هو مثير وشائع في المشهد الموسيقي ، وهو أمر يهتم به الكثير من المستخدمين “، علق كدم.
لقد قام المساعدون الصوتيون بالفعل بتحويل الطريقة التي يتفاعل بها المستخدمون مع التكنولوجيا لأغراض ترفيهية مثل الاستماع إلى الموسيقى والبودكاست. مع الخطوات الأخيرة في مجال الذكاء الاصطناعي ، وخاصة LLMs ، يمكننا أن نتوقع أن تصبح تقنية الصوت الواجهة الرئيسية التي يسعى المستخدمون من خلالها إلى الحصول على تجارب فريدة ورائدة وغامرة. ومع ذلك ، فإن LLM ليست الحل الفضي لتوفير تجربة مثالية. لا تزال هناك فجوات في LLMs التي لا تزال بحاجة إلى المعالجة من أجل التمكن من استخدامها بفعالية في حالات استخدام الموسيقى على المساعدين الصوتيين.
(ملاحظة: جميع الآراء ووجهات النظر تخص الفرد ولا تمثل صاحب العمل).
– عمار طارق هو استراتيجي المحتوى في Teamology Softech و Media Private Limited.