هل مللت من البرامج والخدمات على النت التي تعامل مع الصوت وتحوله لكلام؟
اغلبها مدفوع ويعطيك تجربة محدودة بطيئة وسيئة، هذا الى جانب انك تحتاج ان تعطيها صلاحة الوصول لكل ما تريد تحويله والذي طبعا لا يمت لامان او الخصوصية بصلة! لذلك اليوم اعرض عليك برنامج بالذكاء الاصطناعي يمكنه فعل ذاك واكثر محليا على جهازك ☆
WhisperLive هو برنامج مفتوح المصدر وظيفته تحويل الصوت الى نص باستعمال نموذج Whisper المقدم من شركة OpenAi وذلك عن طريق واجهة رسومية او نصية. ويشمل هذا التحويل الملفات الصوتية او مباشرة من المايكروفون وايضا اي برنامج يحتوي على صوت مثل المتصفح وهو ما سنقوم به في مقالنا هذا.
انشئ البرنامج من قبل شركة collabora وهي شركة بريطانية مقرها في المملكة المتحدة، وتعرف بكونها واحدة من ابرز الداعمين، على الصعيد العالمي، لمشاريع البرمجيات الحرة والمفتوحة المصدر.
تعمل الشركة على مشاريع مشهورة مثل:
Linux kernel (نواة لينكس)
GStreamer (معالجة الوسائط)
Wayland (نظام العرض الرسومي الحديث خليفة x11)
WhisperLive (تحويل الصوت إلى نص)
رغم كونها تدعم البرامج مفتوحة المصدر لكنها شركة خاصة وربحية. تعتمد في مداخيلها على:
التطوير حسب الطلب: تبني أنظمة برمجية مفتوحة تناسب احتياجات الشركات.
الاستشارات التقنية: تقدّم المشورة في تبنّي البرمجيات المفتوحة ضمن الأنظمة التجارية.
الدعم الفني: للشركات التي تحتاج دعما في استخدام الأنظمة والبرامج مفتوحة المصدر.
مثال:
شركة مثل Intel قد تطلب من Collabora تعديل نواة لينكس لتدعم بطاقة رسومية جديدة. في هذه الحالة، Collabora تحصل على الأجر مقابل تلك التعديلات، وتضيف التعديلات في النواة ليستفيد الكل.
ما نريد القيام به اليوم هو اعداد جهازنا ليشغل خادم (Server) WhisperLive الذي سنستعمله رفقة اضافة (Extension) في المتصفح لتحويل الكلام في صفحة من صفحات ذلك المتصفح الى كتابة يعطينا اياها في صندوق تحتوي نص الكلام المنطوق او ترجمه لغة اخرى.
الصندوق الاسود في الاسفل هو ما نسعى اليه
وان نجحتفي التثبيت وتشغيل الخادم مع الاضافة، يبقى ان جودة عمله مرتبطة بمدى قوة موارد جهازك ولاسف جهازي مثلا لم يكن قادرا على معالجتها بالسرعة الكافية ما انتج تأخر كبير بين المكتوب والمقول.
هي اللغة التي كتب بها WhisperLive وكل أوامر التشغيل والمكتبات التي نحتاجها تعتمد عليه.
📌 التثبيت
للحصول عليه نفتح الموقع الرسمي لبايثون ونتجاوز النسخة الاخيرة (واجهت بعض المشاكل في التثبيت معها) ونثبت النسخة التي استعملتها وهي نسخة 3.12.10 التي تجدها في القائمة في اسفل الموقع او عبر رابط التحميل الذي تجدها هنا. بعد الدخول اذهب الى آخر الصفحة واختر برنامج التثبيت الذي تحتاجه والذي غالبا سيكون Windows installer (64 bit)
تثبيت الملف:
افتح المجلد الذي يحتوي الملف المحمّل بمدير الملفات ثم اضغط على الملف بيمين الفأرة ثم اختر copy as path :
بعدها عد الى الطرفية واكتب pip install ثم الصق المسار الذي نسخته
ثم شغّل:
في الطرفية (Terminal) افتح المجلد الذي يحتوي البيئة الافتراضية )هو نفسه المجلد الذي يحتوي المشروع whisper-live لو اتبعت ما كتبته بحذافيره) ثم فعلها بالأمر:
source whisper_env/Scripts/activate
تشغيل خادم WhisperLive
لتشغيل الخادم المحلي الذي يستقبل الصوت ويحوّله إلى نص، نفّذ الأمر التالي في الطرفية:
تشغيل الاضافة
بعد تشخيل الخادم افتح متصفحك واي فيديو ترغب في ان تستعمل الاضافة معه ثم اختر الغة او اتركها اوتوماتيكية وحد نوع الوظيفة التي ستقوم بها (تقديم نص الفيديو او ترجمة الكلام) بعدها اختر الموديل الذي تود استعماله واضغط Start capture.
ان كنت تستعمل الموديل اول مرة فعلك الانتظار الى ان ينتهي تحميله ويمكنك رؤية التقدم في التحميل في الطرفية اين شغلة الخادم