Speechify تطلق مساعدًا صوتيًا وكتابة صوتية لمنافسة ChatGPT و Gemini

Speechify: تعزيز تجربة الصوت في متصفح كروم


لوح أبيض عليه رسم بياني معقد يوضح المفاهيم والعلاقات بينها

ميزات Speechify الجديدة: إملاء دقيق ومساعد تفاعلي

إملاء دقيق

تحويل الكلام إلى نص بدقة عالية.

مساعد صوتي تفاعلي

يجيب على استفساراتك ويساعد في فهم المحتوى.


Speechify: المعروفة في الأساس كأداة لتحويل النصوص إلى صوت للمقالات وملفات PDF والمستندات، تعزز الآن إضافتها لمتصفح كروم بميزات متقدمة لاكتشاف الصوت. تشمل هذه الميزات الكتابة الصوتية الدقيقة ومساعدًا صوتيًا تفاعليًا يجيب على استفسارات المستخدمين. مساعد صوتي تفاعلي

أداة الإملاء الصوتي المتقدمة


سبورة بيضاء مليئة بالرسوم البيانية والعناصر النصية المترابطة

نمو أدوات اكتشاف الصوت: شهدت الأشهر الاثنا عشر الماضية نموًا ملحوظًا في أدوات اكتشاف الصوت، مدفوعًا بالتحسين المستمر في جودة نماذج التعرف على الكلام. تستفيد Speechify من هذا التطور بإطلاق أداة إملاء متقدمة تدعم اللغة الإنجليزية، والتي تتميز بتصحيح الأخطاء وإزالة الكلمات غير الضرورية، على غرار أفضل أدوات الإملاء المتاحة.

تحسينات الأداء والدقة والتحديات الحالية


علامة استفهام مرسومة على سبورة

إمكانية التحسين: خلال تجربة أولية قصيرة، تبين أن هناك إمكانية كبيرة للتحسين في أداء Speechify. بينما تعمل الأدوات بكفاءة مع تطبيقات مثل Gmail و Google Docs، فقد وُجدت صعوبات في تفعيل الإملاء الصوتي على منصات مثل WordPress. وقد أوضحت الشركة أنها تعمل على إضافة تحسينات تدريجية لدعم المواقع الشهيرة بشكل أفضل.

معدل الخطأ: بالنسبة للدقة، لوحظ أن معدل الخطأ في الكلمات كان أعلى مقارنة بأدوات أخرى مثل Wispr Flow و Willow و Monologue. لكن Speechify أشارت إلى أن نموذجها يعتمد على التعلم المستمر، حيث يتحسن الأداء وينخفض معدل الخطأ تدريجيًا مع زيادة الاستخدام.

المساعد الصوتي التفاعلي ورؤية Speechify للذكاء الاصطناعي

التركيز على التجربة الصوتية مع الذكاء الاصطناعي

المستخدم يسأل

إدخال صوتي

المساعد يجيب


مساعد صوتي تفاعلي: تُطلق الشركة الناشئة مساعدًا صوتيًا تفاعليًا متوفرًا في الشريط الجانبي للمتصفح. يتيح هذا المساعد للمستخدمين طرح أسئلة تتعلق بالمحتوى المعروض، مثل الاستفسار عن الأفكار الرئيسية أو طلب تبسيط للمعلومات.

التركيز على التجربة الصوتية: على الرغم من أن منصات مثل ChatGPT و Gemini توفر أوضاع محادثة، إلا أن Speechify ترى أن الصوت فيها يُعد ميزة ثانوية. بينما تركز أداة Speechify بشكل أساسي على التجربة الصوتية لتكون جوهر تفاعل المستخدم. صرح روهان بافولوري، الرئيس التنفيذي للأعمال في Speechify، لموقع TechCrunch عبر البريد الإلكتروني، أن "الدردشة ستبقى التجربة الافتراضية الرئيسية لمستخدمي ChatGPT و Gemini. أما الصوت، فسيبقى دائمًا ميزة ثانوية أو إضافة لاحقة لتلك المنصات. من خلال خبرتنا لسنوات في تطوير Speechify، ندرك وجود شريحة واسعة من السوق، بما في ذلك مستخدمينا، تفضل أن يكون الصوت هو الإعداد الأساسي والافتراضي في كل تفاعل مع الذكاء الاصطناعي عبر التطبيقات."

خطط Speechify المستقبلية ووكلاء الذكاء الاصطناعي

الدمج الشامل

دمج ميزات الصوت والذكاء الاصطناعي تدريجيًا في جميع تطبيقات Speechify (الأجهزة المكتبية والهواتف المحمولة).

وكلاء الذكاء الاصطناعي لإنجاز المهام

تطوير وكلاء ذكاء اصطناعي مستقلين لإنجاز المهام نيابة عن المستخدمين (مثل تحديد المواعيد).


التحديات الحالية: لا يتوافق مساعد Speechify مع المتصفحات التي تدمج مساعدين جانبيين، مثل Atlas من OpenAI و Coment من Perplexity و Dia. ومع ذلك، لا تزال الشركة الناشئة تركز على هذه النقطة، نظرًا لأن الإضافة تستهدف بشكل كبير متصفح Chrome وقاعدته الجماهيرية الكبيرة.

الدمج الشامل: أعلنت Speechify عن خططها المستقبلية لدمج ميزات الكتابة الصوتية والمساعد الصوتي تدريجيًا في جميع تطبيقاتها، لتشمل بذلك الأجهزة المكتبية والهواتف المحمولة.

وكلاء ذكاء اصطناعي لإنجاز المهام: تطمح Speechify أيضًا إلى تطوير وكلاء ذكاء اصطناعي يقومون بإنجاز المهام نيابة عن المستخدمين. على الرغم من عدم الكشف عن خارطة الطريق الكاملة، قدمت الشركة مثالًا على ذلك، مثل إجراء المكالمات لتحديد المواعيد أو الانتظار في قائمة انتظار خدمة العملاء، وهي أهداف تسعى لتحقيقها شركات أخرى مثل Truecaller و Cloaked.

Next Post Previous Post
No Comment
Add Comment
comment url