محققان مرکز هوشمند مصنوعی شرکت گوگل که DeepMind نام دارد، توانسته‌اند امکان لب‌خوانی کردن را به هوش مصنوعی گوگل اضافه کنند. براساس ادعای محققان این سیستم دقیق‌ترین روش موجود برای لب خوانی کردن است.

محققان با استفاده از ساعت‌ها برنامه‌ی تلویزیونی از خبرگزاری‌های مختلف و سخرانی‌های معمولی توانسته‌اند دقت هوش مصنوعی شرکت گوگل برای لب‌خوانی را به ۴۶.۸ درصد برسانند. شاید در نگاه اول این آمار چندان شگفت انگیز نباشد؛ اما باید به این موضوع اشاره کنیم که لب‌خوان‌های حرفه‌ای با دقت ۱۲.۴ درصد می‌توانند این کار را انجام دهند.

البته گروهی دیگر از محققان چند وقت پیش توانسته بودند یک برنامه‌ی لب خوانی با نام LipNet خلق کنند که در شرایط خاص دقت آن به ۹۳.۴ درصد هم می‌رسید. البته این برنامه روی افرادی خاص که یکسری جملات رسمی بیان می‌کردند، آزمایش شده بود. هوش مصنوعی گوگل در لحظه‌ ویدیوها را نگاه می‌کند و در شرایط مختلف می‌تواند صحبت‌ها را حدس بزند؛ به همین دلیل چالش‌های بیشتری را پشت‌سر می‌گذارد. این هوش مصنوعی می‌تواند صحبت‌هایی که از قبل مشخص نشده‌اند و یا در برنامه‌های زنده گفته می‌شوند را هم تشخیص دهد.

برای بالا بردن دقت این هوش مصنوعی از ۵۰۰۰ ساعت ویدیو استفاده شده است. این ویدیوها شامل ۱۷۵۰۰ کلمه‌ی منحصر به فرد بودند. محققان مرکز DeepMind گفته‌اند که از هوش مصنوعی گوگل می‌توان برای ترجمه کردن صحبت مهاجران استفاده کرد. حتی می‌توان از آن در فیلم‌های بی‌صدا و حتی برای کنترل کردن دستیارهای دیجیتالی مانند سیری و الکسا استفاده کرد. افراد کافی است تنها جلوی دوربین لب‌های خودشان را تکان دهند تا هوش مصنوعی متوجه گفته آن‌ها بشود و دستور را اجرا کند.

۸ حقیقت اعجاب انگیز در مورد شفق‌های قطبی
مشاهده