شرکت فیسبوک، ابزار جدیدی معرفی کرده که به افراد نابینا و کم‌بینا کمک می‌کند تصاویر را بیینند. در واقع منظور از «دیدن» این است که نابینایان می‌توانند با توضیحی که سیستم از محتوای عکس در اختیارشان قرار می‌دهد دیدی کامل از تصاویر پیدا کنند.      ‌‌‌‌   ‌‌‌

فیسبوک می‌خواهد به کمک هوش مصنوعی کاری کند که کاربران نابینا و کم‌بینا هم بتوانند از شبکه‌های اجتماعی بهره‌ ببرند. این شرکت اخیرا ابزار جدیدی را با نام Automatic Alternative Text یا AAT معرفی کرده است.  این سرویس فعلا فقط در سیستم عامل iOS در دسترس است. قابلیت AAT به کمک تکنولوژی تشخیص اشیا، توضیحاتی را در مورد تصاویر تولید می‌کند و آن‌ها را در اختیار نابینایان قرار می‌دهد.

فیسبوک چندین ماه است که روی این پروژه کار می‌کند. «مت کینگ» (Matt King) اولین مهندس نابینای فیسبوک چند ماه پیش به نویسنده‌ی سایت TechCrunch گفته بود: « این روزها فید‌های خبری از تصاویر پر شده‌اند؛ معمولا کاربران شرحی در مورد تصاویر می‌نویسند یا نظرشان را درباره‌ی تصاویر منتشر می‌کنند. اما فردی مثل من می‌خواهد بداند در داخل تصویر چه می‌گذرد.» جالب است بدانید که چند روز پیش، مایکروسافت هم یکی از بات‌های هوشمند خود را در اختیار کاربران قرار داد. سرویس CaptionBot هم تقریبا کار مشابهی را انجام می‌دهد.

قبل از این‌که فیسبوک، AAT را معرفی کند، کاربران نابینا تنها می‌توانستند به کمک نرم‌افزارهای Screen Reader، نام فردی که روی فیسبوک پست گذاشته را بشنوند و در بهترین حالت به پیام‌های متنی کاربران گوش بدهند. اما حالا آن‌ها می‌توانند بفهمند دقیقا در تصاویر چه می‌گذرد.

شاید سیری به‌زودی هم زمزمه کند و هم فریاد بزند
مشاهده

در سیستم AAT از یک شبکه‌ی عصبی با میلیاردها پارامتر استفاده شده. این سرویس فیسبوک که بر اساس هوش مصنوعی کار می‌کند، تا حالا توسط میلیون‌ها مثال مورد سنجش قرار گرفته. این مثال‌ها به یادگیری ماشینی کمک کرده‌اند.

تکنولوژی ارایه‌شده به‌وسیله‌‎ی فیسبوک، قادر است محتوای تصاویر مربوط به حمل‌ونقل (خودرو، موتور، قایق،…)، طبیعت (محیط‌های خارجی، کوه، موج، خورشید، علف،…)، ورزش (تنیس، شنا، استادیوم،…)، غذا (بستنی، سوشی، دسر،…) را به‌خوبی تشخیص بدهد.

سرویس AAT فعلا برای سیستم عامل iOS‌ در دسترس است؛ اما احتمالا به‌زودی برای اندروید و همچنین وب ارایه می‌شود. در حال حاضر این قابلیت فقط به زبان انگلیسی می‌تواند محتوای تصاویر را توصیف کند. اما تیمی که روی این پروژه کار می‌کند قول اضافه شدن زبان‌های دیگر را هم داده است.