الگوریتمی ارائه شده است که برپایه‌ی آن می‌توانیم دنباله‌های اعداد جذاب برای انسان‌ را پیش‌بینی کنیم.

یکی از ویژگی‌های جذاب ریاضی، زیبا بودن آن است. اما اینکه زیبایی در ریاضی به چه معناست، مفهوم پیچیده‌ای است.

شاید یکی از مشهورترین مثال‌ها برای زیبایی ریاضی، نسبت اویلر (e + 1 = 0) است که ارتباط عمیق بین زمینه‌های ظاهرا بی‌ربط ریاضی را نشان می‌دهد. به‌عنوان مثال π  از هندسه، e  و i  از جبر، اعداد ابتدایی ۰ و ۱ و عمل جمع و مساوی هم از نظریه‌ی اعداد هستند. چنین مواردی هر کدام مربوط به قلمرویی خاص از ریاضیات هستند و در عین حال با یکدیگر ارتباط دارند و این از عجایب دنیای ریاضی است.

مشخصا وجود چنین ارتباطی نشان از جالب بودن ریاضی دارد. الگوهای ریاضی همیشه جزو آن دسته از مواردی هستند که تنها انسان قادر به تشخیص آنها بوده است.

اما در سال‌های اخیر، ماشین‌ها هم ابزاری داشتند که بتوانند با استفاده از آنها، الگوهای خاص را شناسایی کنند. درواقع ماشین‌ها در شناسایی چهره، اشیا و بسیاری از نقش‌های بازی، بسیار بهتر از انسان‌ها عمل می‌کنند. چنین مسئله‌ای احتمال جالبی را به وجود می‌آورد: آیا الگوریتم‌های یادگیری ماشینی می‌توانند الگوهای جالب و ظریف موجود در ریاضی را نیز شناسایی کنند؟ آیا آنها می‌توانند در کشف زیبایی‌های ریاضی نقش محوری بازی کنند؟

خوشبختانه امروزه به‌لطف کار پژوهشی چای‌وا‌ وو در مرکز تحقیق واتسون شرکت IBM در نیویورک، پاسخی برای این گونه‌ سوال‌ها به‌دست آمده است. وو یک الگوریتم یادگیری ماشینی ساخته است که می‌تواند انواع مشخصی از ساختارهای ظریف در ریاضی را شناسایی کند و از آنها برای بیرون کشیدن توالی‌های جالب در محیط‌های کاملا تصادفی استفاده کند.

تکنیک این الگوریتم با استفاده از یک پایگاه داده‌ی غیرمتعارف به‌نام دانشنامه‌ی آنلاین دنباله‌های صحیح یا Online Encyclopedia of Integer Sequences کار می‌کند که ابتدا در دهه‌ی ۱۹۶۰ توسط ریاضی‌دانی به‌نام نیل اسلون ساخته شد و در سال ۱۹۹۶ وارد دنیای وبشد.

برندگان مشترک نوبل شیمی ۲۰۱۸ اعلام شدند
مشاهده

توالی و دنباله‌ی اعداد، به مجموعه‌ای از اعداد گفته می‌شود که طبق قانون خاص خود در کنار هم قرار گرفته‌اند. به‌عنوان مثال می‌توان به توالی اعداد اول اشاره کرد که تنها بر ۱ و خودشان بخش‌پذیرند. توالی دیگر، دنباله فیبوناچی است که هر عدد، حاصل مجموع دو عدد قبلی است. دنباله‌های دیگری هم هستند که می‌توانند قانون خاص خود را داشته باشند مثلا اعداد فردی که از ۷ شروع شوند.

درواقع ریاضی‌دانانی که دانشنامه‌ی آنلاین دنباله‌های صحیح را مدیریت می‌کنند، اینترنت را به محیطی گسترده برای یافتن توالی‌های جالب ریاضی تبدیل کرده‌اند که نمونه‌های زیادی از این دست، در آن وجود دارد. این پایگاه داده، توالی ۶۶۶ را هم در خود دارد.

پایگاه داده حتی شامل توالی‌هایی از اعداد صحیح حاوی عدد ۶۶۷ هستند. دلیل خاص بودن این عدد به زمانی برمی‌گردد که مردم از فکس استفاده می‌کردند. شماره تلفن هر مشترک به‌علاوه‌ی ۱، شماره‌ی فکس آنها بود. به‌عبارت دیگر، اگر شماره تلفن مشترکی ۱۲۳۴۵۶۷ بود، شماره فکس آنها ۱۲۳۴۵۶۸ در نظر گرفته می‌شد. با چنین تفکری، عدد ۶۶۷ به توالی ۶۶۶ بسیار نزدیک بود.

امروزه پایگاه داده‌ی Integer Sequence حاوی ۳۰۰ هزار توالی است و روزبه‌روز به این تعداد اضافه می‌شود؛ چه از جانب افراد حرفه‌ای و چه از طرف آماتورها. بسیاری از آنها با این کار به مسائل جالبی در ریاضی اشاره می‌کنند.

وظیفه‌ی وو این بود که راهی برای تمییز چنین توالی‌هایی از انواع تصادفی آن پیدا کند. ایده‌ی وو این بود که بتواند قوانینی تجربی به دست آورد؛ قوانینی که میزان جالب بودن توالی‌ها از منظر انسان‌ها را پیدا کند. وو گفت:

قوانین تجربی به خودی خود جزو نظریه‌های ریاضی محسوب نمی‌شوند؛ آنها درواقع مشاهدات تجربی ناشی از روابطی هستند که در بسیاری از مجموعه‌‌ی داده‌های طبیعی وساخته‌شده به‌دست انسان کاربرد دارند.

نمونه‌ها شامل قانون مور در مهندسی برق، و قانون ۲۰-۸۰ پارتو در اقتصاد است. اینکه چرا چنین قوانینی وجود دارند مشخص نیست؛ ولی به‌طور مشخص می‌دانیم که آنها وجود دارند.

فیزیک کوانتوم می تواند اسرار آمیز تر از حد تصورمان باشد
مشاهده

یکی از اصول تجربی که در بسیاری از مجموعه داده‌ها کاربرد دارد قانون بنفورد است. این قانون توسط ریاضی‌دانی کانادایی به‌نام سیمون نیوکامدر سال ۱۸۸۱ کشف شد. طبق گفته‌ی نیوکام، لوگاریتم‌هایی که با رقم ۱ شروع می‌شوند رایج‌ترند.

طبق چنین قانونی، در یک مجموعه‌ی داده، اعداد بیشتر با ۱ شروع می‌شوند تا اعداد دیگر. همین ایده در دهه‌ی ۱۹۳۰ بار دیگر توسط فرانک بنفورد مطرح و کشف شد.

قانون بنفورد در مجموعه داده‌های زیادی کاربرد دارد، از قبوض برق گرفته تا آدرس خیابان‌‌ها، قیمت سهام و غیره. بنابراین می‌توان از این قانون در شناسایی تقلب و کلاهبرداری در حساب‌های مالی هم استفاده کرد. البته این قانون در توالی‌های تصادفی کاربرد ندارد و برای همین به‌راحتی قابل درک نیست.

درواقع اینکه چرا قانون بنفورد در برخی از توالی‌ها کاربرد دارد، مانند پازلی است که تنها خود ریاضی‌دانان جواب آن را می‌دانند. اما پرسش این است که این قانون تا چه اندازه در توالی‌های مختلف کاربرد دارد؟

برای درک چنین مسئله‌ای ما میزان دقت پیش‌بینی قانون از توزیع ارقام اول در ۴۰ هزار توالی تصادفی از پایگاه داده دانشنامه آنلاین دنباله‌های صحیح (OEIS) را اندازه گرفتیم.

مشخص شد که قانون بنفورد بیش از حد انتظار اتفاق می‌افتد. وو در این مورد گفت:

طبق نتایج، بسیاری (ولی نه همه) از توالی‌ها طبق قانون بنفورد عمل می‌کنند.

بسط قانون تیلور هم توسط وو کشف شد. سوال بعدی این بود که آیا می‌توان از قوانین بنفورد و تیلور برای تمییز توالی‌های تصادفی OEIS استفاده کرد؟

دانشمندان برای فهمیدن این موضوع، ۴۰ هزار عدد تصادفی ایجاد شد و آنها را به ۴۰‌ هزار توالی انتخاب‌شده از OEIS اضافه کردند. وو الگوریتم یادگیری ماشینی‌ را آموزش داد تا توالی‌های OEIS را با استفاده از قوانین بنفورد و تیلور شناسایی کند و آنها را از توالی‌های تصادفی جدا کند.

نحوه جلوگیری از انتشار بیماری در کلونی مورچه ها
مشاهده

نتایج کار حیرت‌انگیز بود. الگوریتم کارش را با درستی ۰/۹۹۹ و دقت ۰/۹۹۸۴ انجام داد. چنین کاری اهمیت بسیاری داشت؛ چراکه باعث می‌شد امکان استفاده از روند خودکار برای شناسایی توالی‌های جالب فراهم شود.

اعداد اول

ریاضی‌دانانی که وظیفه‌ی مدیریت پایگاه داده OEIS را برعهده داشتند؛ باید هر سال حدود ۱۰ هزار مورد ارسالی را بررسی و پردازش می‌کردند. کار آنها با استفاده از این الگوریتم خودکار، بسیار راحت می‌شد.

البته این شیوه محدودیت‌های خاص خودش را نیز داشت. ریاضی‌دانان توالی‌های مهم و جالب زیادی را تعریف کرده‌اند که بی‌نهایت عدد دارند و محاسبه‌ی آنها بسیار دشوار است. اما پایگاه داده تنها بخشی از آنها در اختیار دارد. این تعداد محدود برای تحلیل ماشینی مناسب نیست.

سوال مهم‌تر اینکه آیا چنین شیوه‌ای می‌تواند ظرافت و زیبایی‌های ریاضی را شناسایی کند؟ خود وو هم این سوال مطرح می‌کند:

آیا یادگیری ماشینی می‌تواند مشخصه‌های کیفی دانش علمی را کشف کند؛ به‌عبارت دیگر آیا ما می‌توانیم بگوییم که نتایج علمی به‌دست‌آمده ظریف‌اند، ساده‌اند یا جالب؟

رسیدن‌به چنین هدفی کاملا نشدنی نیست. اگر قوانین تجربی مثل قوانین بنفورد و تیلور، شاخصی برای یافتن جالب بودن ریاضیات هستند، پس شاید این الگوریتم بتواند به‌عنوان یک تشخیص‌دهنده‌ی ظرافت (حداقل تا سطحی خاص) عمل کند.

مسلما اگر اویلر (که خود یکی از برجسته‌ترین ریاضی‌دانان تاریخ است) هم‌اکنون زنده بود، از وجود چنین الگوریتمی شگفت‌زده می‌شد.