از دفترچه کودکی تا گوگل ریسرچ/ جایزه مصطفی ۲۰۲۵ به دانشمد ایرانی رسید
به گزارش گروه دانشگاه خبرگزاری دانشجو، جایزه مصطفی (ص) که هر دو سال یکبار برگزار میشود، امروز بهعنوان یکی از معتبرترین جوایز علمی در جهان اسلام شناخته میشود. این جایزه با هدف تقدیر از دانشمندانی طراحی شده که آثار و نوآوریهایشان نهتنها در مرزهای علم باقی نمیماند، بلکه در بهبود کیفیت زندگی بشر نقشی تعیینکننده ایفا میکند. ششمین دوره این رویداد در سال ۲۰۲۵ نیز سه برگزیده بزرگ را معرفی کرد؛ سه پژوهشگری که با دستاوردهای خود به قلههای تازهای از علم دست یافتند.
در میان این نامها، وهاب میررکنی درخشید؛ دانشمندی که بهپاس طراحی الگوریتم «هشینگ حساس به محل بر اساس توزیعهای p-پایدار» برگزیده شد. الگوریتمی که به رایانهها آموخت چگونه در میان دریای بیانتها دادهها، شبیهترینها را با سرعتی شگفتانگیز و دقتی مثالزدنی پیدا کنند.
تا به حال کتابی خواندهای که تمام شدنش حس پایان یک دوستی را داشته باشد؟ کتابی که نه فقط محتوایش، بلکه حالوهوایش، نثرش و چیزی ناپیدا در میان سطرهایش با تو حرف زده باشد. حالا تصور کن در جستوجو کتاب دیگری باشی که همان احساس را زنده کند. پا به کتابخانهای بزرگ با قفسههایی نامنظم میگذاری. رمان، فلسفه، علم، تاریخ، همه و همه بدون دستهبندی مشخص در قفسهها قرار دارند. شروع به ورق زدن کتابها میکنی تا شاید حسی آشنا پیدا شود. با گذر زمان، خستگی توانت را میگیرد. کتابها زیادند و آنچه دنبالش هستی، بهراحتی با چشم و دست پیدا نمیشود.
در نهایت، پشت یکی از رایانههای کتابخانه مینشینی. توضیحی از آن کتاب محبوب را مینویسی و حالا این خواسته انسانی، به مسئلهای ماشینی تبدیل میشود. در جهان کامپیوترها، چالش کمی پیچیدهتر میشود. این موتور جستوجو، باید بین میلیاردها کتاب، دنبال کتابی مشابه خواستهات بگردد. چطور یک رایانه از میان این دریای داده، چیزهایی را پیدا میکند که از نظر معنا یا ساختار، به هم نزدیکاند؟ مهمتر از آن، چگونه میتواند این کار را سریع و دقیق انجام دهد، بیآنکه نیاز باشد همه دادهها را یکییکی بررسی کند؟ جواب این سوال در راهی است که به جای احساسات، از زبان اعداد و فرمولها برای فهمیدن شباهتها استفاده میکند؛ الگوریتمی مبتنی بر توزیعهای p-پایدار، که توسط پژوهشگرانی مانند وهاب میررکنی طراحی شده است تا رایانهها بتوانند بدون زیرورو کردن کل فضای دیجیتال، دادههایی مشابه را هوشمندانه و با سرعتی بالا شناسایی کنند.
شباهت به سبک عددها
شباهت در نگاه اول چیزی ساده بهنظر میرسد؛ مثل وقتی دو دوست را کنار هم میبینی و میگویی «چهقدر به هم شبیهاند». اما همین مفهوم ساده وقتی پا به دنیای دادهها میگذارد، شکل دیگری پیدا میکند؛ شکلی دقیقتر، عددیتر، و بیاحساستر. برای ماشینها، جهان چیزی جز رشتهای بیپایان از اعداد نیست. تصویری که ما میبینیم، برای کامپیوتر فقط جدولی از عددهاست که پیکسلها را تعریف میکنند؛ صدایی که گوش ما را پر میکند، برای او فقط موجهایی است که در قالب ارقام ثبت شدهاند.
وقتی همهچیز عدد باشد، شباهت هم باید با زبان عددها سنجیده شود. اینجاست که مفهوم «فاصله» وارد بازی میشود. برای ماشین، هرچه فاصله بین دو مجموعه کوچکتر باشد، آنها بیشتر به هم شباهت دارند. مثل خطکشی نامرئی که میزان نزدیکی را اندازه میگیرد. اما همین خطکش، شکلهای مختلفی دارد.
ریاضیدانها روشی ساختهاند به نام LPnorm؛ فرمولی که با تغییر یک عدد کوچک به اسم «p»، زاویه نگاه ما به فاصله عوض میشود. تصور کن روی کاغذ دو نقطه داری. اگر با خطکشی صاف، کوتاهترین راه را بین آنها بگیری، همان فاصله معروف اقلیدسی است، جایی که p=۲ است. اما اگر اجازه داشته باشی فقط به صورت افقی یا عمودی حرکت کنی، باید راهی پلهپله بسازی؛ جمع این قدمها همان فاصله منهتنی است، وقتی p=۱. در واقع، این «p» تعیین میکند که چشم ماشین روی چه نوع تفاوتی حساستر باشد.
خطکش کامپیوتری
حالا این خطکشها را با خود به دنیای دیجیتال بیاور. جایی که دادهها دیگر عکس و صدا و جمله نیستند، بلکه بردارهایی از عددها شدهاند. برای کامپیوتر، مقایسهی دو تصویر یا دو جمله یعنی اندازهگیری فاصلهی بین دو بردار. همان لحظهای که موتور جستوجو تشخیص میدهد دو عبارت تقریباً یک معنا دارند، یا وقتی یک برنامه موسیقی برایت آهنگهای مشابه پیشنهاد میدهد، پشت پرده همین خطکش عددی مشغول کار است. بسته به اینکه هدف، دقت بیشتر باشد یا سرعت بالاتر، مقدار «p» تغییر میکند و خطکش مسیر متفاوتی را نشان میدهد.
تفاوتها و ظرافتها
گاهی وقتها لازم است همهی جزئیات را ببینیم؛ مثل نقاشی ظریفی که هر خط نازک آن مهم است. در چنین حالتی، مقدار p=۱ بهترین انتخاب است، چون همهی اختلافها با وزن برابر حساب میشوند. اما اگر بخواهیم تصویر کلیتری داشته باشیم و سرعت هم برایمان مهم باشد، p=۲ گزینه مناسبتری است. این انتخاب به کامپیوتر کمک میکند تا فاصله میان بردارها را سریعتر تخمین بزند.
از دید ریاضیات، برای هر مقدار p≥۱، فاصلهی LP یک «متریک معتبر» بهشمار میآید؛ یعنی قواعدی مثل قانون مثلث را رعایت میکند و قابل اتکا است. اما وقتی p<۱ باشد، اوضاع تغییر میکند. فرمول همان است، اما نتیجه دیگر یک متریک واقعی نیست و قانون مثلث از بین میرود. به همین خاطر، این حالت بیشتر در مباحث نظری یا کاربردهای خاص مطرح میشود. با این حال، پژوهشهای نوآورانهای مثل کارهای وهاب میررکنی نشان دادهاند که حتی این قلمرو کمتر شناختهشده هم میتواند منبعی برای ایدههای تازه باشد؛ جایی که رایانهها بهتر و سریعتر از همیشه میتوانند تفاوتها را ببینند.
میانبُر در شهر دادهها
هرچقدر هم خطکشهای دقیقی برای سنجش شباهت داشته باشیم، باز هم یک مشکل بزرگ باقی است: حجم سرسامآور دادهها. تصور کن در شهری بیانتها سرگردان شدهای؛ میلیونها تصویر، متن، صدا و ویدیو در هر گوشه انباشتهاند. اگر بخواهیم برای پیدا کردن یک فایل خاص، تکتک اینها را مقایسه کنیم، عمری طولانی لازم خواهد بود. اینجاست که الگوریتمی هوشمندانه، حاصل تلاش ذهنهایی مانند میررکنی، وارد میدان میشود: Locality-Sensitive Hashing یا به اختصار LSH.
LSH مثل میانبُری در این شهر بیانتهاست. بهجای مقایسهی مستقیم بردارهای عظیم، دادهها را به کمک توابع هش مخصوص، به نسخهای کوتاهتر و خلاصهشده تبدیل میکند؛ نسخهای که هنوز جوهرهی اصلی را در خود دارد. درست مثل زمانی که بهجای خواندن یک کتاب حجیم، چکیدهای هوشمند به دستت برسد که همچنان حالوهوای متن اصلی را منتقل کند.
رمز کار LSH در استفاده از توزیعهای p-پایدار است. این توزیعها بردارهایی تصادفی میسازند و با چند عملیات جبری ساده، هر داده به برداری خلاصه بدل میشود. جادوی این توزیعها در آن است که فاصلهی بین این خروجیهای کوتاه، تقریب بسیار خوبی از فاصلهی دادههای اصلی خواهد بود. به این ترتیب، بدون نیاز به دست بردن در کل اطلاعات، میتوان تشخیص داد کدام دادهها به هم نزدیکترند.
جالب اینجاست که نوع توزیع انتخابی به نوع فاصله وابسته است. مثلاً اگر فاصله اقلیدسی (p=۲) مدنظر باشد، باید از توزیع گاوسی استفاده کرد. برای مقادیر دیگر p هم توزیعهای مخصوصی وجود دارند. نتیجه؟ دادهها با سرعتی خیرهکننده و بدون زحمت مقایسههای طاقتفرسا دستهبندی میشوند.
در عمل، این روش گاهی تا ۴۰ برابر سریعتر از شیوههای سنتی مثل kd-tree عمل کرده و حتی در شرایط دشوار، وقتی p<۱ است، امکان جستوجو را فراهم ساخته است. خلاصهسازی هوشمند LSH به دستیار باتجربهای میماند که در دنیای سرد عددها و بردارها، بیآنکه احساس داشته باشد، شباهتها را با سرعتی چندبرابر آشکار میکند.
سفر یک ذهن کنجکاو در میان دادهها
سفر و جستوجوی ذهن هر پژوهشگر، شبیه شبکهای از سؤالها، تجربهها و آزمونهاست که مسیر علم را شکل میدهد. وهاب میررکنی این مسیر را از دفترچهای پر از مسائل دوران کودکی آغاز کرد و سپس از کلاسهای مدرسه و مسابقات روباتیک به دانشگاههای معتبر جهان و آزمایشگاههای تحقیقاتی بزرگ رسید. تجربههای متعدد او نشان میدهد که پیشرفت علمی نه یک مسیر خطی، بلکه شبکهای از کشفها، آزمونها و تجارب متنوع است که همواره در تعامل با مسائل واقعی زندگی شکل میگیرد.
مسیر علمی او از کلاسهای مدرسه تا دانشگاه و تحقیقات صنعتی، همواره با کشف و چالش همراه بوده است. او در کلاسهای دبیرستان استعدادهای درخشان کرج، ساعتها با دشوارترین پرسشها دست و پنجه نرم میکرد. مسابقات المپیاد و رقابتهای جهانی RoboCup، نخستین میدانهای رشد او بودند؛ جایی که آموخت اعتماد به نفس و کار تیمی، زیربنای هر موفقیت بزرگ است. هنوز هم روزی را به یاد دارد که گروهشان در اروپا مقام اول را کسب کرد. برای او، ارزشمندتر از مدالها، تجربه عمیق همکاری و خودباوری بود.
ورود به دانشگاه مسیر او را از آموزشهای معمولی جدا کرد و به دانشگاه صنعتی شریف راه یافت؛ جایی که پروژهها، مسابقات برنامهنویسی و روباتیک، عشقش به الگوریتمها را عمق بیشتری بخشید. این تجربیات او را با راهحلهای خلاقانه برای مسائل پیچیده آشنا کرد و بعدها در پژوهشهایش به الگویی ثابت تبدیل شد: خرد کردن مسائل به بخشهای کوچک، تحلیل دقیق و بازسازی آنها در ابعادی نو. در همین دانشگاه بود که فهمید باید آیندهاش را در علوم نظری کامپیوتر بسازد؛ انتخابی که او را در سال ۲۰۰۵ به دانشگاه MIT در بوستون رساند. در میان ذهنهای درخشان، غرق در دنیای علوم نظری کامپیوتر شد؛ محیطی که نهتنها به او آموخت چگونه عمیقتر بیندیشد، بلکه یاد داد علم زمانی ارزشمند است که با زندگی واقعی پیوند بخورد.
راهی به سوی نوآوری در جهان
پس از فارغالتحصیلی از MIT، کار در آمازون و مایکروسافت ریسرچ برای میررکنی حکم یک آزمایشگاه زنده را داشت؛ جایی که باید الگوریتمهای نظری را به راهحلهایی تبدیل میکرد که میلیونها کاربر روزانه با آنها سروکار دارند. اما مقصد اصلیاش گوگل ریسرچ بود؛ جایی که بیش از یک دهه در پروژههای بزرگ و در مقیاسهای عظیم فعال است. او با دادههایی کار میکند که گاهی به اندازه کل جمعیت زمین به هم مرتبط هستند. این تجربه مدام به او یادآوری میکند که علم زمانی معنا دارد که بتواند از دل تئوری، راهحلی برای واقعیت بیرون بکشد.
میررکنی اکنون ریاست گروههای تحقیقاتی الگوریتمها در نیویورک را نیز بر عهده دارد. پروژههای او از الگوریتمهای بازار و بهینهسازی در مقیاس بزرگ تا گرافکاوی و پروژههای نسل جدید AI مانند Gemini AI گسترده است. دنیای هوش مصنوعی برای او همواره یک ماجراجویی تازه است. هر ماه مدلها و روشهای جدید معرفی میشوند که مرزهای تخیل دیروز را پشت سر میگذارند. آنچه بیش از همه او را شگفتزده میکند، توانایی سیستمها برای یادگیری و بهبود خودشان است؛ پدیدهای که سرعت پیشرفت را از هر نمودار خطی فراتر برده است. آیندهای که پیشتر با سالها فاصله قابل پیشبینی بود، امروز در عرض چند ماه دگرگون میشود. او این عدم قطعیت را نه تهدید، بلکه فرصتی ناب میبیند؛ فرصتی برای خلق ابزارها و ایدههایی که زندگی انسان را به شکلی عمیقتر با علم گره میزنند.
علم، محصول تلاش جمعی
میررکنی همواره بر این نکته تأکید دارد که هیچ موفقیتی واقعی نیست مگر آنکه با دیگران به اشتراک گذاشته شود. او معتقد است دستاوردها نهتنها حاصل تلاش فردی، بلکه نتیجه همکاری، اعتماد و همفکری گروههای پژوهشی است. این فلسفه در مسیر علمی او نمود یافته و جایزه مصطفی (ص) در سال ۲۰۲۵ به پاس دستاوردش در طرح هشینگ حساس به محل بر اساس توزیعهای p-پایدار، نمونهای برجسته از این دیدگاه است.
از دیگر جوایز او میتوان به بهترین مقاله کنفرانس ACM در تجارت الکترونیک در سال ۲۰۰۸، بهترین مقاله دانشجویی سمپوزیوم ACM-SIAM در سال ۲۰۰۵ و مدال طلای المپیاد انفورماتیک ایران در سال ۱۹۹۶ اشاره کرد. خانواده، دوستان، همکاران و تیمهای تحقیقاتی همگی نقش بسزایی در هر موفقیت این پژوهشگر داشتهاند و این دستاوردها نتیجه اعتماد و همکاری جمعی است. به همین دلیل او بسیاری از الگوریتمها و کتابخانههای مرتبط با شبکههای عصبی گراف و دادهکاوی را بهصورت متن باز منتشر کرده است تا دیگران نیز بتوانند از آن استفاده کنند و مسیر پیشرفت علمی ادامه یابد. برای او، علم همیشه محصول تلاش جمعی است و هیچ دستاوردی بدون همراهی دیگران کامل نمیشود.
زندگی ورای الگوریتمها
زندگی میررکنی تنها در معادلات و الگوریتمها خلاصه نمیشود. از دوران نوجوانی که فوتبال و پینگپنگ بازی میکرد و لذت همکاری و رقابت دوستانه را میآموخت، تا امروز که شادیهای کوچک بازی با فرزندانش را قدر میداند، همواره تعادل میان علم، خانواده و جامعه را کلید رشد واقعی میداند. تجربه گذراندن وقت با بچهها و یادگیری متقابل با آنها، یکی از ارزشمندترین لحظات زندگی اوست و حسی از رضایت و شادی به او میدهد که هیچ موفقیت علمی نمیتواند جای آن را بگیرد.
در کنار فعالیتهایش در گوگل ریسرچ، میررکنی بهعنوان استاد مدعو در دانشگاه نیویورک در مؤسسه کورانت، الگوریتمها و اقتصاد اینترنت را تدریس میکند و به نسل جوان گوشزد میکند:
«اکنون بهترین زمان برای ورود به عرصه تحقیق است. سرعت پیشرفتها در هوش مصنوعی فرصتی منحصربهفرد ایجاد کرده تا رویاهایتان سریعتر از همیشه به واقعیت تبدیل شوند؛ اما فراموش نکنید، اگر همه کارها را به هوش مصنوعی بسپارید، مغزتان فرصت رشد و تکامل را از دست خواهد داد.
او آیندهای را میبیند که در آن انسان و هوش مصنوعی در کنار هم مسائل پیچیده ریاضی را حل میکنند و الگوریتمها زندگی روزمره را در حوزههایی مانند پزشکی، علوم اجتماعی و فراتر از آن بهبود میبخشند. داستان میررکنی نشان میدهد که کنجکاوی و تلاش فردی وقتی با همکاری و نوآوری پیوند میخورد، میتواند جهان را به حرکت درآورد. تلاشهای او در توسعه الگوریتمها و روشهای علمی، علاوه بر تأثیر در پیشرفت دانش، امکان استفاده کاربردی در پروژهها و پژوهشهای آینده را فراهم میکند و مسیر توسعه علمی را برای نسل بعدی هموار میسازد.