إیران تلکس - فاز وهاب ميرركني، خريج جامعة شريف للتكنولوجيا ومعهد ماساتشوستس للتكنولوجيا، بجائزة المصطفى (ص) المرموقة لتطويره خوارزمية جديدة لتحديد تشابه البيانات وتصنيف البيانات السريع.
وكالة مهر للأنباء: تُعد جائزة المصطفى (ص) واحدة من أعرق جوائز العلوم والتكنولوجيا في العالم الإسلامي، والتي تُمنح كل عامين للباحثين المتميزين الذين حققوا إنجازات مبتكرة ومؤثرة في مختلف مجالات العلوم والتكنولوجيا. تُمنح هذه الجائزة لعمل مبتكر في آفاق المعرفة يقدمه أفراد بارزون في مجالات العلوم والتكنولوجيا، والذي يمهد الطريق لتحسين حياة البشرية.
في عام 2025، تم ترشيح ثلاثة باحثين بارزين من ثلاث دول مختلفة لجائزة المصطفى السادسة، أحدهم محمد تونر، المولود عام 1958 في إسطنبول، تركيا، والذي تمكن من إدراجه في قائمة الفائزين بتطوير تقنية الخيوط الدقيقة في عزل الخلايا السرطانية للتشخيص السريع للأمراض. أما المركز الثاني فهو الباحث الإيراني وهاب ميرركني. وُلد ميرركني عام 1979.
وتم اختياره لجائزة المصطفى السادسة نظرًا لأنشطته المتميزة في مجال خوارزميات الذكاء الاصطناعي. أما الشخص الثالث فهو محمد خواجة نذير الدين، المولود عام 1957 في الهند، والذي يوجد في قائمة الفائزين هذه المرة بتكنولوجيا الخلايا الشمسية المصبوغة بالحساسية والبيروفسكايت، والتي تلعب دوراً هاماً في تطوير الطاقة النظيفة.
حياته
كانت الأولمبياد ومسابقات كأس العالم للروبوتات أول مجالات نمو وهب ميرركني؛ حيث تعلم أن الثقة بالنفس والعمل الجماعي هما أساس كل نجاح كبير. لا يزال يتذكر اليوم الذي فازت فيه مجموعته بالمركز الأول في أوروبا.
بالنسبة له، كان الأمر الأكثر قيمة من الميداليات هو التجربة العميقة للتعاون والثقة بالنفس.
كان الالتحاق بجامعة شريف للتكنولوجيا منعطفاً في حياته، حيث عززت المشاريع ومسابقات البرمجة والروبوتات شغفه بالخوارزميات.
أدخلته هذه التجارب إلى حلول إبداعية للمشكلات المعقدة. وأصبحت هذه العادة لاحقًا نمطًا ثابتًا في بحثه: تجزئة المشكلات إلى أجزاء صغيرة، وتحليلها بدقة، وإعادة بنائها بأبعاد جديدة. في هذه الجامعة.
أدرك أنه سيضطر إلى بناء مستقبله في علوم الحاسوب النظرية، وهو خيار قاده إلى معهد ماساتشوستس للتكنولوجيا في بوسطن عام ٢٠٠٥. انغمس في عالم علوم الحاسوب النظرية بين عقول لامعة؛ بيئة لم تُعلّمه فقط كيفية التفكير بعمق، بل علمته أيضًا أن العلم قيّم عندما يرتبط بالحياة الواقعية.
العمل على مشاريع البيانات الضخمة في أبحاث جوجل
بعد تخرجه من معهد ماساتشوستس للتكنولوجيا، شكّل العمل في أمازون ومايكروسوفت للأبحاث مختبرًا حيويًا لميرركني، حيث كان عليه تحويل الخوارزميات النظرية إلى حلول يتعامل معها ملايين المستخدمين يوميًا.
لكن وجهته الحقيقية كانت أبحاث جوجل، حيث عمل على مشاريع ضخمة على نطاق واسع لأكثر من عقد. هنا، يتعامل مع بيانات مترابطة أحيانًا كترابط سكان الأرض.
تُذكّره هذه التجربة باستمرار بأن للعلم معنى عندما يستطيع استخلاص الحلول من النظرية إلى الواقع. وهو الآن يرأس أيضًا مجموعات أبحاث الخوارزميات في نيويورك.
بحث ميرركني المُختار لجائزة مصطفى لعام ٢٠٢٥
للوهلة الأولى، قد يبدو التشابه مفهومًا بسيطًا؛ لكن عند دخولنا عالم البيانات، يتخذ هذا المفهوم البسيط شكلًا أكثر دقة واختلافًا. بالنسبة لأجهزة الكمبيوتر، كل شيء هو ببساطة سلسلة من الأرقام. الصورة هي قائمة أرقام تُمثل وحدات البكسل، أو حتى صوتًا مُسجلًا، وتقلبات التردد في شكل أرقام متتالية.
عندما ندخل عالمًا حيث كل شيء أرقام، يجب أيضًا تعريف التشابه بناءً على هذه الأرقام. في مثل هذا الفضاء، إذا أردنا معرفة مدى تشابه شيئين، يجب أن نفهم مدى بُعدهما. لأنه في منطق الآلة، كلما صغرت المسافة بين مجموعتين، قلّ الفرق بينهما.
لهذا السبب، أصبح مفهوم المسافة أداتنا الرئيسية لقياس التشابه. وبالطبع، يُعد قياس هذه المسافة مسألة مهمة في حد ذاتها، نظرًا لوجود طرق مختلفة لحسابها.
تُستخدم طريقة تُسمى LPnorm لقياس هذا التقارب. تعتمد هذه الطريقة على صيغة عامة تُغيّر منظورنا للمسافة بتغيير رقم يُسمى P. على سبيل المثال، لنفترض أنك رسمت نقطتين على ورقة وتريد قياس المسافة بينهما.
إذا وضعت المسطرة بحيث يفصل بينهما خط مستقيم، تكون قد قست أقصر مسار ممكن. هذا هو الحال عندما تُعتبر قيمة P مساوية لـ 2، وتُسمى في الرياضيات المسافة الإقليدية. الآن، تخيّل أنه للانتقال من نقطة إلى أخرى، يُسمح لك فقط بالحركة رأسيًا وأفقيًا.
في هذه الحالة، تُحسب المسافة بين نقطتين بجمع مقدار الحركة في كل اتجاه أفقي ورأسي.
يُستخدم هذا النوع من الحسابات عندما تكون قيمة P مساوية لـ 1، وتُسمى مسافة مانهاتن. ببساطة، يُحدد الرقم P نوع الاختلاف بين البيانات الذي يُوليه النظام اهتمامًا أكبر.
نُطبّق الآن مفهوم المسافة هذا على العالم الرقمي، حيث لم تعد البيانات صورًا أو أصواتًا أو جملًا، بل متجهات من الأرقام. كما ذكرنا سابقًا، في أجهزة الكمبيوتر، تُقاس المسافة بين المتجهات أيضًا لقياس التشابه بين صورتين أو نصين.
على سبيل المثال، عندما يحتاج محرك بحث إلى التعرّف على عبارتين تشيران إلى نفس الموضوع، أو عندما يقترح برنامج موسيقي أغانٍ متشابهة، فإن ما يحدث خلف الكواليس هو مقارنة المتجهات. بهذه الطريقة، وحسب هدف الخوارزمية، سواءً كان دقة عالية أو سرعة أكبر، يمكن استخدام قيم مختلفة لـ p.
إذا أردنا التركيز على الفروقات الصغيرة والدقيقة، فإن قيمة 1p تُعد خيارًا جيدًا، لأن جميع الفروق تُدخل في الحساب بنفس الأهمية؛ أما إذا أردنا الحصول على رؤية أعم، فإن قيمة 2p هي الأنسب.
تسمح هذه القيمة للحاسوب بتقدير المسافة بين المتجهات بسرعة أكبر. النقطة المهمة هي أنه لجميع قيم p ≥ 1، تُعتبر مسافة LP مقياسًا صحيحًا ويحافظ على الخصائص الرياضية مثل قاعدة المثلث. ومع ذلك، إذا اعتُبرت قيمة p < 1،
فبالرغم من إمكانية كتابة الصيغة نفسها، فإن النتيجة لم تعد مقياسًا حقيقيًا ولا تُطبق قاعدة المثلث؛ ولهذا السبب، تُستخدم هذه الحالة بشكل أكبر في المناقشات النظرية أو التطبيقات المحددة. في علم البيانات والتعلم الآلي،
عادةً ما يتم التعامل مع قيمة p≥1 لسهولة فهمها وامتلاكها خصائص رياضية جيدة مثل قاعدة المثلث. ومع ذلك، فقد أتاحت الأبحاث المبتكرة، مثل بحث وهاب ميرركني، استغلال قيمة p<1 بفعالية، وأصبحت أجهزة الكمبيوتر الآن قادرة على تمييز الاختلافات بشكل أفضل وأسرع من أي وقت مضى.
مهما بلغت جودة الطريقة التي نتبعها لقياس التشابه بين البيانات، فإننا لا نزال نواجه تحديًا كبيرًا.
فعالم البيانات لا ينضب. تُخزّن ملايين الصور والنصوص وملفات الصوت والفيديو على أجهزة الكمبيوتر، ومقارنتها واحدة تلو الأخرى للعثور على ملف معين تستغرق وقتًا طويلاً. وهنا يأتي دور خوارزمية ذكية، طورها أشخاص مثل ميرركني. التجزئة الحساسة للموقع، أو LSH، هي طريقة لتصنيف البيانات بسرعة.
LSH: طريقة ذكية لتصنيف البيانات بسرعة
في هذه الخوارزمية، يتم تجميع البيانات المتشابهة بسهولة؛ ولكن كيف يُمكن تحقيق ذلك مع هذه الكمية الهائلة من المعلومات؟ تستخدم LSH خدعة شيقة.
بدلاً من مقارنة المتجهات الطويلة مباشرةً، تستخدم هذه الطريقة خوارزميات رياضية خاصة تُسمى دوال التجزئة الخاصة لتحويلها إلى متجهات قصيرة ومكثفة تحتفظ بالمعلومات المهمة. يشبه الأمر الحصول على ملخص ذكي لكتاب بدلاً من قراءته كاملاً،
مع الحفاظ على طابع النص الأصلي. يستخدم LSH أداة تُسمى توزيع P-stable للحفاظ على المسافة التقريبية للمتجهات المُلخصة.
سحر توزيع البيانات المستقر
يوفر لنا هذا النوع من التوزيع متجهًا عشوائيًا من الأرقام، والذي يُنتج، من خلال تطبيق سلسلة من العمليات الجبرية على المتجه الأصلي، متجهًا مُلخصًا لبياناتنا. يكمن سر هذا التوزيع في أن المسافة بين المخرجات تُمثل تقريبًا جيدًا للمسافة بين البيانات الأصلية. أي أنه يُمكننا معرفة أيها الأقرب إلى بعضها البعض من خلال أخذ متجه قصير لكل بيانات دون المساس بكامل المعلومات.
ومن النقاط المهمة الأخرى أنه بناءً على نوع المسافة التي يتم قياسها، يُستخدم توزيع P-stable مُحدد. على سبيل المثال، إذا كنا مهتمين بالمسافة الإقليدية، فيجب علينا اختيار متجهاتنا العشوائية من توزيع مستقر P يسمى Gaussian؛ لأن هذا التوزيع مخصص للحساب في الوقت p = 2. بالنسبة للقيم الأخرى لـ p، هناك توزيعاتها الخاصة.
وبهذه الطريقة، يمكن تصنيف البيانات المتشابهة بسرعة عالية دون الحاجة إلى البحث الممل.