🎛️ PageRank قيد العمل
8 صفحات ويب، بعضها مترابط جدًا، وبعضها الآخر معزول. انقر على «كرّر»: في كل خطوة، تُعاد توزيع «الشعبية» حسب الروابط الواردة. تكبر العُقد حسب درجة PageRank الخاصة بها.
التكرار
0
الصفحة الأولى
—
أقصى فرق
—
التهيئة: كل صفحة لها نفس الأهمية 1/N. في كل تكرار، «تتدفق» الأهمية على طول الروابط.
🏫 1996: طالبان من ستانفورد
في خريف 1996، كان لاري بيج وسيرجي برين، الباحثان في الدكتوراه في المعلوميات بجامعة ستانفورد، يشتغلان على مشروع أطروحة: تحسين البحث على الويب. في ذلك الوقت، كانت محركات البحث (AltaVista, Lycos, Yahoo) تُرتّب الصفحات بإحصاء تكرار الكلمات المفتاحية. والنتيجة: سخام هائل (spam)، صفحات مليئة بقوائم من الكلمات غير المرئية، وجودة رديئة.
كان لدى بيج حدس حاسم: التعامل مع الويب كمبيان. كل صفحة هي رأس، وكل رابط تشعّبي هو حافة موجّهة. الصفحة «المهمة» هي الصفحة التي تشير إليها الكثير من الصفحات المهمة الأخرى. إنه تعريف تراجعي — لكنه بالضبط من النوع الذي نعرف كيف نحلّه رياضيًا.
🎯 صيغة PageRank
لتكن N صفحة ويب. تُعرّف درجة PageRank لصفحة p، أي PR(p)، بما يلي:
PR(p) = (1−d)/N + d · Σ PR(q) / L(q)
• المجموع يشمل كل الصفحات q التي تشير إلى p
• L(q) = عدد الروابط الصادرة من q
• d = «معامل التخميد» ≈ 0,85 (احتمال متابعة النقر)
• (1−d)/N = احتمال «الانتقال الآني» العشوائي
🚶 تأويل التجوال العشوائي: «المتصفّح العشوائي»
تخيّل مستخدمًا للإنترنت ينطلق من صفحة عشوائية وينقر بانتظام على الروابط. باحتمال d = 0,85، يستمر في النقر. وباحتمال 1−d = 0,15، يصيبه الملل فيَنتقل آنيًّا إلى صفحة عشوائية تمامًا (لمعالجة الصفحات بدون رابط صادر ولتفادي التعالق).
درجة PageRank لصفحة = احتمال وجود هذا المتصفّح فيها على المدى البعيد. رياضيًا، إنها المتجهة الذاتية المهيمنة لمصفوفة انتقال معيّنة.
🧮 كيف نحسبها: تكرار القوة
لا نقوم بقطرنة مصفوفة بحجم 50 مليار × 50 مليار. عوضًا عن ذلك، تستعمل Google طريقة القوة:
- تهيئة PR(p) = 1/N لكل صفحة.
- لكل صفحة، إعادة حساب PR حسب الصيغة.
- التكرار إلى أن تتوقف المتجهة PR عن التغيّر (التقارب).
عمليًا، تكفي 50 إلى 100 تكرارة للتقارب بدقة 10⁻⁶ على كامل الويب. على مزارع خوادم Google، يُحسب ذلك في بضع ساعات (الخوارزمية قابلة للتوازي على نطاق واسع، وهي أساس إطار العمل MapReduce الذي ابتُكر لدى Google سنة 2004).
💰 1998-2024: من الخوارزمية إلى الإمبراطورية
- يناير 1998 — نشر بيج وبرين مقالهما التأسيسي: « The Anatomy of a Large-Scale Hypertextual Web Search Engine ».
- 4 شتنبر 1998 — تأسّست Google Inc. في مرآب بمدينة مينلو بارك. رأس المال الأولي: 100 000 دولار من أحد مؤسّسي Sun Microsystems.
- 2000 — فهرست Google مليار صفحة، وأصبحت المحرّك الأكثر شعبية.
- 2004 — الطرح العام الأولي (IPO). القيمة السوقية الأولية: 23 مليار دولار.
- 2006 — دخلت كلمة «Google» قاموس أكسفورد كفعل.
- 2015 — إعادة هيكلة في شركة Alphabet Inc.
- 2024 — القيمة السوقية لـ Alphabet ≈ 2000 مليار دولار. تبلغ ثروة كل من لاري بيج وسيرجي برين ~130 مليار دولار. وقت كتابة هذا المقال، هما ضمن العشرة الأوائل عالميًا من حيث الثروات.
براءة اختراع PageRank (رقم 6 285 999) تملكها جامعة ستانفورد. وتدفع Google رخصة حصرية. في سنة 2005، باعت ستانفورد أسهمها في Google بحوالي 336 مليون دولار — عائد استثمار أكاديمي غير مسبوق.
🌐 أبعد من Google: PageRank في كل مكان
- الشبكات الاجتماعية: تستعمل Twitter (X) صيغة متغيّرة لحساب تأثير الحسابات. وتستعملها Facebook في ترتيب المنشورات (News Feed).
- القياس البيبليومتري: Eigenfactor (2007) يُرتّب المجلات العلمية حسب PageRank للاستشهادات. أدقّ من معامل التأثير الكلاسيكي.
- البيولوجيا: GeneRank يُرتّب الجينات الأكثر «مركزية» في شبكة من التفاعلات البروتينية. يساعد على تحديد أهداف علاجية.
- التوصية: Spotify, Netflix, Amazon — خوارزميات مستوحاة من PageRank على مبيانات المستخدمين/المحتويات.
- الرياضة: ترتيب الفِرق (Football Index, NFL) بنشر النقاط عبر المواجهات.
- اللسانيات: TextRank (Mihalcea-Tarau 2004) — تلخيص تلقائي للنصوص بترتيب أهمية الجمل عبر PageRank على مبيان من التواردات.
- التوجيه: تحسين الشبكات الهاتفية وشبكات النقل.
- كشف الاحتيال: رصد الحسابات البنكية «المركزية» في مبيانات معاملات مشبوهة.
🛡️ حرب الـ SEO وGoogle
منذ أن أصبح PageRank معروفًا، حاول المسبِّخون (spammeurs) التلاعب به: مزارع الروابط، تبادل الروابط، شراء النطاقات المنتهية الصلاحية. وترد Google باستمرار:
- 2003 — Florida: أول مرشّح هائل ضد السخام.
- 2011 — Panda: يعاقب المواقع ذات المحتوى الضعيف.
- 2012 — Penguin: يعاقب الروابط المصطنعة.
- 2015 — RankBrain: إدماج تعلّم الآلة في الترتيب.
- 2019 — BERT: فهم اللغة الطبيعية.
- 2023+ — SGE (Search Generative Experience): إدماج Gemini في البحث.
أصبح PageRank الأصلي اليوم إشارة من بين ~200 إشارة تستعملها Google. لكنه يبقى الفكرة المؤسِّسة التي بُنيت حولها كل منظومة الـ SEO وخوارزمية Google.
📐 الرابط مع برنامجك الدراسي
- المتجهات والمصفوفات: PageRank هي المتجهة الذاتية المهيمنة لمصفوفة احتمالية. برنامج الجبر الخطي لما بعد البكالوريا.
- الاحتمالات وسلاسل ماركوف: التأويل كتجوال عشوائي. برنامج الاحتمالات للثانية بكالوريا علوم رياضية (السلاسل تُدرس في الأقسام التحضيرية).
- المتتاليات التراجعية: طريقة القوة هي بالضبط متتالية معرّفة بالتراجع v_{n+1} = M·v_n. برنامج المتتاليات للثانية بكالوريا علوم رياضية.
- مبرهنة النقطة الثابتة: يعتمد التقارب على مبرهنة بيرون-فروبينيوس (المصفوفات ذات المعاملات الموجبة). معقّدة، لكن فكرة النقطة الثابتة في المتناول.
- مبرهنة بيرون-فروبينيوس (1907): للمصفوفة الاحتمالية قيمة ذاتية مهيمنة وحيدة = 1، والمتجهة الذاتية المرتبطة بها هي PageRank.