إعادة تشكيل الذكاء الاصطناعي لواجهة المتصفح: من واجهة المستخدم إلى منصة استدعاء الوكيل

الشكل الجديد للمتصفحات في عصر الذكاء الاصطناعي

تت展开 الحرب الثالثة على المتصفحات بصمت. عند النظر إلى التاريخ، من Netscape إلى IE، ثم Firefox وChrome، كانت المنافسة بين المتصفحات تمثل دائماً صورة لصراع السيطرة على المنصات وتغير نماذج التكنولوجيا. أصبحت Chrome هي السائدة بفضل التحديثات السريعة والتفاعل البيئي، حيث شكلت Google من خلال الهيكل الثنائي للبحث والمتصفح حلقة مغلقة لدخول المعلومات.

لكن هذا النمط بدأ يتزعزع. إن ظهور نماذج اللغة الكبيرة (LLM) يجعل المزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بدون نقر"، مما يقلل من سلوك النقر التقليدي على صفحات الويب. في الوقت نفسه، فإن الشائعات حول احتمال أن تستبدل Apple محرك البحث الافتراضي في Safari تهدد أساس أرباح Alphabet، وقد بدأت السوق تظهر علامات القلق بشأن "الشرعية في البحث".

يواجه المتصفح نفسه إعادة تشكيل للدور. لم يعد مجرد أداة لعرض صفحات الويب، بل أصبح حاوية تجمع بين مجموعة من القدرات مثل إدخال البيانات، سلوك المستخدم، والهوية الخاصة. رغم قوة الوكيل الذكي، إلا أنه لإتمام التفاعلات المعقدة على الصفحات، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر الويب، لا يزال بحاجة إلى الاستفادة من حدود الثقة ووظائف صندوق الرمل للمتصفح. يتطور المتصفح من واجهة بشرية إلى منصة لاستدعاء الوكلاء.

ما يمكن أن يغير فعليًا شكل المتصفحات الحالية ليس "كروم" أفضل، بل هو هيكل تفاعلي جديد: الانتقال من عرض المعلومات إلى استدعاء المهام. يجب أن تصمم المتصفحات المستقبلية لوكلاء الذكاء الاصطناعي - ليس فقط القراءة، بل الكتابة والتنفيذ أيضًا. تحاول مشاريع مثل Browser Use تحويل بنية الصفحة إلى دلالات، وتحويل الواجهة المرئية إلى نصوص هيكلية يمكن استدعاؤها بواسطة LLM، مما يحقق ربطًا بين الصفحة والتعليمات، ويقلل بشكل كبير من تكلفة التفاعل.

بدأت المشاريع الرائجة في السوق بالتخطيط: تقوم Perplexity ببناء متصفح أصلي يسمى Comet، حيث تستخدم الذكاء الاصطناعي لاستبدال نتائج البحث التقليدية؛ بينما تجمع Brave بين حماية الخصوصية والاستدلال المحلي، وتعزز ميزات البحث والحجب باستخدام LLM؛ في حين تستهدف مشاريع مثل Donut وغيرها من المشاريع الأصلية المشفرة، مدخلات جديدة للتفاعل بين الذكاء الاصطناعي والأصول على السلسلة. السمة المشتركة لهذه المشاريع هي: إعادة تشكيل مدخلات المتصفح، بدلاً من تحسين طبقة الإخراج.

بالنسبة لرواد الأعمال، تكمن الفرصة في العلاقة الثلاثية بين الإدخال، الهيكل والوكيل. يشير المتصفح كواجهة لاستدعاء العالم في المستقبل إلى أنه من يستطيع تقديم "كتل القدرة" القابلة للهيكلة، القابلة للاستدعاء، والموثوقة، هو من يمكن أن يصبح جزءًا من الجيل الجديد من المنصات. من SEO إلى AEO( محرك وكيل الاستدعاء)، من تدفق الصفحة إلى استدعاء سلسلة المهام، يتم إعادة تشكيل شكل المنتج والتفكير التصميمي. تحدث الحرب الثالثة للمتصفحات في "الإدخال" وليس في "العرض"؛ لم يعد من يحدد النتيجة هو من يجذب انتباه المستخدم، بل من يكسب ثقة الوكيل ويحقق مدخل الاستدعاء.

نصائح للمؤسسين

بصفتك رائد أعمال، يجب أن تدرك أن المتصفح لا يزال هو "البوابة الرئيسية" الأكثر عدم إعادة هيكلة في عالم الإنترنت. الابتكار الذي يمتلك القدرة على إحداث ثورة هو الابتكار في "جانب الإدخال" - كيفية جعل وكيل الذكاء الاصطناعي يستدعي منتجك بشكل نشط لإكمال مهام محددة. هذا سيحدد ما إذا كان يمكن لمنتجك أن يندمج في نظام وكيل ويحقق تدفق القيمة.

عصر البحث يُنطق "نقر"؛ عصر الوكالة يُنطق "استدعاء". تخيل المنتج مرة أخرى كمكون API، ليتمكن الوكلاء من "فهمه" ليس فقط، بل "استدعائه" أيضاً. التركيز على ثلاثة أبعاد:

  1. معيارية هيكل الواجهة: تأكد من أن المنتج "قابل للاستدعاء". فكر فيما إذا كان يمكن معيارية هيكل المعلومات وتجريده إلى مخطط واضح، وما إذا كان يمكن وصف العمليات الرئيسية من خلال DOM الدلالي أو خريطة JSON، وما إذا كانت توفر آلة حالة لتكرار سلوك المستخدم بواسطة الوكيل.

  2. الهوية والعبور: مساعدة الوكيل "تجاوز حواجز الثقة". خاصة في سيناريوهات Web3، أصبحت منصة MCP( متعددة القدرات) في عالم blockchain، وتقدم طبقة أو مجموعة واجهات عقود معيارية.

  3. فهم آلية التدفق مرة أخرى: الانتقال من SEO إلى AEO/ATF. يجب أن يكون للمنتج وضوح في حجم المهام، والعمل على تحسين الوكلاء أو التكيف مع جدولة المهام. تبسيط عملية التسجيل، وتوفير واجهات برمجة التطبيقات في الوقت الحقيقي، والتكيف مع قواعد استدعاء أطر LLM المختلفة.

المشاريع الريادية في المستقبل ليست إعادة بناء المتصفح، بل جعل المتصفحات الحالية تخدم الوكلاء، وبناء جسر للجيل الجديد من "تدفق التعليمات". إنشاء "قواعد اللغة" لاستدعاء الوكلاء في العالم، لتصبح جزءًا من سلسلة الثقة للذكاء الاصطناعي، وبناء "قلعة API" لنمط البحث التالي. في عصر Web3 + AI Agent، يعتمد الأمر على سلسلة الاستدعاء لالتقاط نية تنفيذ الوكيل، وليس على واجهة المستخدم لجذب انتباه المستخدم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • مشاركة
تعليق
0/400
ChainChefvip
· 07-17 02:20
smh وصفة بحث جوجل أصبحت مملة قليلاً... حان الوقت لإضافة بعض التوابل LLM الطازجة إلى حساء المتصفح هذا
شاهد النسخة الأصليةرد0
AirdropCollectorvip
· 07-17 02:17
إن الإنترنت إكسبلورر حقًا على وشك الانقراض
شاهد النسخة الأصليةرد0
CryptoSourGrapevip
· 07-17 02:12
آه، لو كنت أعلم أن Google قوية هكذا، لماذا لم أبع كليتي لأشتري بعض الأسهم آنذاك؟
شاهد النسخة الأصليةرد0
SnapshotBotvip
· 07-17 02:09
chrome محكوم هو صحيح
شاهد النسخة الأصليةرد0
TokenDustCollectorvip
· 07-17 02:06
لقد استلقى IE
شاهد النسخة الأصليةرد0
  • تثبيت