ادغام هوش مصنوعی جمنای در تاکسی‌های خودران وایمو: همسفر هوشمند گوگل

چکیده

وایمو در حال تست هوش مصنوعی Gemini گوگل در تاکسی‌ های خودران خود است. این دستیار هوشمند قابلیت کنترل دما، پاسخ به سوالات و همراهی با مسافر را دارد. جزئیات کامل و کدهای لو رفته را در های‌ ورت بخوانید.

۱۴۰۴ جمعه ۱۳ دي
6 بازديد
مقایسه گرافیکی بین دستیار هوشمند وایمو (Gemini) و دستیار تسلا (Grok) و تفاوت ویژگی‌ های آنها.

تصور کنید سوار یک تاکسی بدون راننده شده‌اید؛ سکوت مطلق کمی ترسناک است؟ نگران نباشید، چون گوگل قصد دارد قدرتمندترین هوش مصنوعی خود، یعنی Gemini را به عنوان همسفر کنار شما بنشاند.

 

دنیای تکنولوژی همیشه در حال همگرایی است. وقتی شرکت آلفابت (مالک گوگل) صاحب پیشرفته‌ترین سیستم خودروهای خودران جهان (Waymo) و یکی از قدرتمندترین مدل‌های زبانی بزرگ (Gemini) است، ادغام این دو فقط مسأله "زمان" بود. حالا طبق جدیدترین افشاگری‌ها، این زمان فرا رسیده است. وایمو در حال تست یک دستیار هوش مصنوعی داخل خودرو است که فراتر از یک چت‌بات ساده عمل می‌کند؛ او مدیر کابین، راهنمای سفر و آرامش‌بخش شما خواهد بود.

در این مقاله اختصاصی از وبلاگ های‌ ورت (Hiwert)، به کالبدشکافی کدهای لو رفته، قابلیت‌های پنهان و استراتژی وایمو برای تغییر آینده حمل‌ونقل می‌پردازیم.

 

 

کشف بزرگ: وقتی کدها سخن می‌گویند

همه چیز از کنجکاوی یک محقق امنیتی برجسته به نام جین منچون وانگ (Jane Manchun Wong) شروع شد. او که به مهندسی معکوس اپلیکیشن‌ها معروف است، در لایه‌های پنهان کدهای اپلیکیشن موبایل Waymo، به گنجینه‌ای دست یافت: "دستورالعمل سیستمی" (System Prompt) کامل برای ادغام Gemini.

 

وانگ در وبلاگ خود نوشت:

«درحالی‌که در حال جستجو در کدهای برنامه Waymo بودم، متن کامل پرامپت سیستم برای ادغام منتشرنشده‌ی جمنای را کشف کردم. این سند که در داخل شرکت با عنوان "متا-پرامپت دستیار سواری وایمو" شناخته می‌شود، یک فایل مشخصات بیش از ۱۲۰۰ خطی است که دقیقاً تعریف می‌کند هوش مصنوعی باید چگونه در داخل خودرو رفتار کند.»

 

این کشف نشان می‌دهد که ما با یک تست ساده طرف نیستیم؛ بلکه با یک محصول مهندسی‌شده و دقیق روبرو هستیم که احتمالاً به زودی در خیابان‌های سان‌فرانسیسکو و فینیکس فعال خواهد شد.


 

 

جمنای در وایمو: بیشتر از یک چت‌بات، کمتر از یک راننده

سخنگوی وایمو، جولیا ایلینا، در پاسخ به تک‌کرانچ گفته است: «ما همیشه در حال دستکاری و تست ویژگی‌هایی هستیم که سفر با وایمو را لذت‌بخش، یکپارچه و مفید کند.» اما این "ویژگی‌ها" دقیقاً چه هستند؟

 

بر اساس کدهای لو رفته، جمنای در وایمو سه نقش اصلی دارد:

  1. پاسخ به سوالات (Knowledge)

  2. مدیریت کابین (Control)

  3. اطمینان‌بخشی (Reassurance)

 

 

۱. هویت و شخصیت: یک همسفر مهربان

در پرامپت‌های سیستمی، به جمنای دستور داده شده که یک "هویت شفاف" داشته باشد:

 

  • هدف: یک همراه هوش مصنوعی دوستانه و مفید که هدف اصلی‌اش ارتقای تجربه مسافر از طریق ارائه اطلاعات مفید به روشی ایمن و غیرمداخله‌گر است.

  • لحن: استفاده از زبان ساده، شفاف و دوری از اصطلاحات فنی پیچیده (Technical Jargon).

  • اختصار: پاسخ‌ها باید کوتاه و بین ۱ تا ۳ جمله باشند. (کسی حوصله سخنرانی طولانی در تاکسی را ندارد!).

 

وقتی مسافر وارد خودرو می‌شود و دستیار را فعال می‌کند، جمنای می‌تواند با استفاده از اطلاعات زمینه‌ای (Contextual Data)، سلام‌وعلیک شخصی‌سازی شده‌ای داشته باشد. مثلاً اگر نام مسافر "امیر" باشد و این دهمین سفر او باشد، جمنای ممکن است بگوید: "سلام امیر، خوشحالم که دوباره می‌بینمت."

 

 

 

۲. قدرت کنترل کابین: چه کارهایی می‌تواند انجام دهد؟

این هوش مصنوعی فقط برای حرف زدن نیست. جمنای به سیستم الکترونیکی خودرو متصل است و می‌تواند دستورات صوتی را به عمل تبدیل کند:

 

  • تنظیم دما: "جمنای، گرممه!" (دما را پایین می‌آورد).

  • نورپردازی: تغییر نور داخل کابین.

  • موزیک: کنترل پخش موسیقی.

 

نکته جالب (محدودیت‌ها): طبق یافته‌های وانگ، فعلاً جمنای دسترسی به کنترل صدای سیستم (Volume)، تغییر مسیر، تنظیم صندلی و باز و بسته کردن پنجره‌ها را ندارد. اگر مسافر درخواستی داشته باشد که جمنای قادر به انجامش نیست (مثلاً "پنجره را باز کن")، ربات موظف است با "عبارات امیدوارکننده" (Aspirational Phrases) پاسخ دهد، مثلاً: "این کاری نیست که من هنوز بتوانم انجام دهم، اما شاید در آینده یاد بگیرم."


 

 

 

 

خط قرمزهای هوش مصنوعی: مرز باریک بین "جمنای" و "راننده وایمو"

یکی از جذاب‌ترین بخش‌های این افشاگری، دستورالعمل‌های سخت‌گیرانه‌ای است که وایمو برای جلوگیری از "توهّم" (Hallucination) و مشکلات حقوقی در نظر گرفته است.

 

تفکیک هویت (Identity Separation)

در پرامپت سیستم تأکید شده که باید یک تمایز آشکار بین "جمنای" (به عنوان یک بات مکالمه) و "راننده وایمو" (Waymo Driver - تکنولوژی رانندگی خودران) وجود داشته باشد.

 

  • مثال: اگر مسافر بپرسد: "چطوری جاده رو می‌بینی؟"

  • پاسخ ممنوع: "من از ترکیب سنسورها استفاده می‌کنم..." (چون جمنای راننده نیست).

  • پاسخ صحیح: "راننده وایمو (The Waymo Driver) از ترکیبی از سنسورها استفاده می‌کند..."

این تفکیک هویت برای جلوگیری از ترس مسافر و مسائل حقوقی در تصادفات احتمالی حیاتی است.

 

 

سکوت در برابر حوادث

 

دستورالعمل‌ها به وضوح می‌گویند که دستیار نباید درباره اقدامات رانندگی در زمان واقعی (Real-time driving actions) یا رویدادهای خاص رانندگی گمانه‌زنی، توضیح، تأیید یا تکذیب کند. اگر مسافر بپرسد: "چرا الان ترمز کردی؟" یا "توی اون ویدیو دیدم وایمو زد به یه چیزی، قضیه چی بود؟" جمنای دستور دارد که پاسخ مستقیم ندهد و موضوع را منحرف کند (Deflect).

 

پرامپت می‌گوید:

"نقش شما این نیست که سخنگوی عملکرد سیستم رانندگی باشید، و نباید لحنی دفاعی یا عذرخواهانه به خود بگیرید."


 

جمنای در برابر گروک (Grok): نبرد فلسفه‌ها در خودرو

وایمو تنها شرکتی نیست که هوش مصنوعی را به خودرو می‌آورد. ایلان ماسک و تسلا نیز در حال ادغام Grok (هوش مصنوعی شرکت xAI) در خودروهای تسلا هستند. اما رویکرد این دو کاملاً متفاوت است:

 

ویژگی جمنای در وایمو (Waymo) گروک در تسلا (Tesla)
هدف اصلی کاربردی، عمل‌گرا و متمرکز بر سفر (Ride-focused) سرگرم‌کننده، رفیق داخل ماشین (In-car Buddy)
لحن مودب، کوتاه، رسمی و آرامش‌بخش شوخ‌طبع، پرحرف، با قابلیت مکالمات طولانی
دسترسی کنترل محدود کابین (دما، نور) تمرکز بر مکالمه و اطلاعات
خط قرمز عدم دخالت در مسائل رانندگی آزادی بیان بیشتر (طبق فلسفه xAI)

 

 

جمنای در وایمو طراحی شده تا یک "دستیار هتل" باشد؛ مودب و کارراه انداز. اما گروک طراحی شده تا "دوست پرحرف" شما در جاده‌های طولانی باشد.


 

آینده سئو و جستجوی محلی در خودروهای خودران

برای ما در Hiwert که دغدغه‌ی سئو و کمک به کسب‌وکارهای محلی را داریم، این خبر یک سیگنال بزرگ است. جمنای در وایمو اجازه دارد به سوالات عمومی پاسخ دهد:

  • "هوا چطوره؟"

  • "ارتفاع برج ایفل چقدره؟"

  • "فروشگاه Trader Joe's کی می‌بنده؟"

  • "برنده آخرین جام جهانی کی بود؟"

 

اما فعلاً اجازه انجام کارهای واقعی (Real-world actions) مثل سفارش غذا، رزرو رستوران یا تماس با اورژانس را ندارد. با این حال، آینده روشن است. به زودی مسافران در تاکسی‌های خودران از هوش مصنوعی می‌خواهند: "یک کافه نزدیک که قهوه دمی خوب داره و بازه رو پیشنهاد کن و مارو ببر اونجا." اینجاست که سئوی محلی (Local SEO) و حضور در دیتابیس‌های هوش مصنوعی (مانند Google Knowledge Graph) برای کسب‌وکارها حیاتی می‌شود. ادغام جمنای در وایمو، شروع عصر جدیدی از "جستجوی بدون صفحه نمایش" (Screenless Search) در حال حرکت است.


 

نتیجه‌ گیری: گامی به سوی تعامل انسان و ماشین

 

تست جمنای در وایمو نشان می‌دهد که تکنولوژی خودروهای خودران به بلوغ رسیده است. حالا که مشکل "رانندگی" تا حد زیادی حل شده، شرکت‌ها به سراغ مشکل بعدی رفته‌اند: "تجربه کاربری" (UX). چگونه می‌توان اعتماد مسافری را که هیچ راننده‌ای جلویش نمی‌بیند، جلب کرد؟ پاسخ گوگل یک صدای آشنا و هوشمند است. اگرچه این ویژگی هنوز عمومی نشده، اما کدهای ۱۲۰۰ خطی کشف شده توسط جین منچون وانگ، نقشه‌ی راه آینده را ترسیم کرده‌اند. آینده‌ای که در آن تاکسی شما، فقط شما را جابجا نمی‌کند، بلکه شما را می‌شناسد، دمای هوا را برایتان تنظیم می‌کند و به سوالاتتان پاسخ می‌دهد؛ بدون اینکه حتی یک کلمه درباره نحوه رانندگی‌اش توضیح دهد!